Bỏ qua, đến nội dung
Skuto

Thuật ngữ

Ẩn danh hóa dữ liệu

Ẩn danh hóa là loại bỏ mọi thông tin có thể nhận diện một người, để dữ liệu không còn là dữ liệu cá nhân. Trong AI, đó là thói quen đơn giản: thay tên, email, số thật bằng ký hiệu trước khi dán vào chatbot.

Dữ liệu đã ẩn danh thì không thể lần ngược về một con người: bạn không thể, người khác cũng không, kể cả khi ghép thêm nguồn khác. Đó là một ngưỡng rất cao. Theo Nghị định 13/2023/NĐ-CP về bảo vệ dữ liệu cá nhân, dữ liệu chỉ thực sự thoát khỏi diện điều chỉnh khi việc nhận diện lại không còn khả thi một cách hợp lý. Người anh em nhẹ hơn của nó là bút danh hóa, tức thay tên bằng mã trong khi vẫn còn một khóa giải mã ở đâu đó, và phần này vẫn được coi là dữ liệu cá nhân.

Bạn không cần thuộc lòng các điều khoản pháp lý mới dùng được ý tưởng này. Phiên bản đời thường chỉ tốn ba mươi giây. Một chủ quán muốn nhờ AI soạn câu trả lời cho một đánh giá khó trên Google Maps. Thay vì dán “Nguyễn Thị Lan, lan.nguyen@gmail.com, đặt bàn ngày 3 tháng 6”, chị viết “một khách hàng, [EMAIL], đặt bàn tuần trước”. Câu trả lời của chatbot vẫn tốt y như vậy (nó vốn chẳng cần chi tiết thật), mà không có thông tin nhận diện nào rời khỏi máy của chị.

Mẹo đó bao quát hầu hết tình huống: tên thành vai trò (“nhà cung cấp của tôi”, “một bệnh nhân”), số thành [SỐ ĐIỆN THOẠI] hoặc [SỐ TÀI KHOẢN], địa chỉ thành “địa chỉ của khách”. Trước khi dán thứ gì bạn còn phân vân, hãy đưa qua công cụ kiểm tra trước khi dán để xem chỗ nào rủi ro.

Bạn gặp thuật ngữ này ở đâu

  • Hướng dẫn của Bộ Công an (A05) và quy định trong Nghị định 13/2023/NĐ-CP về chuẩn ẩn danh hóa dữ liệu
  • Công cụ AI cho doanh nghiệp có tính năng tự động che hoặc xóa thông tin trong văn bản dán vào
  • Chính sách quyền riêng tư giải thích khi nào dữ liệu được “ẩn danh hoặc tổng hợp”

Bắt tay vào dùng

← Quay lại trang thuật ngữ