Bỏ qua, đến nội dung
Skuto

Quyền riêng tư

Những gì tuyệt đối không nên chia sẻ với ChatGPT (và những gì hoàn toàn an toàn)

Đã đăng:

Đừng bao giờ chia sẻ những thứ này với ChatGPT: mật khẩu và mã đăng nhập, số thẻ ngân hàng, số tài khoản, số CCCD hay số hộ chiếu, dữ liệu cá nhân của người khác (khách hàng, bệnh nhân, con cái của bạn), tài liệu công việc bảo mật (hợp đồng, số liệu chưa công bố, mã nguồn nằm trong thỏa thuận bảo mật), và thông tin y tế hay tài chính gắn với danh tính thật của bạn. Còn những thứ hoàn toàn an toàn: câu hỏi chung, bản nháp và ý tưởng, thông tin công khai, và mọi đoạn văn mà bạn đã thay tên thật và số thật bằng tên giả. Đó là toàn bộ quy tắc. Phần còn lại của trang này giải thích tại sao, và cách kiểm tra một đoạn văn cụ thể chỉ trong vài giây.

Những gì bạn gõ vào thực sự đi về đâu

Đây không phải suy đoán, mà được ghi rõ trong tài liệu của OpenAI. Phần hỏi đáp về kiểm soát dữ liệu nêu rằng, với các gói cá nhân, nội dung trò chuyện của bạn có thể được dùng để huấn luyện các mô hình tương lai, trừ khi bạn tắt tùy chọn cải thiện mô hình cho mọi người. Điều này áp dụng cho gói miễn phí, và cả Go, Plus lẫn Pro: trả tiền cho một gói cá nhân không tự động loại bạn khỏi việc thu thập dữ liệu huấn luyện. Tài khoản Business và Enterprise là ngoại lệ: chúng được loại khỏi việc huấn luyện theo mặc định.

Có hai điểm nữa nên biết. Đoạn chat đã xóa được lên lịch xóa vĩnh viễn trong khoảng 30 ngày, nhưng xóa một đoạn chat không xóa được những gì mô hình đã học từ nó. Người soát xét cũng có thể xem một số đoạn chat, ví dụ khi một nội dung bị gắn cờ. Bản thân điều đó không có gì đáng sợ: hệ thống cải thiện theo cách như vậy. Nó chỉ có nghĩa là ô chat không phải một cuốn nhật ký kín. Hãy coi nó như một tấm bưu thiếp, không phải một lá thư dán kín.

Danh sách những thứ không bao giờ nên dán, giải thích cụ thể

Mật khẩu, mã và khóa API. Không có lý do hợp lý nào để chia sẻ chúng với một chatbot. Một khi đã gõ vào, chúng nằm lại trong lịch sử trò chuyện của bạn, ai có quyền vào tài khoản của bạn đều có thể thấy.

Số CCCD, số thẻ và số tài khoản ngân hàng. Đây là miếng mồi ngon cho kẻ trộm danh tính. Nếu bạn cần ChatGPT giúp soạn thư gửi ngân hàng, viết “số tài khoản của tôi” cũng hiệu quả như viết số thật.

Dữ liệu cá nhân của người khác. Đây là lỗi phổ biến nhất. Danh sách khách hàng của bạn, đơn khiếu nại của một người thuê nhà, kết quả xét nghiệm của mẹ bạn: theo Nghị định 13/2023/NĐ-CP, đó là dữ liệu cá nhân thuộc về họ, không phải bạn. Hãy hình dung một chủ nhà hàng dán nguyên email của nhà cung cấp, kèm tên và bảng giá, để nhờ soạn câu trả lời. Tiện thật. Nhưng nhà cung cấp đó chưa bao giờ đồng ý trở thành một phần của tập dữ liệu huấn luyện. Pháp luật Việt Nam quy định rõ: mọi việc xử lý dữ liệu cá nhân đều phải có sự đồng ý của chủ thể dữ liệu.

Tài liệu công việc bảo mật. Hợp đồng, số liệu chưa công bố, bất cứ thứ gì nằm trong thỏa thuận bảo mật: đó là dữ liệu mật, và trên một gói cá nhân, bạn mất quyền kiểm soát ngay khi dán chúng vào. Nhiều doanh nghiệp lớn hạn chế việc dùng chatbot chính vì lý do này.

Thông tin y tế và tài chính gắn với danh tính của bạn. Hỏi “trước khi mổ khớp gối tôi nên trao đổi những điểm gì với bác sĩ?” thì hoàn toàn ổn. Dán nguyên hồ sơ bệnh án có tên bạn trên đó thì không. Hãy mô tả tình huống thay vì chia sẻ tài liệu thật.

Những gì hoàn toàn an toàn

Thật ra là rất nhiều thứ. Câu hỏi chung, động não ý tưởng, giải thích, dịch thuật, nấu ăn, code không thuộc sở hữu riêng, tóm tắt bài báo công khai: tất cả đều ổn. Gần như mọi chủ đề nhạy cảm cũng vậy, miễn là bạn bỏ đi các yếu tố nhận dạng: một thợ điện có thể mô tả “một khách trong chung cư xây thập niên 1980 có đường dây cũ” mà không cần nêu tên hay địa chỉ khách; bạn có thể nhờ soạn một email tế nhị về “anh A. đồng nghiệp của tôi”. Thông tin tạo ra rủi ro hầu như không bao giờ là thông tin mà bạn cần được giúp.

Hai phút để dùng an toàn hơn

Ba thiết lập làm gần hết việc. Thứ nhất, tắt huấn luyện: vào Cài đặt, Kiểm soát dữ liệu, cải thiện mô hình cho mọi người rồi tắt tùy chọn (tên menu đôi khi thay đổi; tìm mục “Kiểm soát dữ liệu” hoặc xem trang trợ giúp của OpenAI nếu tùy chọn đã dời chỗ). Thiết lập này áp dụng cho toàn bộ tài khoản và có thể đổi bất cứ lúc nào. Thứ hai, dùng Trò chuyện tạm thời cho mọi thứ nhạy cảm: các đoạn chat này không dùng để huấn luyện và không lưu vào lịch sử. Thứ ba, nếu bạn không muốn ChatGPT ghi nhớ thông tin về mình từ cuộc trò chuyện này sang cuộc khác, hãy kiểm tra luôn cài đặt Bộ nhớ. Tắt huấn luyện là một thao tác từ chối tham gia rõ ràng: OpenAI xác nhận rằng các đoạn chat mới khi đó sẽ được loại khỏi việc huấn luyện mô hình.

Kiểm tra trước khi dán

Các quy tắc rất dễ quên vào lúc 11 giờ đêm khi deadline cận kề. Vì vậy chúng tôi làm ra công cụ kiểm tra trước khi dán: dán đoạn văn bạn sắp gửi vào đó, công cụ sẽ chỉ ra mật khẩu, số giấy tờ, tên người và những yếu tố rủi ro khác trước khi chúng rời khỏi thiết bị của bạn. Việc kiểm tra diễn ra ngay trong trình duyệt, và chúng tôi không bao giờ thấy nội dung của bạn. Ba mươi giây bây giờ vẫn hơn phải đi giải thích một vụ rò rỉ về sau.

Đọc tiếp

Câu hỏi thường gặp

ChatGPT có dùng đoạn chat của tôi để huấn luyện mô hình không? +

Với các gói cá nhân (Free, Go, Plus và Pro) thì mặc định là có: nội dung trò chuyện của bạn có thể được dùng để huấn luyện các mô hình tương lai, trừ khi bạn tắt tùy chọn cải thiện mô hình cho mọi người. Tài khoản Business và Enterprise được loại khỏi việc huấn luyện theo mặc định.

Dán một email vào ChatGPT có an toàn không? +

Tùy nội dung. Một email không có tên, số tài khoản hay chi tiết nhạy cảm thì hoàn toàn ổn. Một email chứa tên khách hàng, giá cả, địa chỉ hay bất kỳ thông tin mật nào thì nên xóa các phần đó trước, hoặc kiểm tra bằng công cụ trước khi dán.

Khi tôi xóa một đoạn chat thì điều gì xảy ra? +

Đoạn chat đã xóa biến mất ngay khỏi lịch sử của bạn và được lên lịch xóa vĩnh viễn khỏi hệ thống OpenAI, thường trong vòng 30 ngày, trừ khi luật yêu cầu lưu lâu hơn. Việc xóa không hủy được phần huấn luyện có thể đã thực hiện từ đoạn chat đó.

Tôi có được chia sẻ dữ liệu về người khác với ChatGPT không? +

Không, trừ khi họ chắc chắn sẽ đồng ý. Theo Nghị định 13/2023/NĐ-CP, tên, số liên lạc và thông tin cá nhân của người khác thuộc về họ: dán vào chatbot là một hành vi xử lý dữ liệu mà họ chưa đồng ý. Mọi việc xử lý dữ liệu cá nhân đều cần sự đồng ý hợp lệ của chủ thể dữ liệu.

Đã tắt huấn luyện rồi thì tôi dán gì cũng được phải không? +

Tắt huấn luyện giúp ích, nhưng đoạn chat vẫn nằm trong lịch sử tài khoản và người soát xét có thể xem trong một số trường hợp. Mật khẩu, số thẻ, số CCCD và dữ liệu của người khác thì vẫn không nên dán, dù bạn đã tắt huấn luyện.