Thuật ngữ
Công cụ phát hiện AI
Công cụ phát hiện AI là phần mềm tự nhận biết được một đoạn văn hay hình ảnh có phải do AI tạo ra hay không. Sự thật là chúng sai rất nhiều theo cả hai hướng và không thể chứng minh ai là tác giả. Hãy xem điểm số của chúng như một gợi ý, đừng bao giờ coi là bằng chứng.
Bạn dán một bài luận vào công cụ phát hiện và nó trả về kết quả kiểu “87% khả năng do AI viết”. Con số đó trông rất khoa học. Nhưng không phải vậy. Các công cụ này chỉ đoán dựa trên các đặc điểm thống kê, mà văn bản AI lại được tối ưu để trông giống văn bản người viết, nên những đặc điểm đó cứ mờ dần đi.
Sai sót xảy ra theo cả hai hướng. Văn bản AI chỉnh sửa nhẹ một chút là qua mặt được, bị chấm là người viết. Trong khi đó người thật lại bị gắn cờ oan, nhất là người không dùng tiếng Anh bản ngữ và người có lối viết đều đặn. Chính OpenAI đã đóng cửa công cụ phát hiện văn bản của họ từ năm 2023 vì độ chính xác thấp, điều đó nói lên nhiều thứ. Đã có sinh viên bị nghi ngờ gian lận vì kết quả dương tính giả. Đó mới là tác hại thật khi coi điểm số này là bằng chứng.
Vậy cách nào hiệu quả hơn? Với hình ảnh, nhãn nguồn gốc (như content credentials theo chuẩn C2PA) đáng tin hơn việc đoán mò sau khi ảnh đã xong. Với văn bản, trò chuyện trực tiếp mới là cách hay: người thật sự viết ra một bài thì có thể trao đổi sâu về nó. Nếu bạn vẫn muốn dùng công cụ phát hiện, hãy coi nó là một tín hiệu yếu trong nhiều tín hiệu, đừng bao giờ lấy nó làm phán quyết cuối cùng.
Bạn gặp thuật ngữ này ở đâu
- GPTZero, cờ phát hiện AI của Turnitin, Copyleaks và các công cụ tương tự trong trường học và quy trình biên tập.
- Nhãn “do AI tạo” trên các nền tảng mạng xã hội, ngày càng dựa vào đóng dấu chìm nhúng sẵn trong ảnh, vốn đáng tin hơn các công cụ dò văn bản.
- Khi bạn lo về quyền riêng tư và muốn biết AI có dùng dữ liệu của bạn để huấn luyện không.