Thuật ngữ
RAG
RAG (retrieval-augmented generation) là khi AI tra cứu trong một nguồn đáng tin (tài liệu của bạn, cơ sở dữ liệu, web) trước, rồi mới viết câu trả lời từ những gì tìm được. Cách này giảm ảo giác và giữ câu trả lời luôn cập nhật.
Một LLM khi đứng một mình sẽ trả lời theo trí nhớ: tất cả những gì nó hấp thụ trong lúc huấn luyện, đóng băng tại một thời điểm nào đó trong quá khứ. RAG thêm vào một bước “mở sách”: trước khi trả lời, hệ thống tìm đúng những trang liên quan trong một nguồn bạn chọn, rồi đưa chúng cho mô hình cùng với câu hỏi của bạn.
Hãy hình dung một dược sĩ. Khi được hỏi về một tương tác thuốc hiếm gặp, người giỏi sẽ không đọc thuộc lòng. Họ mở cơ sở dữ liệu chính thức ra, đọc, rồi mới trả lời. Vẫn năng lực đó, nhưng dựa trên một nguồn luôn cập nhật và có thể kiểm chứng.
Với bạn, điều này mang lại hai lợi ích. Câu trả lời có thể trích dẫn những tài liệu mà mô hình chưa từng thấy lúc huấn luyện (hợp đồng của bạn, tin tức hôm nay, sổ tay sản phẩm). Và ảo giác AI giảm đi rõ rệt, dù không biến mất hoàn toàn: mô hình vẫn có thể đọc sai chính thứ nó vừa tìm được, nên các đường dẫn nguồn vẫn là người bạn của bạn.
Bạn gặp thuật ngữ này ở đâu
- Mỗi lần một trợ lý báo “đang tìm trên web…” trước khi trả lời: đó chính là RAG.
- Các “project” trong ChatGPT và Claude trả lời dựa trên tệp bạn tải lên.
- Copilot trả lời dựa trên SharePoint của công ty bạn, hay NotebookLM làm việc trên các nguồn bạn đưa vào.
- Chatbot chăm sóc khách hàng trích đúng chính sách đổi trả thật, thay vì bịa ra.