Thuật ngữ
LLM (mô hình ngôn ngữ lớn)
LLM (mô hình ngôn ngữ lớn) là bộ máy đứng sau các công cụ như ChatGPT: một chương trình được huấn luyện trên lượng văn bản khổng lồ để đoán từ tiếp theo, nhờ đó nó viết, tóm tắt, dịch và trả lời câu hỏi.
Một LLM học ngôn ngữ theo cách không ai từng học: đọc nhiều văn bản hơn cả một người đọc trong nghìn kiếp người, rồi trở nên cực kỳ giỏi việc đoán từ kế tiếp. Nghe đơn giản đến mức tưởng vô dụng, nhưng đoán từ tiếp theo đủ chuẩn thì bạn đã có thể soạn email, giải thích hợp đồng hay dịch thực đơn.
Hãy tưởng tượng một bà nội đã đọc hết mọi cuốn sách nấu ăn từng in ra. Bạn hỏi món tối hôm nay, bà liền ứng biến ra một món hợp lý, dù chẳng cuốn sách nào ghi đúng công thức đó. LLM cũng vậy: không phải một kho chứa sẵn đáp án, mà là một cỗ máy nhận diện quy luật, tự ghép ra văn bản mới từ tất cả những gì nó đã hấp thụ trong dữ liệu huấn luyện.
Điểm cần lưu ý: một cỗ máy đoán giỏi đôi khi sai một cách rất tự tin. Đó gọi là ảo giác AI, và đó là lý do bạn luôn phải kiểm chứng những thông tin quan trọng.
Bạn gặp thuật ngữ này ở đâu
- Bạn hiếm khi tiếp xúc trực tiếp với một LLM; bạn dùng các sản phẩm xây trên nó. ChatGPT chạy trên các mô hình GPT của OpenAI, Claude chạy trên mô hình của Anthropic, Gemini chạy trên mô hình của Google.
- Bạn sẽ thấy tên mô hình trong menu chọn mô hình của từng ứng dụng.
- Việc cân nhắc nên chọn cái nào là điều mà công cụ chọn AI của chúng tôi giúp bạn.