Thuật ngữ
Mô hình open-weights
Mô hình open-weights là mô hình AI có phần «bộ não» đã huấn luyện được công bố để ai cũng tải về, chạy và tùy chỉnh, như Llama của Meta hay các mô hình Mistral. Ngược với mô hình đóng như GPT hay Claude, vốn bạn chỉ dùng được qua dịch vụ.
“Weights” (trọng số) là hàng tỷ con số mà mô hình học được trong quá trình huấn luyện: chính là bộ não. Các mô hình đóng (GPT của OpenAI, Claude của Anthropic, Gemini của Google) giữ bộ não trên máy chủ của họ: bạn thuê câu trả lời. Mô hình open-weights thì công bố luôn cả file: bạn tải về, chạy trên máy của mình, tinh chỉnh nó, không cần xin phép ai.
Hình dung như sự khác nhau giữa một nhà hàng và một công thức nấu ăn được in ra. Nhà hàng có thể nấu ngon hơn, nhưng công thức là của bạn: bạn nấu ở nhà, đổi nguyên liệu, và không ai thấy bạn đang làm gì.
Điểm cuối đó mới là phần quan trọng nhất trong thực tế: một mô hình open-weights chạy ngay trên máy bạn (local) không gửi gì đi đâu cả, rất có ý nghĩa với công việc liên quan tới dữ liệu mật. Nói thật về mặt đánh đổi: các mô hình đóng mạnh nhất vẫn dẫn đầu ở phân khúc cao cấp (khoảng cách đang thu hẹp dần, còn Llama, Mistral, DeepSeek và Qwen thì đều rất đáng nể), và để chạy tốt các mô hình lớn thì cần phần cứng kha khá. Lưu ý “open weights” không hẳn là “mã nguồn mở”: giấy phép mỗi nơi mỗi khác, và dữ liệu huấn luyện thường vẫn được giữ kín.
Bạn gặp thuật ngữ này ở đâu
- Các công cụ như Ollama và LM Studio giúp chạy mô hình ngay trên laptop của bạn.
- Hugging Face, kho tải mô hình lớn nhất, nơi cộng đồng chia sẻ open-weights.
- Các mô hình Mistral, ví dụ tiêu biểu đến từ châu Âu.
- Mô hình local có hợp với tình huống của bạn hay không là một phần mà công cụ chọn AI của chúng tôi cân nhắc giúp.