Giải thích về nhúng văn bản: Cách AI hiểu các từ
dài quá đọc không nổi
Các mô hình ngôn ngữ lớn.
Chắc hẳn bạn đã từng nghe những từ này trước đây. Chúng đại diện cho một loại thuật toán dựa trên máy học cụ thể hiểu và có thể tạo ra ngôn ngữ, một lĩnh vực thường được gọi là xử lý ngôn ngữ tự nhiên hoặc NLP.
Bạn chắc chắn đã nghe nói về mô hình ngôn ngữ mạnh mẽ và nổi tiếng nhất: GPT-3.
GPT-3, như tôi đã mô tả trong video về nó, có thể nhận ngôn ngữ, hiểu ngôn ngữ đó và đổi lại tạo ra ngôn ngữ. Nhưng hãy cẩn thận ở đây; nó không thực sự hiểu nó. Trên thực tế, nó còn lâu mới hiểu được. GPT-3 và các mô hình dựa trên ngôn ngữ khác chỉ sử dụng cái mà chúng tôi gọi là từ điển từ để biểu thị chúng dưới dạng số, ghi nhớ vị trí của chúng trong câu và chỉ có thế.
Hãy đi sâu vào các mô hình máy học mạnh mẽ đó và cố gắng hiểu những gì chúng nhìn thấy thay vì các từ, được gọi là nhúng từ và cách tạo ra chúng bằng một ví dụ do Cohere cung cấp.