tác giả:
(1) Kexun Zhang, UC Santa Barbara và đóng góp bình đẳng;
(2) Hongqiao Chen, Trường Trung học Northwood và đóng góp bình đẳng;
(3) Lei Li, Đại học Carnegie Mellon;
(4) William Yang Wang, UC Santa Barbara.
Tinh chỉnh mô hình ngôn ngữ để sử dụng các công cụ. Các mô hình ngôn ngữ có thể được tinh chỉnh để sử dụng các công cụ có dữ liệu chứa văn bản xen kẽ và cách sử dụng công cụ. Các nghiên cứu trước đây làm cho các mô hình ngôn ngữ sử dụng một công cụ duy nhất như mô-đun truy xuất (Borgeaud và cộng sự, 2022; Guu và cộng sự, 2020) hoặc công cụ tìm kiếm (Nakano và cộng sự, 2021) bằng cách tinh chỉnh. Những tiến bộ gần đây trong các mô hình ngôn ngữ được tăng cường bằng công cụ sử dụng nhiều công cụ (Schick và cộng sự, 2023; Parisi và cộng sự, 2022) cũng tinh chỉnh các mô hình ngôn ngữ để sử dụng các công cụ bao gồm mô hình QA, mô hình dịch thuật, máy tính và công cụ tìm kiếm. ToolkenGPT (Hao và cộng sự, 2023) đề xuất sử dụng một số mã thông báo đặc biệt để đại diện cho các công cụ và chỉ điều chỉnh phần nhúng của mã thông báo để việc áp dụng công cụ mới có thể hiệu quả hơn. Tuy nhiên, các phương pháp tinh chỉnh để sử dụng công cụ vẫn cần dữ liệu mới và tinh chỉnh thêm để điều chỉnh mô hình cho phù hợp với các công cụ mới. Chúng tôi liệt kê những khác biệt giữa giải mã trạng thái hữu hạn và hai mô hình trước đó trong Bảng 1.
Học tập trong ngữ cảnh để sử dụng công cụ. Các mô hình ngôn ngữ có thể học từ các ví dụ trong ngữ cảnh (Brown và cộng sự, 2020) và làm theo hướng dẫn (Ouyang và cộng sự, 2022). Điều này giúp bạn có thể chỉ cần đưa mô tả về các công cụ vào lời nhắc và yêu cầu các mô hình ngôn ngữ sử dụng chúng. Các công trình gần đây đã tận dụng khả năng này để sử dụng các mô hình thần kinh (Shen và cộng sự, 2023), API RESTful (Qin và cộng sự, 2023; Song và cộng sự, 2023), trình thông dịch chương trình (Chen và cộng sự, 2022; Gao và cộng sự ., 2023) và nhiều công cụ khác để giải quyết vấn đề. Học tập trong ngữ cảnh không cần điều chỉnh thêm mô hình để sử dụng các công cụ mới. Tuy nhiên, mô tả và tài liệu về các công cụ mới vẫn cần phải kịp thời, điều này làm tăng chi phí tính toán và hạn chế ngân sách ngữ cảnh để mô hình thực sự suy luận về nhiệm vụ.
Giải mã ràng buộc và máy trạng thái hữu hạn. Các phương pháp giải mã ràng buộc trước đây chủ yếu tập trung vào các ràng buộc từ vựng (Anderson và cộng sự, 2017). Chúng giảm không gian tìm kiếm lớn của việc giải mã bị ràng buộc về mặt từ vựng với các máy trạng thái hữu hạn (Anderson và cộng sự, 2017), nhóm các ứng cử viên tương tự lại với nhau (Hokamp & Liu, 2017) và các thuật toán tìm kiếm tốt hơn (Miao và cộng sự, 2019; Lu và cộng sự, 2021; Tuy nhiên, các ràng buộc từ vựng không đủ biểu cảm để điều chỉnh các lệnh gọi công cụ. Trong khi các máy trạng thái hữu hạn phải có trọng số và xác suất để giải quyết các ràng buộc mềm trong ngôn ngữ tự nhiên (Eisner, 2002; Rastogi và cộng sự, 2016), thì các ràng buộc đối với lệnh gọi công cụ cú pháp là các ràng buộc cứng, dễ dàng hơn nhiều đối với FSM. Do đó, chúng tôi đề xuất TOOLDEC đáp ứng các ràng buộc về cú pháp của lệnh gọi công cụ hợp lệ.
Bài viết này có sẵn trên arxiv theo giấy phép CC 4.0 DEED.