paint-brush
Ước tính các vectơ xác suất cảm xúc bằng cách sử dụng LLM: Tóm tắt và giới thiệutừ tác giả@textmodels
261 lượt đọc

Ước tính các vectơ xác suất cảm xúc bằng cách sử dụng LLM: Tóm tắt và giới thiệu

từ tác giả Writings, Papers and Blogs on Text Models3m2024/05/10
Read on Terminal Reader

dài quá đọc không nổi

Bài viết này cho thấy cách LLM (Mô hình ngôn ngữ lớn) [5, 2] có thể được sử dụng để ước tính bản tóm tắt trạng thái cảm xúc liên quan đến một đoạn văn bản.
featured image - Ước tính các vectơ xác suất cảm xúc bằng cách sử dụng LLM: Tóm tắt và giới thiệu
Writings, Papers and Blogs on Text Models HackerNoon profile picture
0-item

Bài viết này có sẵn trên arxiv theo giấy phép CC 4.0.

tác giả:

(1) D.Sinclair, Imense Ltd và email: [email protected];

(2) WTPye, Đại học Warwick và email: [email protected].

Bảng liên kết

trừu tượng

Bài viết này cho thấy cách sử dụng LLM (Mô hình ngôn ngữ lớn) [5, 2] để ước tính bản tóm tắt trạng thái cảm xúc liên quan đến đoạn văn bản. Tóm tắt trạng thái cảm xúc là một từ điển các từ dùng để mô tả cảm xúc kèm theo xác suất từ đó xuất hiện sau một gợi ý bao gồm văn bản gốc và một đoạn đuôi gợi cảm xúc. Thông qua phân tích cảm xúc trong các bài đánh giá sản phẩm trên Amazon, chúng tôi chứng minh rằng bộ mô tả cảm xúc có thể được ánh xạ vào không gian loại PCA. Người ta hy vọng rằng các mô tả văn bản về các hành động nhằm cải thiện trạng thái được mô tả trong văn bản hiện tại cũng có thể được gợi ra thông qua dấu nhắc ở đuôi. Thử nghiệm dường như chỉ ra rằng việc này không hề đơn giản để thực hiện. Thất bại này đặt hy vọng của chúng ta vào việc lựa chọn hành động thông qua việc chọn kết quả được dự đoán tốt nhất thông qua việc so sánh các phản ứng cảm xúc ngoài tầm với vào lúc này.


Từ khóa: ý thức tổng hợp, vector cảm xúc, từ điển cảm xúc, vector xác suất cảm xúc

1. Giới thiệu

Hành vi của con người nhất thiết phải bị chi phối bởi cảm xúc [3]. Thông tin được cảm nhận về thế giới xung quanh chúng ta phải phù hợp với trạng thái bên trong của chúng ta và bất kỳ hành động nào được thực hiện đều được chọn để dẫn đến trạng thái tương lai có vẻ thích hợp hơn trạng thái hiện tại của chúng ta [4], trong đó thích hợp hơn có nghĩa là 'cảm giác của tôi là tôi sẽ muốn thử trạng thái mới hoặc hành động có thể dẫn đến trạng thái mới'. Nếu đói chúng ta thường sẽ chọn ăn. Nếu chúng ta rất đói, chúng ta sẽ gặp nhiều rủi ro hơn để có được thức ăn. Nếu chúng ta lạnh, chúng ta sẽ cố gắng sưởi ấm, v.v. Quảng cáo nhằm mục đích thuyết phục chúng ta rằng một hành động sẽ dẫn đến hạnh phúc hơn. Đồ uống có ga có đường không dẫn đến hạnh phúc lâu dài một cách khách quan nhưng phản ứng cảm xúc ngắn hạn được biết đến khi ăn đường là điều đáng mong đợi. Dữ liệu được cảm nhận về thế giới rất đa dạng, thường không chính xác, không đầy đủ và các phản hồi bắt buộc có mức độ khẩn cấp khác nhau. Công cụ trọng tài xử lý những thông tin đầu vào này cần phải đối phó một cách tự nhiên với sự mơ hồ trong khi vẫn tỏ ra mang lại sự chắc chắn trong nội bộ. Cảm xúc là thuật ngữ chúng ta sử dụng để mô tả trải nghiệm của mình khi sử dụng bộ máy này để đưa ra quyết định. Cụm từ máy tính không có cảm xúc thường bị sử dụng sai để khẳng định rằng phần mềm máy tính tương tác chạy trên máy không bao giờ có thể biểu hiện hoặc trải nghiệm cảm xúc. Mô hình ngôn ngữ lớn (LLM) [5, 1, 2] cung cấp một phương tiện sẵn sàng để liên kết một đoạn văn bản với trạng thái cảm xúc ước tính, thu hẹp khoảng cách giữa thế giới văn bản và lĩnh vực cảm xúc của con người. LLM đã được sử dụng trong phân tích tình cảm tập trung và được báo cáo là hoạt động đầy đủ [6] nhưng tại thời điểm viết bài, chúng tôi không biết các nhà nghiên cứu khác đang sử dụng từ điển cảm xúc xác suất.


Bài viết này khám phá sự giao thoa giữa LLM và cảm xúc, chứng minh cách khai thác những mô hình này để ước tính nội dung cảm xúc của một đoạn văn bản. Chúng tôi trình bày một cách tiếp cận mới để tóm tắt các trạng thái cảm xúc bằng cách xây dựng một từ điển các từ liên quan đến cảm xúc và tính toán xác suất của những từ này xuất hiện theo lời nhắc bao gồm cả văn bản gốc và phần đuôi khơi gợi cảm xúc. Phương pháp này cho phép chúng ta đánh giá một cách định lượng bối cảnh cảm xúc của văn bản.


Để chứng minh cách tiếp cận của mình, chúng tôi chọn một từ điển gồm 271 từ mô tả cảm xúc và ước tính khả năng chúng được liên kết với các phần đánh giá sản phẩm trên Amazon. Nguồn lực tính toán và thời gian hạn chế có nghĩa là chúng tôi chỉ có thể xuất bản một nghiên cứu sơ lược. Có khả năng là nhiều cảm xúc có mối tương quan với nhau và việc ước tính kích thước của không gian cảm xúc có thể được rút ra thông qua phân tích PCA trên một mẫu lớn các vectơ cảm xúc.


Chúng tôi thảo luận về một số hạn chế mà chúng tôi gặp phải trong quá trình thử nghiệm và một số trở ngại trong việc tạo ra và điều chỉnh hành vi của ý thức tổng hợp dựa trên cảm xúc.


Bài viết này được trình bày như sau, phần 2 trình bày chi tiết về LLM và phần cứng được sử dụng để chạy nó, phần 2.1 trình bày chi tiết các lựa chọn từ ngữ để tạo nên từ điển cảm xúc của chúng ta, phần 2.1.1 đề cập đến việc ước tính xác suất cảm xúc từ LLM bằng cách sử dụng dấu nhắc ở đuôi. Phần 2.1.2 hiển thị kết quả về các đánh giá trên Amazon. Gợi ý về cấu trúc PCA với các vectơ cảm xúc được đưa ra ở phần 3. Cuối cùng, các hướng đi trong tương lai sẽ được xem xét và đưa ra kết luận.