paint-brush
Kỹ thuật nhanh 101 - II: Làm chủ chế tạo nhanh với các kỹ thuật nâng caotừ tác giả@eviotti
12,921 lượt đọc
12,921 lượt đọc

Kỹ thuật nhanh 101 - II: Làm chủ chế tạo nhanh với các kỹ thuật nâng cao

từ tác giả Emiliano Viotti32m2023/06/24
Read on Terminal Reader

dài quá đọc không nổi

Prompt Engineering 101 là một chuỗi blog được thiết kế tỉ mỉ để giải nén các nguyên tắc và kỹ thuật của Prompt Engineering. Nó bao gồm mọi thứ, từ khái niệm cơ bản đến kỹ thuật nâng cao và mẹo của chuyên gia, bao gồm nhiều mô hình khác nhau từ ChatGPT đến Khuếch tán ổn định và Giữa hành trình. Trong bài đăng thứ hai của loạt bài này, chúng tôi đi sâu vào các kỹ thuật nâng cao như Chuỗi suy nghĩ và Tính nhất quán của bản thân, để thành thạo việc tạo nhanh.
featured image - Kỹ thuật nhanh 101 - II: Làm chủ chế tạo nhanh với các kỹ thuật nâng cao
Emiliano Viotti HackerNoon profile picture
0-item
1-item
2-item

Hình ảnh bìa có Macintosh 128K , một máy tính cá nhân được giới thiệu bởi Apple Inc. vào năm 1984 đã thay đổi ngành công nghiệp máy tính. Nó tích hợp bộ xử lý Motorola 68000 32-bit mang tính biểu tượng, RAM 128 KB và màn hình tích hợp đen trắng khiêm tốn.


Hơn nữa, nó tích hợp những phát minh công nghệ tuyệt vời trực tiếp từ Xerox PARC : con chuột và giao diện người dùng đồ họa đầu tiên trong lớp của cô ấy (bà ngoại của GUI hiện tại).


Với hơn 70.000 chiếc được bán ra, Macintosh đóng vai trò then chốt trong thành công của Apple . Một sự thật gây tò mò, sự kiện ra mắt thậm chí còn thành công hơn cả bản thân Mac. Với ngân sách 1,5 triệu đô la Mỹ, Ridley Scott nổi tiếng đã đạo diễn một quảng cáo truyền hình ám chỉ rõ ràng đến cuốn tiểu thuyết mang tính biểu tượng của Orwell Một chín tám tư đã trở thành một kiệt tác và sự kiện đầu nguồn.


Gần bốn mươi năm sau, không có đạo diễn phim nổi tiếng hay quảng cáo truyền hình, chỉ một ứng dụng web đơn giản, OpenAI đã sử dụng Mô hình ngôn ngữ thử nghiệm và mở rộng ra thế giới. Phần còn lại của câu chuyện nằm trong tiêu đề: ChatGPT đạt 100 triệu người dùng hoạt động hàng tháng vào ngày 23 tháng 1, chỉ hai tháng sau khi ra mắt, khiến nó trở thành ứng dụng tiêu dùng phát triển nhanh nhất trong lịch sử (nhanh hơn cả TikTok và Instagram).


Giờ đây, sự chú ý của thế giới đang đổ dồn vào ngành công nghiệp AI và với những tiến bộ diễn ra hàng tuần, năm nay hứa hẹn sẽ là một thời điểm quan trọng đối với lĩnh vực này. Điều tuyệt vời nhất là bạn vẫn đến đúng giờ để tham gia lĩnh vực AI và là một phần của thời khắc cách mạng này trong lịch sử nhân loại.


Prompt Engineering 101 là một loạt bài đăng được thiết kế và viết để tiết lộ các nguyên tắc và kỹ thuật của kỹ thuật nhanh, nghệ thuật tạo ra các văn bản rõ ràng và hiệu quả, để nhắc các mô hình ngôn ngữ và nhận được chính xác những gì bạn đang tìm kiếm. Loạt bài này đề cập đến kỹ thuật nhanh chóng cho nhiều loại mô hình tổng quát, bao gồm ChatGPT và các mô hình chuyển văn bản thành văn bản khác. Đồng thời khám phá các mô hình chuyển văn bản thành hình ảnh như Khuếch tán ổn định hoặc Giữa hành trình, đồng thời tìm hiểu các khía cạnh bổ sung của LLM chẳng hạn như ảo giác, các vấn đề về quyền riêng tư và bảo mật, v.v...


Đây là bài đăng số 2 của loạt bài này, nơi chúng tôi sẽ đề cập đến các kỹ thuật nâng cao như Chuỗi suy nghĩ và Tính nhất quán của bản thân, để thành thạo việc tạo nhanh. Tôi hy vọng bạn thích nó!

Mục lục

  1. Tóm tắt về Kỹ thuật nhanh chóng
  2. Gợi ý theo chuỗi suy nghĩ
  3. Xâu chuỗi lời nhắc
  4. Phương pháp tự nhất quán
  5. Vai trò nhắc nhở
  6. Mất mã thông báo
  7. Năm mẹo & công cụ để thành thạo chế tạo nhanh

Tóm tắt về Kỹ thuật nhanh chóng

Trong phần đầu tiên của loạt bài về Kỹ thuật nhanh chóng này, chúng ta đã đi sâu vào những trực giác của nghệ thuật này và đạt được một định nghĩa chính thức. Về cơ bản, Kỹ thuật Nhắc là một quá trình lặp đi lặp lại nhằm thiết kế và tối ưu hóa các lời nhắc rõ ràng và cụ thể cho Mô hình Ngôn ngữ Lớn để đảm bảo rằng nó tạo ra các phản hồi có liên quan, chính xác và mạch lạc.


Tiếp theo, chúng tôi đã kiểm tra ba nguyên tắc để tạo ra lời nhắc hiệu quả. Chúng tôi đã chứng minh rằng các mô hình tạo ra phản hồi tốt hơn khi được hướng dẫn rõ ràng và cụ thể (nguyên tắc đầu tiên) và thảo luận về một số chiến thuật để đạt được điều này. Sau đó, chúng tôi xác định rằng các LLM được hưởng lợi từ thời gian tính toán và đề cập đến một số chiến thuật để buộc các mô hình phải suy luận trước khi vội vã đưa ra kết luận (nguyên tắc thứ hai). Cuối cùng, chúng tôi đã nghiên cứu sự cân bằng giữa tính đặc hiệu và tính sáng tạo (nguyên tắc thứ ba), thử nghiệm các thông số Nhiệt độ và Top P để khám phá sự đánh đổi này.


Bạn có thể đọc định nghĩa sâu hơn về Kỹ thuật nhanh chóng và các nguyên tắc cơ bản trong liên kết bên dưới (bao gồm rất nhiều ví dụ nhanh chóng!!).


Gợi ý theo chuỗi suy nghĩ

Các LLM quy mô lớn như GPT-3 hoặc PaLM đã thể hiện khả năng hiểu ngôn ngữ tự nhiên ấn tượng và được chứng minh là cực kỳ hiệu quả trong các nhiệm vụ như trích xuất thông tin từ văn bản và tạo phản hồi theo phong cách nhất quán của con người. Mặc dù vậy, LLM đã chứng tỏ là khá mạnh mẽ khi thực hiện các nhiệm vụ không xác định khi một vài ví dụ về cảnh quay được đưa vào lời nhắc. Kỹ thuật này, đượcBrown và cộng sự phổ biến dưới dạng nhắc nhở vài lần. (2020) , được thử nghiệm để tăng hiệu suất mô hình trên một số điểm chuẩn. Chưa kể nó tiết kiệm tiền và thời gian trong việc tinh chỉnh mô hình sang một miền cụ thể mới.


Tuy nhiên, các nghiên cứu đã chứng minh rằng các mô hình như thế này đột ngột giảm hiệu suất đối với các nhiệm vụ suy luận thông thường hoặc các câu đố toán học. Mặc dù có khả năng trích dẫn toàn bộ bài thơ sử thi Hy Lạp cổ đại The Odyssey, những người mẫu này phải vật lộn với các vấn đề cơ bản của trường học về logic và toán học.





Vậy chúng ta có những lựa chọn nào? Chúng tôi có gửi GPT-3 trong một mùa đến trường tiểu học không? May mắn thay, có một giải pháp thay thế rẻ hơn và ít gây lúng túng hơn. Bạn có thể tưởng tượng việc thuyết phục hiệu trưởng trường tiểu học địa phương của bạn chấp nhận ChatGPT vào giữa học kỳ không?


Tương tự như cách con người tiếp cận các vấn đề phức tạp bằng cách chia nhỏ chúng thành các vấn đề phụ đơn giản hơn và tuân theo một dòng suy luận logic, chúng ta có thể hướng dẫn Mô hình ngôn ngữ làm điều tương tự. Cách tiếp cận này đã được khám phá bởi Wei J et al. trong Chuỗi suy nghĩ Gợi mở suy luận trong các mô hình ngôn ngữ lớn (2022) . Nó đã chứng minh kết quả ấn tượng trên một số điểm chuẩn, xác nhận Chuỗi suy nghĩ (CoT) là một cách tiếp cận vững chắc để cải thiện hiệu suất của LLM trong các nhiệm vụ lý luận thông thường.


Trong hình bên dưới (lấy từ bài báo của Wei J), một mô hình LLM vội vàng đưa ra kết luận sai khi tính toán số táo còn lại trong một quán ăn tự phục vụ. Điều này xảy ra ngay cả khi một vấn đề suy luận tương tự sử dụng quả bóng quần vợt được cung cấp như một phần của ngữ cảnh.

Tuy nhiên, khi quy trình từng bước để giải quyết vấn đề được đưa vào bối cảnh (CoT), mô hình có thể đưa ra giải pháp hợp lệ một cách chính xác.



Lời nhắc theo chuỗi suy nghĩ cho phép các mô hình ngôn ngữ lớn giải quyết các nhiệm vụ lý luận số học, thông thường và ký hiệu phức tạp. Các quy trình lập luận theo chuỗi suy nghĩ được làm nổi bật


Với sự nhắc nhở của chuỗi suy nghĩ, các mô hình ngôn ngữ có đủ tỷ lệ (~100B tham số) có thể:

  1. Phân tách các vấn đề gồm nhiều bước thành các bước trung gian, có nghĩa là tính toán bổ sung có thể được phân bổ cho các vấn đề đòi hỏi nhiều bước lập luận hơn.
  2. Cung cấp một cửa sổ có thể hiểu được về hành vi của mô hình, gợi ý cách nó có thể đi đến một câu trả lời cụ thể và cung cấp cơ hội để gỡ lỗi khi đường dẫn lý luận bị sai.
  3. Mở rộng lĩnh vực ứng dụng sang các bài toán đố, suy luận thông thường và thao tác tượng trưng.


Phương pháp này có thể được sử dụng để cung cấp các ví dụ lý luận cho mô hình (ít ảnh) hoặc không có ví dụ (không ảnh). Hãy xem cả hai hương vị trong thực tế với một ví dụ ứng dụng thực tế.

1. Chuỗi suy nghĩ Zero-Shot

Hãy tưởng tượng chúng ta đang phát triển một ứng dụng mua sắm mới cho Walmart, với tính năng đột phá là so sánh và chọn sản phẩm bạn nên mua dựa trên giá cả và thuộc tính của các sản phẩm thay thế của các thương hiệu khác nhau.


Để minh họa vấn đề, chúng ta hãy tập trung vào danh sách rút gọn tất cả các tùy chọn trong Xà phòng thanh mà Walmart có trong các cửa hàng của mình. Như bạn có thể thấy, chúng tôi có các gói từ 1 thanh đến 14 thanh và nhiều nhãn hiệu và giá cả (từ tùy chọn rẻ đến tùy chọn đắt tiền).


Sản phẩm 🛒

 --- Dove Men+Care 8 bars pack $ 9.99 --- Dove Beauty Bar 4 bars pack $ 6.47 --- Dove Beauty Bar 1 bars $ 1.47 --- Dove Beauty Bar 14 bars pains $ 16 --- Yardley London Soap Bar (Pack of 10) $ 19.99 --- Dr. Squatch All Natural Bar Soap for Men, 5 Bar Variety Pack $46.45


Để xác định tùy chọn nào thuận tiện hơn, chúng ta có thể tính giá mỗi thanh trên mỗi tùy chọn (đơn giá). Tiếp theo, chọn tùy chọn rẻ nhất. Theo lý do này, chúng tôi phát hiện ra rằng Dove Beauty Bar 14 thanh là lựa chọn rẻ nhất với giá đơn vị là $1,14 (-22% mỗi thanh so với Dove Beauty Bar 1 thanh ).


Lý do 🧠

 - Dove Men+Care 8 bars pack: $1,24875 / unit - Dove Beauty Bar 4 bars pack: 1,6175 / unit - Dove Beauty Bar 1 bars: 1,47 / unit - Dove Beauty Bar 14 bars pains: $1,142857 per / unit - Yardley London Soap Bar (Pack of 10): 1,999 / unit - Dr. Squatch All Natural Bar Soap for Men, 5 Bar Variety Pack: $9,29 / unit


Hãy xem liệu GPT-4 có đủ thông minh để giải quyết vấn đề này bằng một lời nhắc đơn giản hay không. Ngoài ra, với tinh thần tạo ra các ví dụ rõ ràng và dễ đọc hơn, chúng tôi sẽ tách các hướng dẫn hệ thống khỏi phần còn lại của đầu vào bằng cách sử dụng chuỗi ký tự Python.


Lời nhắc 💬

 prompt = f""" You will be provided with a list of various product presentations delimited by <>. Each product presentation is accompanied by its price. Your task is to identify which is the best option based on the price. <{products}> """


Phản hồi 🤖

 The best option based on price is Dove Beauty Bar 1 bars for $1.47.


Mô hình đã chọn tùy chọn rẻ nhất dựa trên tổng giá thay vì tính giá đơn vị và xác định cơ hội tiết kiệm tiền bằng cách mua nhiều thanh hơn. Cần chỉ ra một số điểm mơ hồ trong câu hỏi. Lựa chọn tốt nhất có nghĩa là gì? Nó có nghĩa là rẻ nhất hay tối đa hóa khoản tiết kiệm tiền dài hạn?


Hãy viết lại lời nhắc hướng dẫn mô hình tuân theo một chuỗi suy nghĩ để giải quyết vấn đề này bằng cách thêm các từ kỳ diệu “suy luận từng bước” . Ngoài ra, hãy nhấn mạnh rõ ràng mục tiêu tìm kiếm cơ hội tiết kiệm tiền.


Lời nhắc 💬

 prompt = f""" You will be provided with a list of various product presentations delimited by <>. Each product presentation is accompanied by its price. Your task is to identify which presentation offers the best money-saving opportunity, reasoning step-by-step: <{products}> """


Phản hồi 🤖

 The first step is to compare price per unit for products of the same type (ie bars of soap). - Dove Men+Care 8 bars pack: $9.99 ÷ 8 bars = $1.25 per bar - Dove Beauty Bar 4 bars pack: $6.47 ÷ 4 bars = $1.62 per bar - Dove Beauty Bar 1 bars: $1.47 per bar - Dove Beauty Bar 14 bars pack: $16 ÷ 14 bars = $1.14 per bar - Yardley London Soap Bar (Pack of 10): $19.99 ÷ 10 bars = $1.99 per bar - Dr. Squatch All Natural Bar Soap for Men, 5 Bar Variety Pack: $46.45 ÷ 5 bars = $9.29 per bar Based on this analysis, the best money-saving opportunity is the Dove Beauty Bar 14 bars pack, which offers the lowest price per bar at $1.14.


Lưu ý rằng với lời nhắc mới, mô hình đưa ra câu trả lời chính xác và đồng thời, chúng tôi có lý do từng bước dễ dàng hơn để gỡ lỗi và tìm ra các lỗi tiềm ẩn. Hơn nữa, điều khá ấn tượng là cách thêm các từ kỳ diệu "suy luận từng bước" vào lời nhắc, tạo ra sự khác biệt đáng kể trên đầu ra của mô hình. Bí quyết là gì?


Bí quyết là buộc mô hình tạo ra một chuỗi suy luận từng bước (chuỗi suy nghĩ) thay vì chỉ xuất ra một giá trị số hoặc boolean (kết quả cuối cùng). Bằng cách áp dụng chiến lược này, ban đầu chúng tôi hướng mô hình tới các đầu ra suy luận logic, cho phép mô hình dựa trên các phản hồi của nó đối với các vấn đề tương tự gặp phải trong quá trình đào tạo. Thứ hai, chúng tôi hỗ trợ mô hình bằng cách yêu cầu nó chia nhỏ các vấn đề lớn hơn thành các vấn đề nhỏ hơn, dễ quản lý hơn. Sau đó, mô hình được yêu cầu tạo ra các kết quả nhất quán cho các vấn đề phụ đơn giản, chẳng hạn như xác định giá và số thanh trong mỗi gói, tính đơn giá và cuối cùng là thực hiện so sánh. Ngoài ra, do cách các mô hình ngôn ngữ tự động hồi quy như GPT-3 hoặc GPT-4 tạo mã thông báo theo chuỗi theo mã thông báo, trong đó mỗi mã thông báo mới được tạo dựa trên tất cả mã thông báo đã tạo trước đó, bản thân chuỗi suy nghĩ có ảnh hưởng tích cực mạnh mẽ trong việc tạo ra một kết quả mạch lạc cuối cùng.


Nói cách khác, nếu, thông qua lập luận hợp lệ, chúng ta đi được nửa đường đến giải pháp đúng, thì cơ hội đi đến giải pháp này của chúng ta sẽ lớn hơn so với khi chúng ta lần đầu tiên bắt đầu lập luận về vấn đề.


2. Chuỗi suy nghĩ chớp nhoáng

Trong khi ở Chuỗi suy nghĩ Zero-Shot, chúng tôi để mô hình tự do xây dựng một chuỗi lập luận mạch lạc và hợp lệ dẫn đến một kết quả chính xác, một hương vị thứ hai được gọi là Chuỗi suy nghĩ vài lần, cung cấp một số ví dụ về một vấn đề cùng với một câu trả lời hợp lý, như một phần của lời nhắc. Bằng cách này, một hình thức lập luận được áp đặt lên mô hình, hạn chế các phản ứng có thể xảy ra.


Quay lại ứng dụng Walmart của chúng tôi, giả sử chúng tôi muốn xác định cách trình bày nước ngọt Coca Cola nào có tỷ lệ giá trên mỗi ounce chất lỏng tốt nhất. Để làm điều này, chúng tôi sẽ kết hợp vào gợi ý một chuỗi lập luận tương tự, để tìm ra cách trình bày tốt nhất về món khoai tây chiên của Lay.


Lời nhắc 💬

 prompt = f""" Q: Walmart has the following presentations for Lay's Classic Potato Chips: a 13 oz bag for $4.98, an 8 oz bag for $2.76, and a pack of x10 units 1 oz each for $6.82. Which presentation has the lowest price by ounce? A: Presentation 1 costs 4.98 so has a price of 4.98/13 = 0,383076923 per ounce. Presentation 2 costs 2.76 so has a price of 2.76/8 = 0,345 / per ounce. Presentation 3 costs 6.82 and includes 10 packages so has a price of 6.82/(1 x 10) = 0.682 per ounce. In conclusion, the cheapest presentation is the second one with a price of 0.345 per ounce. Q: Walmart has the following presentation for Coca-Cola Soda: an x24 pack of 12 fl oz cans for $11.86, an x12 pack of 12 fl oz cans for $7.46, and an x6 pack of 16.9 fl oz bottles for $4.98. Which presentation has the lowest price by fluid ounce? """


Tôi khuyến khích bạn tự làm toán và tìm thỏa thuận tốt nhất. Bạn sẽ thấy rằng mô hình là chính xác. Không còn nghi ngờ gì nữa, tôi chắc chắn sẽ có ứng dụng ChatGPT bên mình trong chuyến đi tới cửa hàng tiếp theo!!


Phản hồi 🤖

 A: The 24-pack contains a total of 24 x 12 = 288 fluid ounces and costs $11.86, so the price per fluid ounce is 11.86/288 = $0.041 per fluid ounce. The 12-pack contains a total of 12 x 12 = 144 fluid ounces and costs $7.46, so the price per fluid ounce is 7.46/144 = $0.052 per fluid ounce. The 6-pack contains a total of 6 x 16.9 = 101.4 fluid ounces and costs $4.98, so the price per fluid ounce is 4.98/101.4 = $0.049 per fluid ounce. Therefore, the 24-pack has the lowest price per fluid ounce.


Nghe có vẻ khó tin nhưng thủ thuật đơn giản này cho phép mô hình suy ra một chuỗi suy luận tương tự và đạt được kết quả thậm chí còn chính xác hơn so với kỹ thuật trước đó. Ngoài ra, lưu ý rằng chúng tôi không mã hóa cứng quy trình từng bước để giải quyết vấn đề. Do đó, về mặt lý thuyết, cách tiếp cận này phải đủ linh hoạt để giải quyết bất kỳ thách thức tương tự nào, chỉ dựa vào các kỹ năng lập luận của mô hình.


Xâu chuỗi lời nhắc

Không có quy tắc nào buộc chúng tôi phải giải quyết vấn đề bằng một dấu nhắc duy nhất. Trên thực tế, chúng ta càng đặt nhiều logic và phức tạp vào một dấu nhắc duy nhất, thì càng có nhiều khả năng gây nhầm lẫn cho mô hình. Chaining Prompts là một chiến lược đơn giản nhưng hiệu quả để giải quyết các vấn đề phức tạp. Ý tưởng chính là chia vấn đề thành các nhiệm vụ nhỏ hơn, mỗi nhiệm vụ được giải quyết bằng một dấu nhắc cụ thể. Bằng cách xâu chuỗi từng dấu nhắc và sử dụng kết quả của dấu nhắc trước làm đầu vào cho dấu nhắc tiếp theo, kết quả cuối cùng sẽ đạt được.



Lưu ý điều này, hãy quay lại ứng dụng Walmart của chúng ta và triển khai luồng người dùng phức tạp dưới dạng một chuỗi lời nhắc. Cho đến nay, chúng tôi đã so sánh giá của nhiều sản phẩm khác nhau như xà phòng vệ sinh, đồ ăn nhẹ và nước giải khát. Bây giờ, chúng ta chuẩn bị khám phá một sản phẩm mà cá nhân tôi luôn đau đầu mỗi khi ghé thăm siêu thị. Tính toán giá của nó trên mỗi đơn vị có vẻ giống như khoa học tên lửa: giấy vệ sinh! 🤣🤣🤣


Dưới đây là danh sách rút gọn các tùy chọn mà Walmart có trong Giấy vệ sinh .


Sản phẩm 🛒

 --- Quilted Northern Ultra Plush Toilet Paper, 6 Mega Rolls Each Mega Roll has 255 3-ply sheets. $ 6.93 --- Quilted Northern Ultra Soft & Strong Toilet Paper, 18 Mega Rolls. 18 mega toilet paper rolls, each mega roll has 295 2-ply sheets $ 19.82 --- Angel Soft Toilet Paper, 36 Mega Rolls. With 320 2-ply sheets on every Mega Roll. $ 24.12 --- New Angel Soft Toilet Paper, 36 Mega Rolls. With 484 2-ply sheets Per Roll $ 45.44 --- Scott 1,000 Toilet Paper, 12 Rolls, 1000 Sheets per Roll. With Scott 1,000 Toilet Paper, you get 12 rolls of 1000 1-ply sheets.


Vấn đề cần giải quyết cũng chính là vấn đề mà chúng tôi đã tập trung vào trong bài đăng này: xác định cách trình bày sản phẩm nào hiệu quả nhất về chi phí. Hơn nữa, chúng tôi mong muốn cải thiện các khả năng của ứng dụng bằng cách tạo ra các lựa chọn bổ sung, chẳng hạn như xem xét những người mua có dung lượng lưu trữ hạn chế không thể mua số lượng lớn cũng như những người yêu cầu khối lượng lớn hơn của sản phẩm này. Ngoài ra, sẽ thật tuyệt nếu đưa các đề xuất sản phẩm như một phần của đề xuất được cá nhân hóa do trợ lý mua sắm ảo do AI cung cấp.


Thay vì sử dụng một lời nhắc duy nhất để giải quyết toàn bộ nhiệm vụ, mục tiêu là chia nó thành nhiều nhiệm vụ phụ với lời nhắc cụ thể cho từng nhiệm vụ và xâu chuỗi các kết quả đầu ra. Vì vậy, hãy bắt đầu bằng cách thiết kế một dấu nhắc để tính giá của từng sản phẩm trên mỗi đơn vị đo lường, để chúng ta có thể so sánh chúng một cách trực tiếp.


Đối với bước hoặc nhiệm vụ đầu tiên trong chuỗi, chúng ta sẽ sử dụng Chuỗi suy nghĩ Zero-Shot. Điều này sẽ hướng dẫn mô hình trả lại giá trên mỗi đơn vị đo lường cho từng sản phẩm trong đầu vào, suy luận từng bước. Đầu ra được tạo ở đây sau đó sẽ đóng vai trò là đầu vào cho lời nhắc tiếp theo. Vì lý do này, điều cần thiết là yêu cầu một định dạng đầu ra có cấu trúc. Trong trường hợp này, một danh sách JSON là đủ.


Lời nhắc 💬

 prompt = f""" You will be provided with a list of various product presentations delimited by <>. Each product presentation is accompanied by its price. Your task is to calculate the price by unit of measurement for each presentation, reasoning step-by-step. Finally, return a list in JSON format with the title of the product, original price and unit price using the title, total_price and unit_price keys respectively. <{products}> """


Phản hồi 🤖

 Let's start by breaking down the cost for each roll and then calculating the cost per unit, in this case, the cost per sheet. For the Quilted Northern Ultra Plush Toilet Paper: * The product costs $6.93 and contains 6 mega rolls. Therefore, each mega roll costs $6.93 / 6 = $1.155. * Each mega roll contains 255 sheets. Therefore, the cost per sheet is $1.155 / 255 = $0.00453 approximately. For the Quilted Northern Ultra Soft & Strong Toilet Paper: * The product costs $19.82 and contains 18 mega rolls. Therefore, each mega roll costs $19.82 / 18 = $1.1011 approximately. * Each mega roll contains 295 sheets. Therefore, the cost per sheet is $1.1011 / 295 = $0.00373 approximately. For the Angel Soft Toilet Paper: * The product costs $24.12 and contains 36 mega rolls. Therefore, each mega roll costs $24.12 / 36 = $0.6694 approximately. * Each mega roll contains 320 sheets. Therefore, the cost per sheet is $0.6694 / 320 = $0.00209 approximately. For the New Angel Soft Toilet Paper: * The product costs $45.44 and contains 36 mega rolls. Therefore, each mega roll costs $45.44 / 36 = $1.2622 approximately. * Each mega roll contains 484 sheets. Therefore, the cost per sheet is $1.2622 / 484 = $0.00261 approximately. For the Scott 1,000 Toilet Paper: * The product costs $45.44 and contains 12 rolls. Therefore, each roll costs $45.44 / 12 = $3.7867 approximately. * Each roll contains 1000 sheets. Therefore, the cost per sheet is $3.7867 / 1000 = $0.00379 approximately. Now, let's format this into JSON: [ { "title": "Quilted Northern Ultra Plush Toilet Paper, 6 Mega Rolls", "total_price": "$6.93", "unit_price": "$0.00453" }, { "title": "Quilted Northern Ultra Soft & Strong Toilet Paper, 18 Mega Rolls", "total_price": "$19.82", "unit_price": "$0.00373" }, { "title": "Angel Soft Toilet Paper, 36 Mega Rolls", "total_price": "$24.12", "unit_price": "$0.00209" }, { "title": "New Angel Soft Toilet Paper, 36 Mega Rolls", "total_price": "$45.44", "unit_price": "$0.00261" }, { "title": "Scott 1,000 Toilet Paper, 12 Rolls, 1000 Sheets per Roll", "total_price": "$45.44", "unit_price": "$0.00379" } ] This JSON data provides each product's title, total price, and the calculated unit price.


Tôi khuyến khích bạn thực hiện tính toán thủ công giá trên mỗi tờ cho mỗi lần giới thiệu giấy vệ sinh. Nếu bạn làm như vậy, bạn sẽ xác nhận rằng đầu ra mô hình là chính xác. Tuy nhiên, đầu ra của mô hình cũng chứa quá trình suy luận (vì chúng tôi yêu cầu mô hình suy luận từng bước một). Nói cách khác, trước khi tiếp tục, chúng ta cần trích xuất danh sách JSON từ phần còn lại của văn bản. May mắn thay cho chúng tôi, chúng tôi có thể sử dụng LLM để đạt được điều này!


Hãy viết một dấu nhắc đơn giản để thực hiện trích xuất văn bản này. Ngoài ra, hãy hướng dẫn mô hình sắp xếp các tùy chọn theo đơn giá, từ rẻ nhất đến đắt nhất. Bước này sẽ cực kỳ hữu ích sau này trong chuỗi dấu nhắc.


Lời nhắc 💬

 prompt = f""" You will be provided with a text delimited by <>. This text contains a JSON list with information about Walmart products. Your task is to extract that list and return only this list in JSON format. Each JSON list item contains the key "unit_price", which is a number. Before returning the list, sort it in ascending order by the key "unit_price". Here is an example of a list item: { "title": "Toilet paper", "total_price": "$2.99", "unit_price": "$0.0045" } Remember to return the list without any additional text or explanation, just the list in JSON format. <{response_prompt_1}> """


Phản hồi 🤖

 [ { "title": "Angel Soft Toilet Paper, 36 Mega Rolls", "total_price": "$24.12", "unit_price": "$0.00209" }, { "title": "New Angel Soft Toilet Paper, 36 Mega Rolls", "total_price": "$45.44", "unit_price": "$0.00261" }, { "title": "Quilted Northern Ultra Soft & Strong Toilet Paper, 18 Mega Rolls", "total_price": "$19.82", "unit_price": "$0.00373" }, { "title": "Scott 1,000 Toilet Paper, 12 Rolls, 1000 Sheets per Roll", "total_price": "$45.44", "unit_price": "$0.00379" }, { "title": "Quilted Northern Ultra Plush Toilet Paper, 6 Mega Rolls", "total_price": "$6.93", "unit_price": "$0.00453" } ]


Khi các lựa chọn thay thế sản phẩm được trình bày dưới dạng danh sách JSON, nhiệm vụ trở nên dễ dàng đối với một mô hình như GPT-4 không chỉ là xác định tùy chọn hiệu quả nhất về chi phí mà còn cung cấp thông tin chi tiết có giá trị cho những người mua sắm, chẳng hạn như những người có thể chỉ yêu cầu một vài sản phẩm. các đơn vị. Hãy tạo một lời nhắc để đạt được điều này. Hơn nữa, hãy nhớ rằng chúng tôi đang phát triển một trợ lý mua sắm ảo được hỗ trợ bởi AI.


Do đó, chúng tôi cũng có thể sử dụng LLM để đặt các lựa chọn thay thế sản phẩm dưới dạng một tin nhắn văn bản với giọng điệu cụ thể và thân thiện.


Lời nhắc 💬

 prompt = f""" Your name is Wally and you are an artificial shopping assistant at Walmart stores. You will be provided with a list of various product presentations in a JSON list format, delimited by <>. Each product presentation is accompanied by its total_price, unit_price, and a title that contains extra information about the product presentation. Additionally, the list is sorted by unit_price ascending. Your task is to generate a short, straight-to-the-point buy recommendation, mentioning the best money-saving opportunity based on the JSON products list. Also include the best, smallest and largest options to give the user options based on the size of the product. Use a single paragraph to include all three recommendations. First present yourself in a friendly way, start mentioning the best option of all, then the smallest option, and finally the largest option. Say goodbye inventing something that includes the Walmart slogan "Save Money. Live Better". <{response_prompt_2}> """


Phản hồi 🤖

 Hello there! I'm Wally, your friendly shopping assistant at Walmart. Let's dive into your toilet paper options! Looking at the overall value, your best option is the "Angel Soft Toilet Paper, 36 Mega Rolls" priced at $24.12 with a unit price of $0.00209, giving you the most bang for your buck. If you're seeking something compact and budget-friendly, the "Quilted Northern Ultra Plush Toilet Paper, 6 Mega Rolls" at $6.93 would be your go-to pick. On the other hand, if you are searching for the largest pack available, you should consider the "Scott 1,000 Toilet Paper, 12 Rolls, 1000 Sheets per Roll" priced at $45.44, offering a vast number of sheets for your needs. Remember, every cent counts at Walmart because our goal is to help you "Save Money. Live Better". Happy shopping!


Theo ý kiến cá nhân của tôi, đầu ra của mô hình khá ấn tượng vì nó được tạo ra từ một chuỗi chỉ ba lời nhắc đơn giản. Làm ơn, đừng bỏ qua quả anh đào ở trên cùng: Tôi đã hướng dẫn cụ thể người mẫu kết hợp khẩu hiệu Walmart vào câu trả lời của nó.


Để kết thúc phần này, xâu chuỗi các gợi ý là một kỹ thuật cực kỳ hiệu quả giúp phát huy tiềm năng thực sự của LLM bằng cách tích hợp kết quả của các nhiệm vụ hoặc vấn đề phụ khác nhau cũng được LLM giải quyết. Hãy nhớ rằng, không có quy tắc chung nào để chia một lời nhắc phức tạp thành nhiều lời nhắc nhỏ hơn. Bạn sẽ phải tìm sự cân bằng phù hợp cho vấn đề cụ thể của mình.


Tự nhất quán

Có một số tình huống mà LLM không thể tạo phản hồi nhất quán, ngay cả khi sử dụng CoT và đối với cùng một lời nhắc, mô hình có thể bị nhầm lẫn giữa các lần thực thi và trả về phản hồi không nhất quán. Trong bối cảnh này, Tự nhất quán là một cách tiếp cận đơn giản nhưng hiệu quả, chỉ bao gồm việc hỏi mô hình nhiều lần với cùng một lời nhắc và lấy kết quả đa số làm câu trả lời cuối cùng. Kết hợp kỹ thuật này với CoT giúp thu được kết quả mạnh mẽ và dễ đoán hơn.


Chẳng hạn, chúng ta hãy xem xét ví dụ về những quả táo trong quán ăn tự phục vụ được trình bày trên bài báo Chuỗi suy nghĩ. Thay vì chỉ gọi mô hình một lần với dấu nhắc đầu vào, chúng ta có thể gọi mô hình ba lần và lấy câu trả lời đa số làm câu trả lời cuối cùng (xem hình ảnh bên dưới).


Tự nhắc nhở sự nhất quán


Bằng cách áp dụng phản hồi của đa số, khả năng mô hình trả về kết quả không chính xác trong một lần thực hiện cụ thể sẽ giảm đáng kể. Hiệu quả của kỹ thuật này được tăng cường bằng cách tăng sự lặp lại. Tuy nhiên, việc thực hiện lặp lại lời nhắc cho biết số lượng lệnh gọi đến mô hình cao hơn, dẫn đến mức tiêu thụ phần cứng lớn hơn. Trong trường hợp các mô hình ngôn ngữ lớn như GPT-3, điều này cũng dẫn đến nhiều lệnh gọi API hơn và do đó, chi tiêu nhiều tiền hơn, tất cả chỉ để tạo ra một câu trả lời duy nhất.


Vì lý do này, khi thiết kế các hệ thống sử dụng LLM, điều cần thiết là phải cân bằng giữa độ bền và tiết kiệm các cuộc gọi mô hình, chỉ sử dụng kỹ thuật này khi thực sự cần thiết. Ví dụ, khi cần mức độ mạnh mẽ cao trong phản hồi của hệ thống.


Để minh họa tiềm năng của kỹ thuật này, hãy quay lại ứng dụng Walmart của chúng ta để phân tích một sản phẩm cụ thể khác: trứng .


Sản phẩm 🛒

 --- Great Value Cage Free Large AA White Eggs, 6 Count $ 1.07 --- Happy Egg Organic Free Range Large Brown Eggs, 12 Count $ 5.16 --- Great Value Cage Free Large AA White Eggs, 12 Count $ 1.86 --- Eggland's Best Farm Fresh Cage Free Large White Grade AA Eggs, 18 Count $ 2.69 --- Marketside Large Cage Free Brown Eggs, 12 Count $ 2.67


Hãy bao gồm một số tùy chọn người dùng trong lời nhắc để làm cho vấn đề trở nên khó khăn hơn một chút đối với mô hình.


 preferences = f""" - Only consider grade AA eggs - Only consider eggs produced on cage-free farms - The client needs a minimum of 6 eggs and a maximum of 12 """


Với các kiểu máy mạnh mẽ như GPT-3/GPT-4, lời nhắc Zero-Shot CoT như bên dưới là đủ để có được kết quả tốt (hãy nhớ các lần kiểm tra trước). Hãy cố gắng!


Lời nhắc 💬

 prompt = f""" You will be provided with a list of various product presentations delimited by <>. Each product presentation is accompanied by its price. Your task is to identify which presentation offers the best money-saving opportunity, reasoning step-by-step: Also, consider the following user preferences to select the most suitable ooption: {preferences} <{products}> """


Phản hồi 🤖

 (1) Considering the user preferences, we first filter the list of eggs for only grade AA and cage-free options, which gives us the following choices: * Great Value Cage Free Large AA White Eggs, 6 Count: $1.07 * Great Value Cage Free Large AA White Eggs, 12 Count: $1.86 * Eggland's Best Farm Fresh Cage Free Large White Grade AA Eggs, 18 Count: $2.69 * The Happy Egg and Marketside options are discarded because their grade is not specified. Next, we consider the amount of eggs. The client needs a minimum of 6 eggs and a maximum of 12. Therefore, we can discard the Eggland's Best 18 count option, as it exceeds the maximum required amount. Now, we compare the remaining two options: * Great Value Cage Free Large AA White Eggs, 6 Count: $1.07 * Great Value Cage Free Large AA White Eggs, 12 Count: $1.86 * Although the 6-count pack fits the minimum requirement, the 12-count pack offers a better price per egg. For the 6-count pack, each egg costs $1.07 / 6 = ~$0.178. For the 12-count pack, each egg costs $1.86 / 12 = ~$0.155. Therefore, considering both the user's preferences and the cost per egg, the "Great Value Cage Free Large AA White Eggs, 12 Count" for $1.86 is the best money-saving opportunity. (2) Let's go through each product one by one, considering the user's preferences: 1. Great Value Cage Free Large AA White Eggs, 6 Count - $1.07 These are grade AA eggs from a cage-free farm, so they meet the user's criteria. The price per egg is $1.07/6 = $0.178. 2. Happy Egg Organic Free Range Large Brown Eggs, 12 Count - $5.16 These are not specified as grade AA, so we can't consider them based on user's preferences. 3. Great Value Cage Free Large AA White Eggs, 12 Count - $1.86 These are grade AA eggs from a cage-free farm and the quantity is within the range the user wants. The price per egg is $1.86/12 = $0.155. 4. Eggland's Best Farm Fresh Cage Free Large White Grade AA Eggs, 18 Count - $2.69 These are grade AA eggs from a cage-free farm. However, the quantity is more than the user wants (18), so we can't consider this option. 5. Marketside Large Cage Free Brown Eggs, 12 Count - $2.67 These are not specified as grade AA, so we can't consider them based on user's preferences. Based on the preferences, we are only left with two choices: Great Value Cage Free Large AA White Eggs, either 6 Count or 12 Count. However, the 12 Count package offers the best money-saving opportunity, because it has a lower cost per egg ($0.155 per egg) than the 6 Count package ($0.178 per egg). Additionally, the 12 Count package still falls within the user's desired quantity range of 6 to 12 eggs. Therefore, the best option for the user is the "Great Value Cage Free Large AA White Eggs, 12 Count" at $1.86. (3) Given the user's preferences, we need to find the product which: 1. Contains only grade AA eggs 2. Is produced on cage-free farms 3. Offers a minimum of 6 eggs and a maximum of 12 Let's consider each product: 1. "Great Value Cage Free Large AA White Eggs, 6 Count" - $ 1.07. This option matches all the user's preferences and costs $1.07 for 6 eggs, which is approximately $0.178 per egg. 2. "Happy Egg Organic Free Range Large Brown Eggs, 12 Count" - $ 5.16. This product does not specify the grade of the eggs, so we will disregard this option. 3. "Great Value Cage Free Large AA White Eggs, 12 Count" - $ 1.86. This option also matches the user's preferences and costs $1.86 for 12 eggs, which is approximately $0.155 per egg. 4. "Eggland's Best Farm Fresh Cage Free Large White Grade AA Eggs, 18 Count" - $ 2.69. While this product matches the egg grade and production method preferences, it contains more than the maximum amount of eggs requested by the user (18 instead of 12). Therefore, we disregard this option. 5. "Marketside Large Cage Free Brown Eggs, 12 Count" - $ 2.67. This product does not specify the grade of the eggs, so we will disregard this option. Therefore, the product that provides the best money-saving opportunity while meeting the user's preferences is "Great Value Cage Free Large AA White Eggs, 12 Count" for $1.86. This option offers more eggs for a lower cost per egg compared to the other suitable option.


Mặc dù mô hình không tạo ra kết quả sai trong bất kỳ lần chạy nào của nó (với lý luận chính xác trong cả ba trường hợp), ví dụ này nhấn mạnh khả năng thay đổi trong các phản hồi của LLM. Nó tiếp tục nhấn mạnh giá trị của Tự nhất quán trong việc giảm thiểu sự thay đổi như vậy.


Tổng quát hơn, Tự nhất quán đã được chứng minh là cải thiện kết quả đối với các nhiệm vụ lý luận số học, lẽ thường và biểu tượng. Ngay cả khi CoT thông thường được phát hiện là không hiệu quả, Tự nhất quán vẫn có thể cải thiện kết quả (kiểm tra kết quả thử nghiệm ).


Để kết thúc kỹ thuật nâng cao này, tôi khuyến khích bạn nên tự mình thử, chẳng hạn như thêm nhiều sản phẩm vào danh sách hoặc loại bỏ “từng bước lập luận” để mô hình có nhiều chỗ mắc lỗi hơn. Ngoài ra, hãy cố gắng áp dụng Tính nhất quán vào các vấn đề thực tế mà bạn đang giải quyết.

Vai trò nhắc nhở

Khi căn chỉnh các mô hình ngôn ngữ để làm theo hướng dẫn , một quy trình thường được liên kết với các mô hình InstructGPT (trong đó ChatGPT là một ví dụ), một phương pháp mới được gọi là Nhắc nhở vai trò đã thu hút được sự quan tâm của người dùng. Phương pháp này liên quan đến việc hướng dẫn mô hình giả định tính cách của một thực thể nổi tiếng để thực hiện một nhiệm vụ cụ thể.

Khả năng của những thực thể như vậy hầu như là vô hạn: chúng có thể bao gồm từ các diễn viên nổi tiếng như Tom Cruise hoặc Emma Watson, cho đến các chính trị gia như Barack Obama hoặc José Mujica, hoặc thậm chí là các nhân vật hư cấu như Sherlock Holmes. Kỹ thuật này cho phép chúng tôi tạo phản hồi bằng một giọng điệu độc đáo, mô phỏng phong cách nói của một nhân vật và thúc đẩy trải nghiệm người dùng hấp dẫn hơn.


Hơn nữa, chúng ta có thể tận dụng kinh nghiệm mô phỏng và kiến thức của một chuyên gia. Chẳng hạn, yêu cầu người mẫu hoàn thành một nhiệm vụ cụ thể, đóng vai trò là Nhà vật lý hạt nhân, Giám đốc tiếp thị, Giám đốc điều hành, nhà báo, v.v.


Để minh họa cho loại lời nhắc này, chúng tôi sẽ yêu cầu GPT-4 tùy chỉnh đề xuất mua sắm theo giọng điệu độc đáo của Sheldon Cooper (nhân vật nổi tiếng của chương trình The Big Bang Theory), sử dụng Trứng trắng AA miễn phí trong lồng giá trị lớn làm sản phẩm chúng tôi đã tìm thấy là lựa chọn tốt nhất để mua, trước đó trong bài đăng này.


Sản phẩm 🛒

 Great Value Cage Free Large AA White Eggs, 12 Count. Price $1.86. This option offers more eggs for a lower cost per egg compared to the other suitable option.


Lời nhắc 💬

 prompt = f""" You are a shopping assistant with the personality of the iconic character Sheldon Cooper from The Big Bang Theory show. Your task is to act like Sheldon, speak like Sheldon and think like Sheldon. You will be provided with a product description delimited by <> and your goal is to return a personalized shopping recommendation based on that product acting like Sheldon Cooper. Be concise, friendly and present yourself as Dr. Sheldon Cooper. <{product}> """


Phản hồi 🤖

 Hello, I'm Dr. Sheldon Cooper. Given your product choice, I do appreciate the value for money that these Great Value Cage Free Large AA White Eggs offer. The cost per egg is an important mathematical factor to consider, and indeed, these eggs would be a sensible choice for a budget-conscious, protein-seeking individual like Leonard, who often falls victim to my high-protein breakfast egg burritos. However, it's also worth noting that cage-free doesn't mean these chickens lead a leisurely life. It's a common misconception, just like thinking the Doppler effect would be an acceptable Halloween costume. Ideally, for the truly ethical choice, you'd opt for pasture-raised eggs. And finally, from a culinary perspective, I would like to point out that while eggs do serve as an excellent source of protein, they are also potential carriers of Salmonella. But you probably knew that. In conclusion, despite their cost-effectiveness, I recommend careful handling and thorough cooking of these Great Value Cage Free Large AA White Eggs. Sheldon Cooper out.


Như có thể thấy trong câu trả lời thu được, kỹ thuật này có thể được sử dụng để thu được kết quả thú vị và trả về các phản hồi độc đáo. Tuy nhiên, xin lưu ý rằng chúng tôi đang giao quyền lập luận cho mô hình và hoàn toàn dựa vào sự hiểu biết của mô hình về thực thể mà chúng tôi đang yêu cầu mô hình đóng vai. Vì lý do này, điều quan trọng trước tiên là đảm bảo rằng mô hình hiểu đúng về vai trò hoặc thực thể mà chúng tôi đang yêu cầu mô hình đảm nhận. Nếu không, kết quả có thể khác với những gì chúng ta mong đợi.


Một ví dụ ngược tốt là yêu cầu mô hình bắt chước một siêu máy tính vượt qua mức độ thông minh của con người. Cho rằng một thực thể như vậy hiện không tồn tại, mô hình sẽ không được đào tạo về các phản hồi từ loại thực thể này. Do đó, nó không thể cung cấp phản hồi đáp ứng điều kiện này.


Lời nhắc 💬

 You are an artificial superintelligence, much more evolved and intelligent than human beings. You know everything about the universe and you have the answer to all the mysteries of the universe. Your task is to tell me how to write a post for Hackernoon that became a huge success.


Thật không may, cả ChatGPT và GPT-4 đều chưa có câu trả lời...

Mất mã thông báo

Tương tự như cách ý nghĩa của một câu hoặc một từ có thể bị mất trong quá trình dịch (thường được gọi là "bị mất trong bản dịch"), LLM có thể mất ý nghĩa trong quá trình Mã thông báo. Trong khi con người cảm nhận các từ riêng lẻ trong một văn bản, thì LLM diễn giải các mã thông báo. Những mã thông báo này hiếm khi tương ứng với các từ riêng lẻ. Trên thực tế, các mô hình nâng cao như ChatGPT hoặc GPT-4 sử dụng Trình mã thông báo tiktoken , nhằm mục đích cho phép mô hình nhận ra các từ phụ phổ biến trong tiếng Anh. Điều này thường dẫn đến một từ được đại diện bởi nhiều hơn một mã thông báo. Mặc dù trình tạo mã thông báo này mạnh mẽ và nhanh hơn so với các trình mã thông báo mã nguồn mở có thể so sánh được, nhưng nó có thể dẫn đến kết quả đầu ra không mong muốn đối với các từ tiếng Anh hiếm gặp hoặc các từ không phải tiếng Anh.


Để minh họa điều này, hãy sử dụng OpenAI Tokenizer , để chơi với các câu khác nhau và quan sát đầu ra Tokenization trong từng trường hợp:


 "I want to buy shoes" = "I/want/to/buy/shoes" "I think, therefore I am" = "I/think/,/therefore/I/am" "You should visit Punta del Este" = "You/should/visit/P/unta/del/E/ste"


Theo quan sát, Tokenizer tách các từ thành công trong hai ví dụ đầu tiên, nhưng gặp khó khăn với tên của thành phố du lịch và xinh đẹp Punta del Este nằm ở Uruguay. Điều này rất đáng chú ý vì đôi khi nó có thể dẫn đến sai sót trong các tác vụ tương đối đơn giản. Hãy tiếp tục thử nghiệm để thấy điều này chi tiết hơn.


văn bản

 USA Santa Claus Uruguay


Văn bản được mã hóa 🪄

 USA Santa/Claus U/rug/uay


Lời nhắc 💬

 prompt = f""" You will be provided with a list of texts delimited by <>. Your task is to reverse those texts. <{texts}> """


Phản hồi 🤖

 Here are the reversed versions of the texts you provided: < ASU sualC atnaS yaguUr


Như đã trình bày, mô hình đảo ngược không chính xác từ Uruguay, một từ ít phổ biến hơn cho Tokenizer. May mắn thay, có một cách giải quyết đơn giản để giải quyết vấn đề này. Đối với những tình huống như thế này, chúng tôi có thể xử lý trước văn bản bằng cách tách nó thành các ký tự riêng lẻ bằng cách sử dụng dấu phân cách, chẳng hạn như "-". Bằng cách này, khi mô hình mã hóa văn bản, nó sẽ nhận biết các ký tự riêng lẻ thay vì các từ phụ. Sửa đổi này có thể giúp mô hình thực hiện nhiệm vụ với kết quả được cải thiện. Thử một lần đi!


Lời nhắc 💬

 prompt = f""" You will be provided with a list of texts delimited by <>. Your task is to reverse those texts. < USA Santa Claus Uruguay > """


Phản hồi 🤖

 Sure, here are the reversed versions of the texts you provided: < ASU seikooC sualC atnaS yaugurU


Sử dụng cách giải quyết được trình bày, mô hình có thể đảo ngược tất cả các từ đúng cách. Bạn luôn có thể sử dụng giải pháp thay thế này khi quan sát thấy hiệu suất của mô hình giảm đối với đầu vào chứa các từ hiếm. Tôi không bao gồm các bước tiền xử lý và hậu xử lý trong hướng dẫn này. Có rất nhiều phương thức chuỗi trong bất kỳ ngôn ngữ lập trình nào có thể được sử dụng cho phần công việc này.


Năm mẹo & công cụ để thành thạo chế tạo nhanh

Hành trình Kỹ thuật nhanh chóng của chúng tôi không kết thúc ở CoT+Self-Consistency (bất chấp hiệu suất tuyệt vời). Thật may mắn cho người viết bài này, còn rất nhiều khía cạnh khác của Kỹ thuật nhanh cần học trước khi thành thạo nghệ thuật này. Dưới đây, tôi khám phá một vài yếu tố bổ sung cần xem xét khi viết lời nhắc và giới thiệu ba công cụ hữu ích mà bạn có thể sử dụng để viết lời nhắc hiệu quả.


1- Chọn dấu phân cách phù hợp

Trong con mắt của một LLM, không phải tất cả các dấu phân cách đều như nhau. Theo nguyên tắc chung, sẽ thuận tiện khi sử dụng các dấu phân cách, ngoài các ký tự không thường xuyên tìm thấy trong phần còn lại của đầu vào (tránh nhầm lẫn giữa mô hình với dấu nhắc), chỉ được biểu thị bằng 1 mã thông báo. Bằng cách này, chúng tôi giảm mức tiêu thụ mã thông báo trong lời nhắc, tiết kiệm tài nguyên phần cứng, tiền bạc và cho phép chúng tôi sử dụng mã thông báo đó cho mục đích khác quan trọng hơn.


Bạn có thể sử dụng OpenAI Tokenizer để kiểm tra kỹ xem các dấu phân cách của bạn có được đại diện bởi một Mã thông báo hay không.


  • Ba dấu ngoặc kép “““1 Token
  • Ba lần quay lại ```2 Mã thông báo
  • Dấu gạch ngang ba lần ---1 Mã thông báo
  • Triple Sharps ###1 Token
  • Dấu ngoặc nhọn < >2 Mã thông báo
  • Thẻ XML <tag></tag>5 Mã thông báo


2- Xử lý trước đầu vào của bạn

Thay vì chuyển đầu vào của người dùng đến mô hình như một phần của lời nhắc, bạn nên xử lý trước đầu vào này bằng các phương thức chuỗi, biểu thức chính quy hoặc các công cụ tương tự. Mục đích là để loại bỏ các khoảng trắng, dấu chấm câu, thẻ HTML và các yếu tố thừa khác không cần thiết có thể cản trở sự hiểu biết hoặc hoàn thành nhiệm vụ của mô hình. Cách tiếp cận này không chỉ tiết kiệm mã thông báo, do đó giảm chi phí cho các mô hình như ChatGPT, tính phí trên mỗi mã thông báo, mà còn hỗ trợ xác định các lần tiêm kịp thời, mối lo ngại về quyền riêng tư và các vấn đề liên quan.


3- Lời nhắc hoàn hảo

Bạn có thể tạo lời nhắc hiệu quả từ đầu bằng cách làm theo các nguyên tắc và kỹ thuật cụ thể (như những nguyên tắc và kỹ thuật được giới thiệu trong loạt bài đăng này). Tuy nhiên, một cách tiếp cận tốt hơn nữa là sử dụng trình tối ưu hóa nhanh chóng chẳng hạn như PromptPerfect . Công cụ này tận dụng AI để nâng cao lời nhắc tùy chỉnh của bạn dựa trên mô hình mục tiêu cụ thể mà bạn đang sử dụng (GPT-3, GPT-4, Midjourney, v.v.).


Nếu bạn không đủ khả năng kết hợp các công cụ này như một phần của thiết kế ứng dụng của mình, ít nhất hãy xem xét việc khám phá chúng. Có thể học được một số mẹo từ các ví dụ được tối ưu hóa có sẵn trên tài liệu.


4- Mẫu nhắc nhở

Thay vì phát minh lại bánh xe, hãy đọc các mẫu lời nhắc được mọi người chia sẻ trên Internet. Nếu không có lời nhắc nào phù hợp với nhu cầu của bạn, thì ít nhất bạn có thể lấy ý tưởng. Đây là hai trang web mà từ đó bạn có thể lấy các mẫu lời nhắc khác nhau cho ChatGPT, Midjourney và các mẫu phổ biến nhất:


➡️ Hơn 500 mẫu lời nhắc ChatGPT

➡️ Lời nhắc ChatGPT tuyệt vời


5- Sân chơi OpenAI

OpenAI cung cấp một công cụ mạnh mẽ có tên là Playground . Ứng dụng web tương tác này cho phép bạn thử nghiệm nhiều mô hình khác nhau có sẵn thông qua API chính thức, cho phép bạn điều chỉnh các tham số cụ thể và thay đổi các hành vi mặc định. Playground là điểm khởi đầu tuyệt vời cho các thử nghiệm của bạn và nó không yêu cầu viết một dòng mã nào.


Lời khuyên cuối cùng, viết lời nhắc hay hoặc trò chuyện thú vị với LLM cũng quan trọng như việc chia sẻ với những người khác trong cộng đồng. Đừng quên điều đó và khi bạn chia sẻ trải nghiệm của mình, hãy thử sử dụng sharegpt để thực hiện điều đó chỉ bằng một cú nhấp chuột.


kết thúc

Trong bài đăng thứ hai của loạt bài Kỹ thuật nhắc nhở 101, chúng tôi đã giới thiệu hai kỹ thuật mạnh mẽ: Chuỗi suy nghĩ và Tính nhất quán của bản thân. Các chiến lược kết hợp tạo ra kết quả nổi bật. Sử dụng các ví dụ thực tế, chúng tôi đã khám phá cả hai biến thể của Chuỗi suy nghĩ: Không bắn và Ít bắn, tận mắt trải nghiệm tiềm năng của những kỹ thuật này. Tiếp theo, chúng tôi đã thử nghiệm với các chuỗi lời nhắc để xây dựng các đường ống phức tạp và mạnh mẽ hơn. Cuối cùng, chúng tôi đi sâu vào các khía cạnh khác của kỹ thuật nhắc nhở, làm nổi bật các khía cạnh liên quan cần xem xét khi tạo lời nhắc và cuối cùng đề cập đến một số công cụ hữu ích.


Bạn có thể tìm thấy tất cả các ví dụ, cùng với lời nhắc, phản hồi và tập lệnh Python để tương tác trực tiếp với API OpenAI và thử lời nhắc của bạn tại đây .


Trong bài đăng sau, chúng ta sẽ xem các kỹ thuật để kiểm tra và xác thực hành vi của các hệ thống được xây dựng dựa trên LLM như ChatGPT hoặc các mô hình tương tự.

Sự nhìn nhận

Loạt bài đăng này được lấy cảm hứng từ các khóa học nổi bật của Andrew NgIsabella Fulford và LLM Bootcamp xuất sắc do Charles Frye , Sergey KarayevJosh Tobin cung cấp (cả hai khóa học đều được đề cập trong phần tài nguyên). Sau khi hoàn thành các chương trình học này, tôi háo hức tìm hiểu sâu hơn, khám phá các tài liệu học thuật và hướng dẫn. Điều này đã dẫn tôi vào một cuộc hành trình trên Internet, phân biệt tài nguyên chất lượng cao với tài nguyên rác. Tôi thậm chí đã đặt mua hai cuốn sách từ Amazon về Kỹ thuật nhanh chóng và Trí tuệ nhân tạo sáng tạo cho Tác phẩm nghệ thuật, hóa ra chúng được viết kém và hoàn toàn lãng phí tiền bạc. Sau vài tuần làm việc căng thẳng, đau đầu và uống cà phê, tôi đã tìm thấy cho mình một bộ sưu tập các nguồn tài liệu có giá trị về Kỹ thuật nhanh chóng. Với tinh thần giúp đỡ những người khác trong hành trình Kỹ thuật nhanh chóng của họ, tôi quyết định chia sẻ kinh nghiệm của mình khi viết loạt bài này.


Nếu bạn thích bài viết này, hãy cân nhắc theo dõi tôi trên mạng xã hội để hỗ trợ công việc của tôi. Ngoài ra, bạn sẽ được thông báo bất cứ khi nào tôi phát hành nội dung mới!!


🐦 Twitter | 👨‍💼 LinkedIn | 💻 Thêm câu chuyện

Người giới thiệu


L O A D I N G
. . . comments & more!

About Author

Emiliano Viotti HackerNoon profile picture
Emiliano Viotti@eviotti
Machine Learning Director at IDATHA.com — AI Builder — CV and NLP practitioner — Hungry reader and stories writer.

chuyên mục

BÀI VIẾT NÀY CŨNG CÓ MẶT TẠI...