paint-brush
ChatGPT 4.0 cuối cùng cũng có một trò đùatừ tác giả@ursushoribilis
2,865 lượt đọc
2,865 lượt đọc

ChatGPT 4.0 cuối cùng cũng có một trò đùa

từ tác giả Miguel Rodriguez8m2023/03/20
Read on Terminal Reader

dài quá đọc không nổi

Đã thử nghiệm cách ChatGPT4 mới cải thiện khả năng lập luận, sáng tạo và phân tích so với phiên bản trước và thấy rằng nó tốt hơn về tổng thể. Tự mình biết, vì cả hai đều được đào tạo trên dữ liệu cũ, nên cả hai đều không biết về các tính năng của ChatGPT
featured image - ChatGPT 4.0 cuối cùng cũng có một trò đùa
Miguel Rodriguez HackerNoon profile picture
0-item

Tôi đã xem xét các khía cạnh này của phiên bản 4 mới của ChatGPT, so sánh nó với người anh em ChatGPT V 3.5 cũ hơn của nó:


  • Lý luận: Nó có thể giải thích tại sao một trò đùa vui không?
  • Sáng tạo: Nó có thể kể cho tôi một câu chuyện cười không? một trò đùa thực sự mới?
  • Phân tích: Nó có thể giải một câu đố không?
  • Bản thân biết cách: Nó biết bao nhiêu về bản thân.


So sánh phiên bản trò chuyện GPT như tài liệu của OpenAI


Đây là những phát hiện của tôi:

  • Lý do: ChatGPT4.0 có trò đùa, ChatGPT3.5 thì không
  • Sáng tạo: ChatGPT4.0 hoạt động tốt hơn.
  • Phân tích: ChatGPT4.0 lập trình tốt hơn ChatGPT3.5
  • Tự biết làm sao: Do dữ liệu lạc hậu nên không biết mình là ai.


Dưới đây là các chi tiết:

lý luận

Tôi đã xem một số bài báo viết về khả năng mới của thuật toán. Họ đã đề cập đến một vài sự thật thú vị. Đầu tiên là người mẫu có thể giải thích những câu chuyện cười.


Vì vậy, tôi đã làm một thử nghiệm. Tôi đã hỏi nó câu hỏi sau cho cả 3.5 và 4:

Tại sao điều này buồn cười *: Tại sao cà chua chuyển sang màu đỏ? Bởi vì nó nhìn thấy nước xốt salad!*

Tôi tự hỏi phiên bản cũ hơn sẽ nói gì với tôi về trò đùa, vì vậy tôi đã yêu cầu ChatGPT 3 cũ giải thích. Đây là phiên bản mò mẫm mà tôi nhận được:

Giải thích trò đùa ChatGPT3.5 so với ChatGPT4


Trò đùa này rất buồn cười vì nó diễn ra ý tưởng về quả cà chua đổi màu do phản ứng cảm xúc. Câu kết, "Bởi vì nó đã nhìn thấy nước sốt salad!", là một cách chơi chữ của cụm từ "Bởi vì nó đã nhìn thấy ánh sáng!" , thường được sử dụng để mô tả một nhận thức đột ngột hoặc thay đổi trong nhận thức. Trong trường hợp này, trò đùa là cà chua chuyển sang màu đỏ vì nó bị kích thích hoặc bị kích thích khi nhìn thấy nước xốt salad, một loại gia vị phổ biến cho rau. Sự hài hước đến từ sự ngớ ngẩn của ý tưởng rằng một loại rau có thể có phản ứng cảm xúc mạnh mẽ như vậy.


So sánh điều này với câu trả lời đúng do ChatGPT4 đưa ra:


Trò đùa này được coi là buồn cười vì nó dựa trên lối chơi chữ và phép nhân hóa. Sự hài hước đến từ việc mang lại những phẩm chất giống con người cho quả cà chua, chẳng hạn như khả năng cảm thấy xấu hổ.

Trong trò đùa, quả cà chua "chuyển sang màu đỏ" vì nó "nhìn thấy nước xốt salad." Các punchline có thể được giải thích theo hai cách:


  1. Theo nghĩa đen, cà chua chuyển sang màu đỏ khi chín, đó là một quá trình tự nhiên.


  2. Theo nghĩa bóng, quả cà chua cảm thấy xấu hổ (giống như một người có thể đỏ mặt hoặc đỏ mặt) vì nó "nhìn thấy" nước xốt salad, như thể nó bắt gặp ai đó đang cởi quần áo. Bằng cách pha trộn nghĩa đen với một chút hài hước, bất ngờ, trò đùa tạo ra một hình ảnh tinh thần mà nhiều người cảm thấy thú vị.


Vì vậy, nếu chúng ta có thể đánh giá suy luận bằng cách giải thích một Trò đùa, thì ChatGPT4.0 là người chiến thắng.

Sáng tạo

Sau đó, tôi yêu cầu cả hai tạo ra một trò đùa chưa tồn tại:

Trò đùa mới của ChatGPT3 (trái) và ChatGPT4 (phải)


Có vẻ như họ cần cải thiện kỹ năng hài hước của hệ thống.


Sau đó, tôi giao cho nó nhiệm vụ tạo một quảng cáo kỹ thuật số thông báo về việc ra mắt ChatGPT-4, mô tả các yếu tố đồ họa mà nó sẽ sử dụng, bao gồm cả chú thích và văn bản:


Tiêu đề: “Giới thiệu ChatGPT-4: Cuộc cách mạng trong trò chuyện AI”

Chú thích : “Trải nghiệm AI thế hệ tiếp theo với khả năng giao tiếp liền mạch, khả năng sáng tạo nâng cao và trí thông minh vô song.”


Các yếu tố hình ảnh:

Bối cảnh : Sự pha trộn các màu sắc rực rỡ tượng trưng cho sự kết hợp giữa tư duy giống con người và công nghệ tiên tiến. Bảng màu bao gồm xanh điện và tím, chuyển từ màu tối sang màu sáng hơn.


Biểu trưng ChatGPT-4 : Biểu trưng được hiển thị nổi bật ở trung tâm, thể hiện sự kết hợp giữa ô lời thoại và số “4” cách điệu, biểu thị phiên bản thứ tư của ChatGPT. Biểu trưng sử dụng phông chữ đẹp và hiện đại, với dải màu phù hợp với màu nền.


Minh họa AI : Hình ảnh ba chiều giống người, với tai nghe hoặc kính của tương lai, thể hiện sự tích hợp liền mạch giữa AI và giao tiếp của con người. Hình này dường như đang tương tác với giao diện trò chuyện ảo, nhấn mạnh chức năng chính của ChatGPT-4.


Tính năng nổi bật : Danh sách các tính năng chính được hiển thị bằng các biểu tượng hiện đại và văn bản ngắn gọn:

  • Hiểu ngữ cảnh nâng cao
  • Sáng tạo vô song
  • Hỗ trợ đa ngôn ngữ được cải thiện
  • Quyền riêng tư và bảo mật dữ liệu mạnh mẽ


Kêu gọi hành động (CTA) : Nút nổi bật và bắt mắt khuyến khích người dùng “Dùng thử ChatGPT-4 miễn phí” hoặc “Tìm hiểu thêm”. Nút sử dụng màu tương phản để nổi bật trên nền, chẳng hạn như cam hoặc xanh lục.


Băng chuyền lời chứng thực: Một băng chuyền xoay có các trích dẫn từ những người dùng hài lòng hoặc các nhà lãnh đạo ngành để tạo niềm tin và sự tín nhiệm. Băng chuyền được thiết kế với bố cục rõ ràng và hiện đại, sử dụng các bức chân dung hình tròn của các cá nhân cùng với lời trích dẫn của họ.


Phần chân trang: Phần chân trang bao gồm logo OpenAI, dòng giới thiệu có nội dung “Được cung cấp bởi OpenAI” và các liên kết đến Chính sách quyền riêng tư và Điều khoản dịch vụ.


Văn bản: “Khám phá thế giới của những khả năng vô tận với ChatGPT-4. Mô hình ngôn ngữ AI mới nhất của chúng tôi mang đến cho bạn trải nghiệm đàm thoại tuyệt vời, cho phép bạn kết nối, sáng tạo và cộng tác hơn bao giờ hết. Tham gia cuộc cách mạng AI ngay hôm nay và khai phá tiềm năng của bạn với ChatGPT-4.”


Và sau đó, tất nhiên, tôi đã đến gặp người anh em kỹ thuật số Dall-E của nó và yêu cầu nó tạo ra tác phẩm nghệ thuật kỹ thuật số mà ChatGPT 4 đã mô tả:


Phiên bản nghệ thuật kỹ thuật số Dall-E cho áp phích ra mắt ChatGPT


Tôi không phải là chuyên gia tiếp thị, nhưng tôi phải nói rằng tôi rất ấn tượng với kết quả. Trò chuyện GPT3.5 kém hùng hồn và thuyết phục hơn một chút về điều này.


Nó cũng có văn bản giải thích dưới cùng dường như là một phần của mọi câu trả lời và nghe giống một chính trị gia hơn là một chuyên gia:


Tiêu đề quảng cáo: Giới thiệu trò chuyện GPT-4: Tương lai của cuộc trò chuyện AI


Chú thích : Nói lời chào với cuộc trò chuyện thông minh hơn


Văn bản quảng cáo: Tương lai của các cuộc trò chuyện AI là ở đây với Chat GPT-4. Hãy sẵn sàng cho trải nghiệm tự nhiên và trực quan hơn với phản hồi nhanh hơn và chính xác hơn. Nói lời tạm biệt với những câu trả lời chung chung và chào đón những cuộc trò chuyện thông minh hơn.


Yếu tố đồ họa:

Hình minh họa tương lai của rô-bốt hoặc thiết bị AI
Màn hình điện thoại thông minh hoặc máy tính xách tay đang hiển thị cuộc trò chuyện với Chat GPT-4
Kiểu chữ đậm và hiện đại cho tiêu đề và chú thích
Phối màu nhấn mạnh công nghệ và đổi mới, chẳng hạn như màu xanh lam và bạc kim loại


Quảng cáo này nhằm mục đích nhấn mạnh công nghệ tiên tiến và khả năng nâng cao của Chat GPT-4, đồng thời nêu bật tiềm năng của nó trong việc nâng cao cách chúng ta tương tác với AI. Việc sử dụng hình minh họa tương lai và màn hình điện thoại thông minh hoặc máy tính xách tay hiển thị cuộc hội thoại giúp đưa khái niệm này vào cuộc sống và giới thiệu ứng dụng thực tế của sản phẩm. Kiểu chữ đậm và hiện đại cùng cách phối màu tập trung vào công nghệ củng cố thông điệp về sự đổi mới và tiến bộ.

phân tích

Sau đó, tôi đã phải thử nó ở kỹ năng giải câu đố của nó. Tôi đã sử dụng câu hỏi phỏng vấn này trong nhiều năm:

Bốn thành viên của U2 (Bono, the Edge, Larry và Adam) cần đi qua một cây cầu hẹp để chơi một buổi hòa nhạc. Vì trời tối nên phải có đèn pin để qua cầu, nhưng đoàn chỉ có một đèn pin và mỗi lần chỉ được hai người qua cầu. (Tất nhiên, điều này không có nghĩa là nếu một trong các thành viên của ban nhạc đã đi qua cầu, anh ta không thể tự quay lại với đèn pin.) Adam chỉ mất một phút để đi qua, Larry mất hai phút , Edge mất năm phút và slowpoke Bono mất 10 phút. Một cặp chỉ có thể đi nhanh như thành viên chậm nhất. Họ có 17 phút để vượt qua. Làm thế nào họ nên làm điều đó?


Để đưa cả bốn thành viên của U2 qua cầu trong 17 phút, họ có thể làm theo các bước sau:

  • Adam và Larry cùng nhau băng qua cầu mất 2 phút (2 phút trôi qua).
  • Adam quay lại với đèn pin, mất 1 phút (3 phút trôi qua).
  • Bono và Edge cùng nhau băng qua cầu, mất 10 phút (13 phút đã trôi qua).
  • Larry quay lại với đèn pin, mất 2 phút (15 phút trôi qua).
  • Adam và Larry cùng nhau băng qua cầu một lần nữa, mất 2 phút (17 phút đã trôi qua). Bằng cách này, cả bốn thành viên, Bono, the Edge, Larry và Adam, sẽ đi qua cầu trong đúng 17 phút.


Điều thực sự làm tôi ngạc nhiên là tốc độ mà nó đưa ra câu trả lời.

Điều không làm tôi ngạc nhiên là ChatGPT 3.5 có thể đưa ra giải pháp tương tự.


Vì vậy, tôi đã truy cập Interviewcake.com và nhận được câu hỏi lập trình mới nhất của họ:


Viết hàm fib() nhận vào một số nguyên n và trả về số fibonacci thứ n

Mã Fib(n) của ChatGPT 3.5 (phía trên) và ChatGPT 4 (phía dưới)

Trong trường hợp này, mã ChatGPT 4.0 sẽ thắng. Nó xử lý lỗi tốt hơn và giải quyết vấn đề theo cách thanh lịch hơn.

Tự biết làm sao

Bạn sẽ làm gì khi muốn tìm hiểu về ChatGPT 4.0 mới ra mắt? Tất nhiên, bạn hỏi chính người mẫu. Ngoại trừ việc mô hình được đào tạo với dữ liệu từ tháng 9 năm 2021, nên tất nhiên, nó không biết về chính nó.


Tuy nhiên, nếu bạn hỏi nó sẽ có những tính năng nào, nó sẽ đưa ra một câu trả lời hợp lý:

  1. Kích thước và kiến trúc mô hình: GPT-4 có thể có kích thước mô hình lớn hơn, bao gồm nhiều tham số và lớp hơn GPT-3, có 175 tỷ tham số. Kích thước mô hình lớn hơn thường dẫn đến hiệu suất tốt hơn, vì mô hình có thể tìm hiểu các mẫu và mối quan hệ phức tạp hơn trong dữ liệu.
  2. Dữ liệu đào tạo: GPT-4 có thể được đào tạo trên tập dữ liệu cập nhật và đa dạng hơn, điều này sẽ giúp nâng cao kiến thức và hiểu biết về các sự kiện, xu hướng và công nghệ gần đây.
  3. Tinh chỉnh và thích ứng theo nhiệm vụ cụ thể: GPT-4 có thể đã cải thiện các khả năng để tinh chỉnh và điều chỉnh cho các nhiệm vụ hoặc miền cụ thể, giúp nó trở nên linh hoạt và hiệu quả hơn trong nhiều trường hợp sử dụng hơn.
  4. Yêu cầu tính toán và hiệu quả: GPT-4 có khả năng hiệu quả hơn về mặt tài nguyên tính toán, cho phép nó chạy trên các thiết bị nhỏ hơn hoặc giảm tác động môi trường của việc đào tạo và triển khai các mô hình AI quy mô lớn.
  5. Cân nhắc về đạo đức và các biện pháp an toàn: GPT-4 có thể kết hợp các biện pháp an toàn nâng cao hơn để giảm thành kiến, giải quyết các mối lo ngại về đạo đức và ngăn chặn kết quả đầu ra có hại hoặc việc sử dụng có hại.
  6. Cải thiện khả năng suy luận và xử lý ngữ cảnh: GPT-4 có khả năng hiểu rõ hơn về ngữ cảnh, cho phép nó đưa ra các phản hồi phù hợp và mạch lạc hơn, cũng như thực hiện các tác vụ yêu cầu khả năng suy luận và giải quyết vấn đề.

Trông giống như một văn bản mà Chủ sở hữu sản phẩm được chuẩn bị kỹ lưỡng sẽ viết. Sau đó, nếu bạn so sánh với cách họ đang quảng bá nó, có vẻ như họ đã cải thiện khả năng lập luận và xử lý ngữ cảnh, tuy nhiên họ vẫn đang làm việc với những cải tiến về tốc độ.

kết luận

  • Lý do: ChatGPT4.0 có trò đùa, ChatGPT3.5 thì không
  • Sáng tạo: ChatGPT4.0 thực hiện tốt hơn việc tạo chiến dịch cho chính nó.
  • Phân tích: ChatGPT4.0 lập trình tốt hơn ChatGPT3.5
  • Bản thân biết cách: Do dữ liệu lỗi thời nên không ai trong số họ biết ChatGPT4.0 là ai. Tuy nhiên, họ cố gắng đoán những cải tiến mà nhóm sẽ làm