paint-brush
AI 共感の程度をテストする: 悪夢のシナリオ@anywhichway
542 測定値
542 測定値

AI 共感の程度をテストする: 悪夢のシナリオ

Simon Y. Blackwell37m2024/03/28
Read on Terminal Reader

長すぎる; 読むには

この文書では、さまざまな AI アシスタントが共感的な会話をどのように処理するかについての評価について説明します。評価された AI には、Claude、Gemini、ChatGPT、Willow、Pi.ai、Mistral、および Claude のカスタマイズされたバージョンが含まれます。各 AI には、悲しい、幸せ、悪夢を見るなどのシナリオが提示されました。彼らの反応は、同情の表現、ユーザーを理解しようとする試み、感情のためのスペースの提供、アドバイスの質、肯定的な会話、共感の表明、深刻な問題のエスカレーションに基づいて評価されました。全体として、Willow と Pi.ai は最も共感を示しましたが、Mistral は苦労しており、促しが必要でした。カスタマイズされたクロードは、ベンチマークと比較して良好なパフォーマンスを示しました。
featured image - AI 共感の程度をテストする: 悪夢のシナリオ
Simon Y. Blackwell HackerNoon profile picture
Simon Y. Blackwell

Simon Y. Blackwell

@anywhichway

Working in the clouds around Seattle on open source projects. Sailing when it's clear.

L O A D I N G
. . . comments & more!

About Author

Simon Y. Blackwell HackerNoon profile picture
Simon Y. Blackwell@anywhichway
Working in the clouds around Seattle on open source projects. Sailing when it's clear.

ラベル

Languages

この記事は...

Read on Terminal Reader
Read this story in a terminal
 Terminal
Read this story w/o Javascript
Read this story w/o Javascript
 Lite
Also published here