ユーザー エクスペリエンスデザインは常に進化していますが、現在の人工知能の台頭により、この分野全体が完全に一変しました。 AI は、新しいパラダイムによる新しいインタラクション時代の到来をもたらしています。従来のユーザー インターフェイスはコマンド アンド コントロール パターンに基づいており、ユーザーはコンピューターに一連のコマンドを指示して、いくつかのユーザー タスクを実行します。しかし、AI により、ユーザーは、やり方ではなく、何を望んでいるのかを伝えることで、より自然にコンピュータと対話できるようになりました。
インテントベースのパラダイムとして知られる、この AI との対話の新しいパラダイムはまだ初期段階にありますが、私たちがコンピューターと対話する方法に革命をもたらす可能性があります。たとえば、コンピューターに「パリ行きのフライトを予約したい」と伝えると、コンピューターが自動的に最適なフライトを見つけて予約してくれると想像してください。あるいは、「税金に関して助けが必要です」と言え、コンピューターがそのプロセスを段階的に案内してくれると想像してみてください。これにより、「究極の」UX を設計し、それを完全に総合的かつシームレスにするための、まったく新しい機会が数多く開かれます。
インテントベースのインタラクションには課題がないわけではありません。 LLM としても知られる最新の言語学習モデルは、すでに自然言語の理解に非常に優れています。しかし、UX における AI の状態は完璧とは程遠く、現在のチャットベースの対話スタイルでは、ユーザーが問題を散文で書き出す必要があるため、高い認知負荷が生じます。
さらに、この種のインタラクションに直感的で使いやすい UI を設計するのは難しい場合があります。ただし、インテントベースのインタラクションの潜在的な利点は重要であり、UX デザイナーはすでにこの新しいパラダイムを最適に実装する方法を模索しています。
この記事では、インテントベースのインタラクションの台頭と、それが UX デザインに与える影響について探っていきます。現在存在するタイプの AI 駆動型製品、入出力パターンの使用方法、および AI 環境でのユーザー エクスペリエンスを向上させるために製品がどのように設計されているかについて説明します。
すでにわかったように、AI 製品を扱うデザイナーにとっての新たな課題は、インテントファーストのパラダイム フレームワークでデザインすることです。従来のソフトウェアについて考えると、ソフトウェアと対話する方法は、システム内に一連のコマンドを送信して、目的の出力を取得することです。入力はコマンドであり、ボタン、ドロップダウン、フォームなど、画面上でインタラクティブなものであれば何でもかまいません。GUIでのアクションの組み合わせがコマンドを形成し、これによって段階的に作業が進められます。
製品内の情報アーキテクチャをナビゲートする一連の手順を経て、最終的に問題の解決策、つまりシステムの出力が得られます。たとえば、タクシーを注文しようとしている場合、システムがドライバーを選択するときに、目的地を選択し、乗車パラメータを設定し、最後に運転を確認するコマンドを送信することになります。
インテントベースのインタラクションは、入力-処理-出力システムに絞り込まれます。文字通り、結果 (いわゆるプロンプト) として取得したいものをシステムに与えると、システムは入力を処理して出力を返します。計算のすべてのステップはシステム上で行われるため、必要なものだけが得られます。タクシーの例に戻りますが、インテントベースのシステムでは、プロンプト (「家までタクシーを注文して」) を伝えるだけで、乗車できます。
このパラダイムでは、引き続きワークフローでコマンドが必要になります。機械が間違う可能性があり、人間が出力を変更して制御したり、出力を別のフローで使用したりして、システムの動作を目標に合わせてより適切に設定したい場合があるためです。
これらの命名については同意しますが、AI をユーザー フローに統合すると、製品のワークフロー、タスク、問題、技術的特徴、その他の制限に応じて動作が異なる可能性があります。研究と分析の過程で、製品の特定のパターンが見えてくるので、それを見てみましょう。また、この製品またはその製品が入力-処理-出力パターンをどのように使用しているか、どのような UI ソリューションが使用されているか、AI 製品に標準的なユーザビリティの問題をどのように解決しているかについても説明します。それでは、始めましょう。
最もわかりやすい例について話しましょう。 AI に関する現在の誇大宣伝は、主にチャットボットとその機能に関するものです。このパターンでは、LLM を使用し、チャットボット インターフェイスを介した対話のやり取りを通じて AI ワークフローが発生します。ユーザーはチャットボットと会話することで対話し、チャットボットはユーザーの質問やプロンプトに応答します。通常、このタイプのワークフローは、幅広いタスクやソリューション、最も広範なリクエスト、新しいトピックの検討などを完了するために使用できます。
ただし、現在のチャットベースの対話スタイルでは、問題を散文で書き出す必要があるため、ユーザーに高い認知的負荷が生じます。この問題に対処するために、「プロンプト エンジニア」という新しい役割が開発されました。プロンプト エンジニアは、適切なプロンプトを提供することで ChatGPT から正しい結果を引き出す責任があります。言い換えれば、チャットボットはユーザビリティの設計に細心の注意を払う必要があります。
チャットボット製品は通常、テキストプロンプトの入力パターンを使用します。このアプローチにより、ユーザーはテキスト形式でリクエストを入力してシステムに送信し、必要なものを何でも書き込むことができます。これにより、入力結果と出力結果に最も幅広い可能性が提供されます。
ユーザー プロンプト パターンは通常、テキスト フィールドの UI 要素として表示されます。チャットボットでは通常、所定の位置に固定されたままになります。
プロンプトと組み合わせて、事前に作成されたプロンプトも追加されることが多く、これにより、このチャットボットで何をすべきかについてのユーザーの誤解や誤解が減り、提案が提供され、選択が簡素化されます。
また、チャットボットは、テキスト入力フィールドに入力するために音声入力の使用を提案することが多く、キーボード入力の代わりに音声を使用できるようになります。これにより、人間とコンピュータの間にほぼ有機的な対話が生まれます。
システムがどのような状態にあり、ユーザーのリクエストをどのように処理するかを示すことが重要です。アプリケーションごとに異なるアプローチが使用されます。チャットボットにおける最も一般的なアプローチは、リアルタイムのテキスト生成です。アルゴリズムが結果を提供するまでに時間がかかる場合があるため、外出中にテキスト生成を表示することをお勧めします。これにより、ユーザーの注意を集中させ、入力と出力の間の移行をよりシームレスに行うことができます。
チャットボット アプリケーションでは、出力の種類は大きく異なる場合があります。これには、テキスト、画像 (テキスト入力などで生成)、またはアプリケーションのターゲット トピックとその機能に応じたその他の結果が含まれます。出力されるコピーライティングには、ユーザー入力と、アプリの望ましい性格や個性 (該当する場合) が反映されていることが重要です。
チャットボットを設計する場合は、他のアプリがすでに使用しているベスト プラクティスを考慮する必要があります。
複数の出力。システムの結果は異なる可能性があり、場合によっては高品質ではない場合や、システムがユーザーのリクエストを誤解する可能性があるため、複数の出力の可能性を追加して、ユーザーが望んでいるクエリをシステムが推測する可能性を高めることをお勧めします。見る。
不正確なことをお詫び申し上げます。システム内の人工知能は、ユーザーに混乱、攻撃的なコンテンツ、または不安感をもたらす誤った結果を生成する可能性があります。システムは、発生する可能性のある不正確さをお詫び申し上げます。
このタイプの製品は、言語学習モデルを利用したチャットボットとよく似ていますが、その位置づけが特定のユースケースに限定されており、写真から特定の業界の質問に対する複雑なインタラクティブな回答まで、非常に異なるタイプの結果を生成できる点が異なります。
これらの製品は、全画面インタラクションとステップ フォームを通じて AI を主要なワークフローとして使用します。
すでに述べたように、入力はチャットボットの入力パターンに似ており、通常はテキストのプロンプトフィールドのように見えます。プロンプト テンプレート (思考のプロセスを開始するのに役立ちます) や音声入力などのベスト プラクティスも同様に残されています。
また、システムの出力に適用できる場合は、ユーザーがいくつかのパラメーターを設定できるようにすることが合理的な場合もあります。これは、ユーザーに馴染みのある基準スライダーやその他の標準的な UI パターンの使用を意味します。
他のワークフロー タイプと一貫した処理パターン。ここでのベスト プラクティスは、外出先でシステム出力を簡単に生成することです。ただし、AI ファーストのワークフローの処理を設計するときは、部分ごとに示すことが可能であれば、出力に注意してください。たとえば、画像の生成過程を表示できる場合、またはテクノロジーによって完成した画像のみを表示できる場合などです。
この場合、計算中に詳細な進行状況メッセージを提供することを検討してください。
AI ファーストのワークフローでは、システムがユーザーに何を提供しようとしているのか、どのようなソリューションを達成しようとしているのかに応じて、出力タイプは画像からさまざまな UI 構造 (または動的 UI 要素) までさまざまです。
このタイプのワークフローを設計するときは、複数の出力結果の使用を検討し、ユーザーが目的の結果を達成できるように出力を微調整できるようにし、再プロンプトを許可し、システムの動作に関するフィードバックを追加できるようにします。
このタイプでは、トリガーとコンテキスト アクションを通じて、AI ワークフローが既存のプライマリ ワークフローの上に追加されます。 LLM を使用して、さまざまな UI 要素を通じてコンテキスト タスクに対するソリューションを提供します。
コンテキスト ワークフローでの入力はタスクの種類に依存し、大きく異なる場合があります。これは、テキスト入力、プロンプト テンプレート、またはテキストの要約などの特定のタスクを有効にするためのボタンです。
このアプローチを使用する場合は、ユーザーがこれらのプロンプトまたはコマンドをトリガーする方法であるアクティブ化/非アクティブ化プロセスの設計を検討してください。
このパターンは、ユーザーが詳細なプロンプトを作成することなく詳細なプロンプトを作成できるようにするガイド付きウィザードとして表示され、テキスト フィールド、ドロップダウン、ラジオ ボタンなどのさまざまな UI 入力要素を使用します。これらすべてがフォーム構造に結合され、タスクのコンテキストに適応し、複雑なプロンプトを小さな論理部分に分割できるようになり、ユーザーの負荷が軽減され、ユーザーはプロンプトの形式について多くのことを考える必要がなくなります。プロンプト。これは、同じ構造で頻繁に繰り返されるクエリがある場合に特に便利です。その場合、毎回新しいプロンプトを作成する手間を省くために、変更された部分のみをユーザーに入力させることができます。
当然のことですが、コンテキスト システムでは、処理設計に対してコンテキスト アプローチが必要です。繰り返しますが、正しい方法はソフトウェアが実行する必要があるタスクの種類に大きく依存しますが、一般的な方法は変わりません。可能であれば、生成された結果の出力を表示します。そうでない場合は、アルゴリズムが現在動作しているステップと、処理の明示的なインジケーター (読み込みアイコンまたは進行状況バー) を表示します。
統合 AI ワークフローの出力を設計する場合は、主要なワークフローに適用する前に、ユーザーがコンテキスト内で出力を確認できるようにします。これにより、ユーザーは人工知能によって生成された結果の正しさを検証し、結果が正しくない場合には、結果を削除または変更することができます。
コマンドベースとインテントベースの対話アプローチの両方の利点を組み合わせます。製品の解決策であるタスクに応じて、ユーザーが目的を達成するために指定された出力を変更して使用できるようにします。できるだけスムーズで簡単な流れを提供します。
たとえば、本文が大量にある状況では、認知力や読み書き能力に問題があるユーザーは、テキスト全体を読まなくても、そのコンテンツに何が含まれているかを知りたいと考えます。ユーザーはクリックすると、AI によって生成されたテキストの短縮および簡略化されたバージョンを表示できます。
また、必要に応じてすぐに戻れるように、最近のクエリを保存して表示することもお勧めします。
目に見えない AI ワークフローは、最も伝統的なワークフローと考えることができます。これらの型は長い間存在しており、最近の言語モデルの誇大宣伝よりずっと前に登場しました。 「目に見えない」AI は、システムがユーザーのアクションをバックグラウンド モードで処理するため、文字通り目に見えません。機械学習アルゴリズムは自律的に動作し、関連するコンテンツを見つけ、プロンプトを改善し、動作を計算して分析しようとします。目に見えないシステムでのタッチポイントとインタラクションは最小限に抑えられます
目に見えないシステムは、ユーザーがさまざまなタスクを実行するのを支援し、ワークフローを中断することもあります。外出先でも適応する提案とオートコンプリートは、このアイデアを実践する方法です。一度に複数の提案を提供するオートコンプリート機能は、間違いを減らしたり、AI システムがユーザーが何を望んでいるのかわからない場合に、ユーザーが 1 つの選択肢を与えるのではなく、選択したラインナップから選択できるようにする方法でもあります。ただし、AI を活用した特定の修正が賢明であるとしても、間違いである可能性があり、それらをオーバーライドするのは難しくないはずであることに注意してください。 AI の提案を受け入れ、編集、拒否できるように設計されています。
目に見えないエクスペリエンスを作成するときは、ユーザーの現在のアクティビティに基づいて関連情報がシステムに表示され、パーソナライズされた推奨事項が優先されるようにしてください。提供された推奨事項を迅速かつ頻繁に更新します。
ユーザーに推奨事項を表示し、データのソースを明確に示し、特定の結果が予測または提案された理由を説明します。
AI システムのユーザーが定期的な対話を通じて自分の好みを表現できるようにします。ユーザーのフィードバックを確認し、調整が行われる時期を通知します。単にユーザーに感謝するのではなく、ユーザーのフィードバックがどのように役立つかを説明してください。そうすることで、再びフィードバックを提供してくれる可能性が高くなります。ユーザーが「嫌い」ボタンをタップすると、システムは即座にフィードバックを提供し、今後その種のコンテンツが表示されなくなることを確認する必要があります。
AI は間違いなく、私たちがコンピューター システムと対話する方法を変えるでしょう。ただし、AI ワークフローを設計するには、作成するワークフローの種類と対象ユーザーを慎重に考慮する必要があります。 AI システムがチャットベース、コンテキスト、非表示、プライマリのいずれであっても、他の同様の AI システムから得られたベスト プラクティスを念頭に置くことが重要です。複数の出力オプションを提供すること、不正確さについて謝罪すること、ユーザーが好みを表現できるようにすることは、確立されているベスト プラクティスのほんの一例にすぎません。さらに、ワークフローの入力、処理、出力の各段階を考慮し、それらをシームレスでユーザーにとって理解しやすい方法で設計することが重要です。これらのベスト プラクティスに従い、ユーザー固有のニーズを考慮することで、効果的、効率的、そしてユーザー フレンドリーな AI 製品を作成できます。