Das User Experience Design entwickelt sich ständig weiter, aber der aktuelle Aufstieg der künstlichen Intelligenz hat das gesamte Gebiet völlig auf den Kopf gestellt. KI läutet eine neue Ära der Interaktion mit einem neuen Paradigma ein. Herkömmliche Benutzeroberflächen basieren auf einem Befehls- und Kontrollmuster, bei dem Benutzer dem Computer eine Reihe von Befehlen mitteilen, um bestimmte Benutzeraufgaben auszuführen. KI ermöglicht Benutzern jedoch eine natürlichere Interaktion mit Computern, indem sie ihnen sagt, was sie wollen, und nicht, wie sie es tun sollen.
Dieses neue Paradigma der Interaktion mit KI, bekannt als absichtsbasiertes Paradigma, steckt noch in den Kinderschuhen, hat aber das Potenzial, die Art und Weise, wie wir mit Computern interagieren, zu revolutionieren. Stellen Sie sich zum Beispiel vor, Sie könnten Ihrem Computer sagen: „Ich möchte einen Flug nach Paris buchen“ und er würde automatisch die besten Flüge finden und für Sie buchen. Oder stellen Sie sich vor, Sie könnten sagen: „Ich brauche Hilfe bei meinen Steuern“ und Ihr Computer führt Sie Schritt für Schritt durch den Prozess. Es eröffnet viele völlig neue Möglichkeiten, „ultimatives“ UX zu entwerfen und es vollständig ganzheitlich und nahtlos zu gestalten.
Absichtsbasierte Interaktion ist nicht ohne Herausforderungen. Moderne Sprachlernmodelle, auch LLMs genannt, sind bereits sehr gut darin, natürliche Sprache zu verstehen. Der Stand der KI in UX ist jedoch alles andere als perfekt. Der aktuelle Chat-basierte Interaktionsstil leidet darunter, dass Benutzer ihre Probleme als Prosatext aufschreiben müssen, was zu einer hohen kognitiven Belastung führt.
Darüber hinaus kann es schwierig sein, für diese Art der Interaktion intuitive und benutzerfreundliche Benutzeroberflächen zu entwerfen. Die potenziellen Vorteile der absichtsbasierten Interaktion sind jedoch erheblich, und UX-Designer untersuchen bereits, wie sich dieses neue Paradigma am besten umsetzen lässt.
In diesem Artikel werden wir den Aufstieg der absichtsbasierten Interaktion und ihre Auswirkungen auf das UX-Design untersuchen. Wir werden die derzeit existierenden Arten von KI-gesteuerten Produkten diskutieren, auf welche Weise sie Eingabe- und Ausgabemuster nutzen und wie sie gestaltet sind, um das Benutzererlebnis in der KI-Umgebung zu verbessern.
Wie wir bereits herausgefunden haben, besteht die neue Herausforderung für Designer, die mit KI-Produkten arbeiten, darin, im Intent-First-Paradigma zu entwerfen. Wenn Sie an traditionelle Software denken, ist die Art und Weise, wie Sie mit ihr interagieren, das Senden einer Befehlskette innerhalb des Systems, um eine gewünschte Ausgabe zu erhalten. Ihre Eingabe ist ein Befehl, es kann alles Interaktive auf Ihrem Bildschirm sein, wie Schaltflächen, Dropdowns, Formulare usw. Kombinationen Ihrer Aktionen in Ihrer GUI bilden einen Befehl, der Sie Schritt für Schritt durch Ihre Reise führt.
Nach der Reihe von Schritten, der Navigation durch die Informationsarchitektur in einem Produkt, erhalten Sie schließlich eine Lösung für Ihr Problem, die Ausgabe des Systems. Wenn Sie beispielsweise versuchen, ein Taxi zu bestellen, senden Sie eine Reihe von Befehlen, um einen Zielpunkt auszuwählen, Fahrtparameter einzurichten und schließlich einen Befehl zur Bestätigung einer Fahrt zu senden, wenn das System einen Fahrer für Sie auswählt.
Absichtsbasierte Interaktion wird auf das Eingabe-Verarbeitung-Ausgabe-System eingegrenzt. Sie geben einem System im wahrsten Sinne des Wortes vor, was Sie als Ergebnis erhalten möchten (sog. Eingabeaufforderung), das System verarbeitet Ihre Eingaben und gibt Ihnen eine Ausgabe. Alle Berechnungsschritte sind im System enthalten, Sie erhalten nur das, was Sie benötigen. Zurück zu unserem Beispiel mit dem Taxi: Im absichtsbasierten System müssen Sie nur Ihre Aufforderung geben („Bestellen Sie ein Taxi nach Hause“), und schon werden Sie mitgenommen.
Dieses Paradigma erfordert weiterhin Befehle in Arbeitsabläufen, da Maschinen Fehler machen können und Menschen manchmal eine Ausgabe ändern und steuern oder in verschiedenen Abläufen verwenden möchten, um das Verhalten des Systems besser auf ihre Ziele abzustimmen.
Lassen Sie uns diesen Benennungen zustimmen. Wenn wir jedoch KI in den Benutzerfluss integrieren, kann sie je nach Produkt-Workflows, Aufgaben, Problemen, technischen Funktionen und anderen Einschränkungen unterschiedlich funktionieren. Während unserer Recherche und Analyse sind bestimmte Muster in den Produkten sichtbar, werfen wir einen Blick darauf. Außerdem erklären wir Ihnen, wie dieses oder jenes Produkt das Eingabe-Verarbeitung-Ausgabe-Muster verwendet, welche UI-Lösungen es verwendet und wie es die für KI-Produkte standardmäßigen Benutzerfreundlichkeitsprobleme löst. Also lasst uns loslegen.
Lassen Sie uns über das offensichtlichste Beispiel sprechen. Der aktuelle Hype um KI dreht sich hauptsächlich um Chatbots und ihre Fähigkeiten. Bei diesem Muster mit LLM erfolgt der KI-Workflow durch das Hin und Her des Dialogs über eine Chatbot-Schnittstelle. Der Benutzer interagiert mit dem Chatbot, indem er ein Gespräch mit ihm führt, und der Chatbot antwortet auf die Fragen und Aufforderungen des Benutzers. Normalerweise kann diese Art von Arbeitsablauf für die Erledigung eines breiten Spektrums an Aufgaben und Lösungen, die umfassendsten Anfragen, das Studium neuer Themen usw. verwendet werden.
Allerdings stellt der aktuelle Chat-basierte Interaktionsstil eine hohe kognitive Belastung für die Benutzer dar, da sie ihre Probleme als Prosatext aufschreiben müssen. Um dieses Problem anzugehen, wurde eine neue Rolle entwickelt: der „Prompt Engineer“. Prompt-Ingenieure sind dafür verantwortlich, die korrekten Ergebnisse aus ChatGPT zu ermitteln, indem sie die entsprechenden Eingabeaufforderungen bereitstellen. Mit anderen Worten: Chatbots erfordern viel Aufmerksamkeit für ihr Usability-Design.
Chatbot-Produkte verwenden in der Regel textbasierte Eingabemuster. Dieser Ansatz ermöglicht es Benutzern, jede Anfrage in Textform einzugeben und an das System zu senden und alles zu schreiben, was sie wollen. Es bietet die umfassendste Möglichkeit für die Eingabe- und Ausgabeergebnisse.
Benutzeraufforderungsmuster werden normalerweise als Textfeld-UI-Element angezeigt. In Chatbots bleibt es normalerweise an Ort und Stelle.
In Kombination mit Eingabeaufforderungen werden häufig auch vorab geschriebene Eingabeaufforderungen hinzugefügt, wodurch Missverständnisse und falsche Vorstellungen des Benutzers darüber, was mit diesem Chatbot zu tun ist, verringert, Vorschläge bereitgestellt und Auswahlmöglichkeiten vereinfacht werden.
Außerdem schlagen Chatbots häufig vor, das Texteingabefeld per Spracheingabe auszufüllen, sodass Sie Ihre Stimme anstelle der Tastatureingabe verwenden können. Es entsteht ein fast organischer Dialog zwischen einer Person und einem Computer.
Es ist wichtig zu zeigen, in welchem Zustand sich das System befindet und wie es die Anfrage des Benutzers verarbeitet. Verschiedene Anwendungen verwenden unterschiedliche Ansätze. Der gängigste Ansatz bei Chatbots ist die Textgenerierung in Echtzeit. Da es eine Weile dauern kann, bis der Algorithmus ein Ergebnis liefert, empfiehlt es sich, die Textgenerierung unterwegs anzuzeigen, damit Sie die Aufmerksamkeit des Benutzers fokussieren und den Übergang zwischen Eingabe und Ausgabe nahtloser gestalten können.
Bei Chatbot-Anwendungen können die Arten der Ausgabe stark variieren. Dies können Texte, Bilder (z. B. durch Texteingabe generiert) oder andere Ergebnisse sein, die vom Zielthema der Anwendung und ihren Funktionen abhängen. Es ist wichtig, dass der ausgegebene Text die Benutzereingaben sowie den gewünschten Charakter und die gewünschte Persönlichkeit der App (falls relevant) widerspiegelt.
Wenn Sie einen Chatbot entwerfen, sollten Sie die Best Practices berücksichtigen, die andere Apps bereits verwenden.
Mehrere Ausgänge. Da die Ergebnisse des Systems unterschiedlich und manchmal nicht von hoher Qualität sein können oder das System die Anfrage des Benutzers möglicherweise falsch versteht, empfiehlt es sich, die Möglichkeit mehrerer Ausgaben hinzuzufügen, um die Wahrscheinlichkeit zu erhöhen, dass das System die vom Benutzer gewünschte Abfrage errät sehen.
Bitte entschuldigen Sie die Ungenauigkeit. Die künstliche Intelligenz im System kann zu falschen Ergebnissen führen, die zu Verwirrung, anstößigen Inhalten oder einem Gefühl des Unbehagens beim Benutzer führen. Das System entschuldigt sich für etwaige Ungenauigkeiten.
Diese Art von Produkten ähnelt Chatbots sehr, die auf Sprachlernmodellen basieren, mit der Ausnahme, dass ihre Positionierung auf bestimmte Anwendungsfälle beschränkt ist und sie sehr unterschiedliche Arten von Ergebnissen liefern können, von Bildern bis hin zu komplexen interaktiven Antworten auf Fragen in einer bestimmten Branche.
Diese Produkte nutzen KI als primären Arbeitsablauf durch Vollbildinteraktionen und Schrittformulare.
Wie bereits erwähnt, ähnelt die Eingabe den Chatbot-Eingabemustern, die normalerweise wie das Eingabeaufforderungsfeld für Text aussehen. Auch die Best Practices bleiben ähnlich, wie z. B. Eingabeaufforderungsvorlagen (um Ihren Denkprozess zu starten) und Spracheingabe.
Manchmal ist es auch sinnvoll, den Benutzer einige Parameter einrichten zu lassen, wenn diese auf die Ausgabe des Systems angewendet werden können. Dies bedeutet die Verwendung von Kriterienschiebereglern und anderen Standard-UI-Mustern, die dem Benutzer vertraut sind.
Verarbeitungsmuster, die mit den anderen Workflow-Typen konsistent sind. Die beste Vorgehensweise besteht hier darin, Systemausgaben einfach unterwegs zu generieren. Achten Sie jedoch beim Entwerfen der Verarbeitung für AI-First-Workflows auf die Ausgabe, wenn es möglich ist, diese Teil für Teil anzuzeigen. Zum Beispiel, wenn ein Bild während der Generierung angezeigt werden kann oder Ihre Technologie es Ihnen nur erlaubt, es fertig anzuzeigen.
Wenn dies der Fall ist, sollten Sie erwägen, während der Berechnungen detaillierte Fortschrittsmeldungen bereitzustellen.
In AI-First-Workflows können die Ausgabetypen von Bildern bis hin zu verschiedenen UI-Strukturen (oder sogar dynamischen UI-Elementen) variieren, je nachdem, was das System seinem Benutzer geben möchte und welche Lösung es erreichen möchte.
Erwägen Sie beim Entwerfen dieser Art von Workflow die Verwendung mehrerer Ausgabeergebnisse, ermöglichen Sie die Feinabstimmung einer Ausgabe, damit der Benutzer das gewünschte Ergebnis erzielen kann, ermöglichen Sie erneute Eingabeaufforderungen und bieten Sie die Möglichkeit, Feedback zur Arbeit des Systems hinzuzufügen.
Bei diesem Typ wird der KI-Workflow durch Auslöser und kontextbezogene Aktionen zusätzlich zum vorhandenen primären Workflow hinzugefügt. Mithilfe von LLM bietet es Lösungen für kontextbezogene Aufgaben über verschiedene UI-Elemente.
Eingaben in kontextbezogenen Workflows hängen von der Art der Aufgaben ab und können stark variieren. Dabei kann es sich um eine Texteingabe, Eingabeaufforderungsvorlagen oder Schaltflächen zum Aktivieren bestimmter Aufgaben, beispielsweise einer Textzusammenfassung, handeln.
Wenn Sie diesen Ansatz verwenden, überlegen Sie, den Aktivierungs-/Deaktivierungsprozess so zu gestalten, wie der Benutzer diese Eingabeaufforderungen oder Befehle auslöst.
Dieses Muster erscheint als geführte Assistenten, die Benutzern helfen, detaillierte Eingabeaufforderungen zu erstellen, ohne sie schreiben zu müssen, und verwendet verschiedene UI-Eingabeelemente wie Textfelder, Dropdown-Listen, Optionsfelder und andere. All dies wird zu Formularstrukturen zusammengefasst, die sich an den Kontext der Aufgabe anpassen und es ermöglichen, eine komplexe Eingabeaufforderung in kleine logische Teile aufzuteilen, wodurch die Belastung für den Benutzer verringert und er von der Notwendigkeit befreit wird, lange über das Format der Eingabeaufforderung nachzudenken prompt. Dies kann besonders nützlich sein, wenn Sie eine häufig wiederholte Abfrage mit derselben Struktur haben. Dann können Sie den Benutzer nur die Teile ausfüllen lassen, die sich ändern, um sich nicht jedes Mal die Mühe machen zu müssen, eine neue Eingabeaufforderung zu schreiben.
Es überrascht nicht, dass kontextbezogene Systeme einen kontextbezogenen Ansatz für das Verarbeitungsdesign erfordern. Auch hier hängt der richtige Weg stark von der Art der Aufgaben ab, die die Software erfüllen muss, aber die allgemeinen Vorgehensweisen bleiben gleich. Zeigen Sie nach Möglichkeit die Ausgabe der Ergebnisse an, während sie generiert werden. Wenn nicht, zeigen Sie den Schritt an, in dem der Algorithmus gerade arbeitet, und einen expliziten Indikator für die Verarbeitung (Ladesymbol oder Fortschrittsbalken).
Wenn Sie die Ausgabe für integrierte KI-Workflows entwerfen, ermöglichen Sie einem Benutzer, die Ausgabe im Kontext zu überprüfen, bevor sie sie auf den primären Workflow anwenden. Dies ermöglicht es dem Nutzer, die Richtigkeit des durch künstliche Intelligenz generierten Ergebnisses zu überprüfen und bei fehlerhaften Ergebnissen dieses zu löschen oder zu ändern.
Kombinieren Sie die Vorteile der befehlsbasierten und absichtsbasierten Interaktionsansätze. Abhängig von der Aufgabe, die Ihr Produkt löst, können Benutzer die gegebene Ausgabe modifizieren und verwenden, um ihre Ziele zu erreichen. Sorgen Sie für einen möglichst reibungslosen und einfachen Fluss.
In Situationen, in denen beispielsweise viel Fließtext vorhanden ist, möchten Benutzer mit kognitiven oder Lese- und Schreibproblemen wissen, was in diesem Inhalt enthalten ist, ohne den gesamten Text lesen zu müssen. Der Benutzer kann klicken, um eine verkürzte und vereinfachte Version des von einer KI generierten Textes anzuzeigen.
Es empfiehlt sich außerdem, aktuelle Abfragen zu speichern und anzuzeigen, damit Sie bei Bedarf schnell darauf zurückgreifen können.
Unsichtbare KI-Workflows können als die traditionellsten angesehen werden. Diese Typen gibt es schon seit langem, und sie erschienen lange vor dem jüngsten Hype um Sprachmodelle. „Unsichtbare“ KI ist buchstäblich unsichtbar, da das System Benutzeraktionen im Hintergrund verarbeitet. Algorithmen des maschinellen Lernens arbeiten autonom und versuchen, relevante Inhalte zu finden, Eingabeaufforderungen zu verbessern sowie Verhalten zu berechnen und zu analysieren. Touchpoints und Interaktionen in unsichtbaren Systemen werden minimiert
Unsichtbare Systeme können Benutzer auch bei der Erledigung verschiedener Aufgaben unterstützen und ihre Arbeitsabläufe unterbrechen. Vorschläge und die Anpassung der Autovervollständigung unterwegs sind Möglichkeiten, diese Idee in die Praxis umzusetzen. Autovervollständigungsfunktionen, die mehrere Vorschläge gleichzeitig anbieten, sind ebenfalls eine Möglichkeit, Fehler zu reduzieren und, wenn das KI-System nicht sicher ist, was ein Benutzer möchte, dem Benutzer die Möglichkeit zu geben, aus einer ausgewählten Reihe auszuwählen, anstatt ihm eine einzige Option zu geben. Seien Sie jedoch vorsichtig: Auch wenn bestimmte KI-gestützte Korrekturen sinnvoll sind, können sie dennoch falsch sein, und es sollte nicht schwierig sein, sie zu überschreiben. So konzipiert, dass KI-Vorschläge angenommen, bearbeitet oder abgelehnt werden können.
Stellen Sie beim Erstellen des unsichtbaren Erlebnisses sicher, dass das System relevante Informationen basierend auf den aktuellen Aktivitäten des Benutzers anzeigt und personalisierte Empfehlungen priorisiert. Aktualisieren Sie die bereitgestellten Empfehlungen schnell und häufig.
Zeigen Sie dem Benutzer Empfehlungen, geben Sie die Datenquelle klar an und erklären Sie, warum ein bestimmtes Ergebnis vorhergesagt oder vorgeschlagen wurde.
Ermöglichen Sie Benutzern des KI-Systems, ihre Präferenzen durch regelmäßige Interaktionen auszudrücken. Berücksichtigen Sie das Feedback der Benutzer und informieren Sie sie, wenn Anpassungen vorgenommen werden. Anstatt sich einfach bei den Benutzern zu bedanken, erklären Sie, welchen Nutzen ihr Feedback für sie hat. Dies erhöht die Wahrscheinlichkeit, dass sie erneut Feedback geben. Wenn ein Benutzer auf die Schaltfläche „Gefällt mir nicht“ tippt, sollte das System sofort eine Rückmeldung geben und bestätigen, dass er in Zukunft weniger Inhalte dieser Art sehen wird.
KI wird definitiv die Art und Weise verändern, wie wir mit Computersystemen interagieren. Das Entwerfen von KI-Workflows erfordert jedoch eine sorgfältige Überlegung der Art des zu erstellenden Workflows und des Zielbenutzers. Unabhängig davon, ob Ihr KI-System chatbasiert, kontextbezogen, unsichtbar oder primär ist, ist es wichtig, die Best Practices zu berücksichtigen, die aus anderen ähnlichen KI-Systemen hervorgegangen sind. Die Bereitstellung mehrerer Ausgabeoptionen, die Entschuldigung für Ungenauigkeiten und die Möglichkeit, dass Benutzer ihre Präferenzen äußern können, sind nur einige Beispiele für etablierte Best Practices. Darüber hinaus ist es wichtig, die Eingabe-, Verarbeitungs- und Ausgabephasen des Workflows zu berücksichtigen und sie so zu gestalten, dass sie für den Benutzer nahtlos und leicht verständlich sind. Indem Sie diese Best Practices befolgen und die individuellen Bedürfnisse Ihrer Benutzer berücksichtigen, können Sie KI-Produkte erstellen, die effektiv, effizient und benutzerfreundlich sind.