Дизайн пользовательского опыта постоянно развивается, но нынешний рост искусственного интеллекта полностью перевернул всю эту область. ИИ открывает новую эру взаимодействия с новой парадигмой. Традиционные пользовательские интерфейсы основаны на шаблоне управления и контроля, когда пользователи сообщают компьютеру ряд команд для выполнения некоторых пользовательских задач. Однако ИИ позволяет пользователям более естественно взаимодействовать с компьютерами, сообщая им, чего они хотят, а не как это сделать.
Эта новая парадигма взаимодействия с ИИ, известная как парадигма, основанная на намерениях, все еще находится на ранних стадиях своего развития, но у нее есть потенциал совершить революцию в том, как мы взаимодействуем с компьютерами. Например, представьте, что вы можете сказать своему компьютеру: «Я хочу забронировать рейс в Париж», и он автоматически найдет лучшие рейсы и забронирует их для вас. Или представьте, что вы можете сказать: «Мне нужна помощь с налогами», и ваш компьютер шаг за шагом проведет вас через этот процесс. Это открывает множество абсолютно новых возможностей для разработки «идеального» UX и делает его полностью целостным и цельным.
Взаимодействие, основанное на намерениях, не лишено проблем. Современные модели изучения языка, также известные как LLM, уже очень хорошо понимают естественный язык. Однако состояние ИИ в UX далеко от совершенства, нынешний стиль взаимодействия на основе чата страдает от того, что требует от пользователей описывать свои проблемы в виде прозаического текста, поэтому он создает высокую когнитивную нагрузку.
Кроме того, может быть сложно разработать пользовательский интерфейс, который был бы интуитивно понятен и прост в использовании для такого типа взаимодействия. Однако потенциальные преимущества взаимодействия на основе намерений значительны, и UX-дизайнеры уже изучают, как лучше всего реализовать эту новую парадигму.
В этой статье мы рассмотрим рост взаимодействия, основанного на намерениях, и его последствия для UX-дизайна. Мы обсудим существующие в настоящее время типы продуктов на основе ИИ, каким образом они используют шаблоны ввода и вывода и как они предназначены для улучшения пользовательского опыта в среде ИИ.
Как мы уже поняли, новая задача для дизайнеров, работающих с продуктами искусственного интеллекта, — это проектирование в рамках парадигмы, ориентированной на намерение. Когда вы думаете о традиционном программном обеспечении, вы взаимодействуете с ним, отправляя цепочку команд внутри системы для получения желаемого результата. Ваш ввод — это команда, это может быть что угодно интерактивное на вашем экране, например кнопки, раскрывающиеся списки, формы и т. д. Комбинации ваших действий в графическом интерфейсе образуют команду, которая шаг за шагом ведет вас по вашему пути.
После набора шагов, навигации по информационной архитектуре в продукте, вы наконец получаете решение своей проблемы, результат работы системы. Например, когда вы пытаетесь заказать такси, вы отправляете набор команд для выбора пункта назначения, настройки параметров поездки и, наконец, отправляете команду для подтверждения поездки, когда система выбирает для вас водителя.
Взаимодействие, основанное на намерениях, сужается до системы ввода-обработки-вывода. Вы буквально даете системе то, что хотите получить в результате (так называемое приглашение), система обрабатывает ваши входные данные и выдает вам выходные данные. Все этапы расчета происходят в системе, вы получаете только то, что вам нужно. Возвращаясь к нашему примеру с такси, в системе, основанной на намерениях, вам нужно всего лишь дать подсказку («Заказать такси до дома»), и вас подвезут.
Эта парадигма по-прежнему будет требовать команд в рабочих процессах, поскольку машины могут ошибаться, а люди иногда могут захотеть изменить и контролировать выходные данные или использовать их в разных потоках, чтобы лучше настроить поведение системы в соответствии со своими целями.
Давайте договоримся об этих названиях, однако, когда мы интегрируем ИИ в пользовательский поток, он может работать по-разному в зависимости от рабочих процессов продукта, задач, проблем, технических особенностей и других ограничений. В процессе наших исследований и анализа видны определенные закономерности в продуктах, давайте на них посмотрим. Также мы расскажем, как тот или иной продукт использует паттерн ввод-обработка-вывод, какие UI-решения он использует и как решает стандартные для AI-продуктов задачи юзабилити. Итак, поехали.
Давайте поговорим о самом очевидном примере. Нынешняя шумиха вокруг ИИ в основном связана с чат-ботами и их возможностями. В этом шаблоне с использованием LLM рабочий процесс ИИ происходит через диалог через интерфейс чат-бота. Пользователь взаимодействует с чат-ботом, разговаривая с ним, а чат-бот отвечает на вопросы и подсказки пользователя. Обычно этот тип рабочего процесса можно использовать для решения широкого спектра задач и решений, самых широких запросов, изучения новых тем и т. д.
Однако нынешний стиль взаимодействия в чате создает высокую когнитивную нагрузку для пользователей, поскольку требует от них излагать свои проблемы в виде прозаического текста. Для решения этой проблемы была разработана новая роль: «оперативный инженер». Инженеры по подсказкам несут ответственность за получение правильных результатов от ChatGPT, предоставляя соответствующие подсказки. Другими словами, чат-боты требуют большого внимания к их удобству использования.
Продукты чат-ботов обычно используют шаблоны ввода текстовых подсказок. Такой подход позволяет пользователям вводить и отправлять в систему любой запрос в виде текста и писать все, что они хотят. Он обеспечивает широчайшие возможности для ввода и вывода результатов.
Шаблон запроса пользователя обычно отображается в виде элемента пользовательского интерфейса текстового поля. В чат-ботах он обычно остается фиксированным.
В сочетании с подсказками также часто добавляются заранее написанные подсказки, что уменьшает непонимание и неверные представления пользователя о том, что делать с этим чат-ботом, дает предложения и упрощает выбор.
Также чат-боты довольно часто предлагают использовать голосовой ввод для заполнения поля ввода текста, позволяя использовать голос вместо набора текста с клавиатуры. Он создает почти органичный диалог между человеком и компьютером.
Важно показать, в каком состоянии находится система и как она обрабатывает запрос пользователя. Разные приложения используют разные подходы. Самый распространенный подход в чат-ботах — генерация текста в реальном времени. Поскольку для получения результата алгоритму может потребоваться некоторое время, демонстрация генерации текста на ходу является хорошей практикой, позволяющей сосредоточить внимание пользователя и сделать переход между вводом и выводом более плавным.
В приложениях чат-ботов типы вывода могут сильно различаться. Это может быть текст, изображения (например, созданные при вводе текста) или другие результаты, которые зависят от целевой темы приложения и его функций. Важно, чтобы конечный копирайтинг отражал действия пользователя, а также желаемый характер и индивидуальность приложения (если это применимо).
Если вы собираетесь разработать чат-бота, вам следует учитывать лучшие практики, которые уже используют другие приложения.
Несколько выходов. Поскольку результаты системы могут быть разными и иногда не высокого качества или система может неправильно понять запрос пользователя, рекомендуется добавить возможность нескольких выходных данных, чтобы увеличить вероятность того, что система угадает запрос, который хочет пользователь. видеть.
Извините за неточность. Искусственный интеллект внутри системы может давать неправильные результаты, которые приводят к путанице, оскорбительному содержанию или чувству беспокойства у пользователя. Система приносит извинения за любые потенциальные неточности, которые могут возникнуть.
Этот тип продуктов очень похож на чат-ботов, основанных на моделях изучения языка, за исключением того, что их позиционирование сужено до конкретных случаев использования, и они могут давать самые разные типы результатов: от изображений до сложных интерактивных ответов на вопросы в конкретной отрасли.
Эти продукты используют искусственный интеллект в качестве основного рабочего процесса посредством полноэкранного взаимодействия и пошаговых форм.
Как мы уже упоминали, ввод похож на шаблоны ввода чат-бота, которые обычно выглядят как поле подсказки для текста. Лучшие практики также остаются схожими, например, шаблоны подсказок (которые помогут начать мыслительный процесс) и голосовой ввод.
Кроме того, иногда имеет смысл разрешить пользователю устанавливать некоторые параметры, если их можно применить к выходным данным системы. Это означает использование ползунков критериев и других стандартных шаблонов пользовательского интерфейса, знакомых пользователю.
При использовании шаблонов обработки, соответствующих другим типам рабочих процессов, рекомендуется просто генерировать выходные данные системы на ходу. Но при разработке обработки для рабочих процессов, ориентированных на искусственный интеллект, обратите внимание на результат, если есть возможность показать его по частям. Например, если изображение можно показать в процессе генерации, или ваша технология позволяет показать его только завершенным.
В этом случае рассмотрите возможность предоставления детальных сообщений о ходе выполнения во время вычислений.
В рабочих процессах, ориентированных на искусственный интеллект, типы вывода могут варьироваться от изображений до различных структур пользовательского интерфейса (или даже динамических элементов пользовательского интерфейса), в зависимости от того, что система пытается дать своему пользователю и какое решение она пытается достичь.
При разработке этого типа рабочего процесса рассмотрите возможность использования нескольких результатов вывода, разрешите точную настройку вывода, чтобы пользователь мог достичь желаемого результата, разрешите повторные подсказки и предоставьте возможность добавлять отзывы о работе системы.
В этом типе рабочий процесс ИИ добавляется поверх существующего основного рабочего процесса посредством триггеров и контекстных действий. Используя LLM, он предлагает решения контекстных задач через различные элементы пользовательского интерфейса.
Входные данные в контекстных рабочих процессах зависят от типов задач и могут сильно различаться. Это может быть текстовый ввод, шаблоны подсказок или кнопки для выполнения определенных задач, например обобщения текста.
При использовании этого подхода рассмотрите возможность разработки процесса активации/деактивации, в зависимости от того, каким образом пользователь запускает эти запросы или команды.
Этот шаблон выглядит как управляемые мастера, которые помогают пользователям создавать подробные подсказки без их написания, и использует различные элементы ввода пользовательского интерфейса, такие как текстовые поля, раскрывающиеся списки, переключатели и другие. Все это объединяется в структуры форм, которые адаптируются к контексту задачи и позволяют разбить сложную подсказку на небольшие логические части, снижая нагрузку на пользователя и освобождая его от необходимости много думать о формате быстрый. Это может быть особенно полезно, когда у вас часто повторяющийся запрос с одной и той же структурой, тогда вы можете позволить пользователю заполнять только те части, которые меняются, чтобы не утруждаться каждый раз написанием нового запроса.
Неудивительно, что контекстные системы требуют контекстного подхода к обработке дизайна. Опять же, правильный путь во многом зависит от типов задач, которые необходимо выполнить программному обеспечению, но общие правила остаются прежними. Если возможно, покажите вывод результатов по мере их генерации. Если нет, покажите шаг, на котором в данный момент работает алгоритм, и явный индикатор обработки (значок загрузки или индикатор выполнения).
При разработке выходных данных для интегрированных рабочих процессов искусственного интеллекта позвольте пользователю проверять выходные данные в контексте, прежде чем применять их к основному рабочему процессу. Это позволит пользователю проверить правильность результата, сгенерированного искусственным интеллектом, и в случае неверных результатов удалить или изменить его.
Объедините преимущества подходов взаимодействия на основе команд и намерений. В зависимости от задачи, которую решает ваш продукт, позвольте пользователям модифицировать и использовать данный результат для достижения своих целей. Обеспечьте как можно более плавный и легкий поток.
Например, в ситуациях, когда основного текста много, пользователи с когнитивными проблемами или проблемами с грамотностью хотят знать, что содержится в этом контенте, без необходимости читать весь текст. Пользователь может нажать, чтобы просмотреть сокращенную и упрощенную версию текста, созданного ИИ.
Также рекомендуется сохранять и отображать недавние запросы, чтобы при необходимости можно было быстро вернуться к ним.
Рабочие процессы с невидимым ИИ можно считать наиболее традиционными. Эти типы существуют уже давно и появились задолго до недавнего ажиотажа вокруг языковых моделей. «Невидимый» ИИ буквально невидим, поскольку система обрабатывает действия пользователя в фоновом режиме. Работая автономно, алгоритмы машинного обучения пытаются найти соответствующий контент, улучшить подсказки, а также рассчитать и проанализировать поведение. Точки соприкосновения и взаимодействия в невидимых системах сведены к минимуму
Невидимые системы также могут помогать пользователям выполнять различные задачи, прерывая их рабочие процессы. Предложения и адаптация автодополнения на ходу — способы реализации этой идеи на практике. Функции автозаполнения, предлагающие несколько предложений одновременно, также являются способом уменьшить количество ошибок, а когда система искусственного интеллекта не уверена, чего хочет пользователь, она позволяет пользователю выбирать из выбранного списка, а не предлагать ему один вариант. Тем не менее, обратите внимание: даже если некоторые исправления, внесенные искусственным интеллектом, разумны, они все равно могут быть неправильными, и отменить их не должно быть сложно. Разработан таким образом, чтобы можно было принимать, редактировать или отклонять предложения ИИ.
При создании невидимого опыта убедитесь, что система отображает соответствующую информацию, основанную на текущих действиях пользователя, и отдайте приоритет персонализированным рекомендациям. Обновление дает рекомендации быстро и часто.
Показывая рекомендации пользователю, четко указывайте источник данных и объясняйте, почему был предсказан или предложен конкретный результат.
Предоставьте пользователям системы ИИ возможность выражать свои предпочтения посредством регулярного взаимодействия. Примите к сведению отзывы пользователей и сообщите им, когда будут внесены изменения. Вместо того, чтобы просто благодарить пользователей, объясните, какую пользу им принесет их отзыв. Это повысит вероятность того, что они снова предоставят обратную связь. Когда пользователь нажимает кнопку «Не нравится», система должна немедленно предоставить обратную связь и подтвердить, что в будущем он будет видеть меньше такого рода контента.
ИИ определенно изменит способ нашего взаимодействия с компьютерными системами. Однако разработка рабочих процессов ИИ требует тщательного рассмотрения типа создаваемого рабочего процесса и целевого пользователя. Независимо от того, является ли ваша система ИИ основанной на чате, контекстной, невидимой или основной, крайне важно учитывать лучшие практики, возникшие в других подобных системах ИИ. Предоставление нескольких вариантов вывода, извинения за неточности и предоставление пользователям возможности выражать свои предпочтения — это лишь несколько примеров установленных передовых практик. Кроме того, важно учитывать этапы ввода, обработки и вывода рабочего процесса и проектировать их таким образом, чтобы они были простыми и понятными для пользователя. Следуя этим рекомендациям и учитывая уникальные потребности ваших пользователей, вы сможете создавать эффективные, действенные и удобные для пользователя продукты ИИ.