paint-brush
Рабочие процессы искусственного интеллекта и современные шаблоны проектирования приложенийк@artemivanov
4,236 чтения
4,236 чтения

Рабочие процессы искусственного интеллекта и современные шаблоны проектирования приложений

к Artem Ivanov12m2023/12/08
Read on Terminal Reader

Слишком долго; Читать

Искусственный интеллект меняет дизайн пользовательского опыта, вводя парадигму взаимодействия, основанного на намерениях. Традиционные интерфейсы уступают место более естественному взаимодействию, при котором пользователи выражают свои желания, а не команды. Чат-боты, основные рабочие процессы ИИ, контекстное взаимодействие и невидимые системы ИИ представляют собой разнообразные модели, каждая из которых требует уникального подхода к проектированию. Дизайнеры сталкиваются с такими проблемами, как когнитивная нагрузка и интуитивность интерфейса. Используя лучшие практики, несколько вариантов вывода, контекстные подсказки и отзывы пользователей, UX на основе искусственного интеллекта стремится к плавности и удобству для пользователя. Эволюция искусственного интеллекта во взаимодействии с пользователем обещает преобразующий опыт при тщательном рассмотрении этапов ввода, обработки и вывода в различных рабочих процессах.
featured image - Рабочие процессы искусственного интеллекта и современные шаблоны проектирования приложений
Artem Ivanov HackerNoon profile picture
0-item


Дизайн пользовательского опыта постоянно развивается, но нынешний рост искусственного интеллекта полностью перевернул всю эту область. ИИ открывает новую эру взаимодействия с новой парадигмой. Традиционные пользовательские интерфейсы основаны на шаблоне управления и контроля, когда пользователи сообщают компьютеру ряд команд для выполнения некоторых пользовательских задач. Однако ИИ позволяет пользователям более естественно взаимодействовать с компьютерами, сообщая им, чего они хотят, а не как это сделать.


Эта новая парадигма взаимодействия с ИИ, известная как парадигма, основанная на намерениях, все еще находится на ранних стадиях своего развития, но у нее есть потенциал совершить революцию в том, как мы взаимодействуем с компьютерами. Например, представьте, что вы можете сказать своему компьютеру: «Я хочу забронировать рейс в Париж», и он автоматически найдет лучшие рейсы и забронирует их для вас. Или представьте, что вы можете сказать: «Мне нужна помощь с налогами», и ваш компьютер шаг за шагом проведет вас через этот процесс. Это открывает множество абсолютно новых возможностей для разработки «идеального» UX и делает его полностью целостным и цельным.


Взаимодействие, основанное на намерениях, не лишено проблем. Современные модели изучения языка, также известные как LLM, уже очень хорошо понимают естественный язык. Однако состояние ИИ в UX далеко от совершенства, нынешний стиль взаимодействия на основе чата страдает от того, что требует от пользователей описывать свои проблемы в виде прозаического текста, поэтому он создает высокую когнитивную нагрузку.


Кроме того, может быть сложно разработать пользовательский интерфейс, который был бы интуитивно понятен и прост в использовании для такого типа взаимодействия. Однако потенциальные преимущества взаимодействия на основе намерений значительны, и UX-дизайнеры уже изучают, как лучше всего реализовать эту новую парадигму.


В этой статье мы рассмотрим рост взаимодействия, основанного на намерениях, и его последствия для UX-дизайна. Мы обсудим существующие в настоящее время типы продуктов на основе ИИ, каким образом они используют шаблоны ввода и вывода и как они предназначены для улучшения пользовательского опыта в среде ИИ.


Обзор контента

  • Как ИИ изменил работу дизайнера
  • Основные типы рабочих процессов ИИ в продуктах
    • Чат-боты
    • Первичный (ИИ-сначала)
    • Контекстуальный
    • Невидимый
  • Заключение

Как ИИ изменил работу дизайнера

Как мы уже поняли, новая задача для дизайнеров, работающих с продуктами искусственного интеллекта, — это проектирование в рамках парадигмы, ориентированной на намерение. Когда вы думаете о традиционном программном обеспечении, вы взаимодействуете с ним, отправляя цепочку команд внутри системы для получения желаемого результата. Ваш ввод — это команда, это может быть что угодно интерактивное на вашем экране, например кнопки, раскрывающиеся списки, формы и т. д. Комбинации ваших действий в графическом интерфейсе образуют команду, которая шаг за шагом ведет вас по вашему пути.


Командное взаимодействие


После набора шагов, навигации по информационной архитектуре в продукте, вы наконец получаете решение своей проблемы, результат работы системы. Например, когда вы пытаетесь заказать такси, вы отправляете набор команд для выбора пункта назначения, настройки параметров поездки и, наконец, отправляете команду для подтверждения поездки, когда система выбирает для вас водителя.


Взаимодействие, основанное на намерениях, сужается до системы ввода-обработки-вывода. Вы буквально даете системе то, что хотите получить в результате (так называемое приглашение), система обрабатывает ваши входные данные и выдает вам выходные данные. Все этапы расчета происходят в системе, вы получаете только то, что вам нужно. Возвращаясь к нашему примеру с такси, в системе, основанной на намерениях, вам нужно всего лишь дать подсказку («Заказать такси до дома»), и вас подвезут.


Взаимодействие на основе намерений


Эта парадигма по-прежнему будет требовать команд в рабочих процессах, поскольку машины могут ошибаться, а люди иногда могут захотеть изменить и контролировать выходные данные или использовать их в разных потоках, чтобы лучше настроить поведение системы в соответствии со своими целями.


Основные типы рабочих процессов ИИ в продуктах

Давайте договоримся об этих названиях, однако, когда мы интегрируем ИИ в пользовательский поток, он может работать по-разному в зависимости от рабочих процессов продукта, задач, проблем, технических особенностей и других ограничений. В процессе наших исследований и анализа видны определенные закономерности в продуктах, давайте на них посмотрим. Также мы расскажем, как тот или иной продукт использует паттерн ввод-обработка-вывод, какие UI-решения он использует и как решает стандартные для AI-продуктов задачи юзабилити. Итак, поехали.


1. Чат-боты

Давайте поговорим о самом очевидном примере. Нынешняя шумиха вокруг ИИ в основном связана с чат-ботами и их возможностями. В этом шаблоне с использованием LLM рабочий процесс ИИ происходит через диалог через интерфейс чат-бота. Пользователь взаимодействует с чат-ботом, разговаривая с ним, а чат-бот отвечает на вопросы и подсказки пользователя. Обычно этот тип рабочего процесса можно использовать для решения широкого спектра задач и решений, самых широких запросов, изучения новых тем и т. д.


Однако нынешний стиль взаимодействия в чате создает высокую когнитивную нагрузку для пользователей, поскольку требует от них излагать свои проблемы в виде прозаического текста. Для решения этой проблемы была разработана новая роль: «оперативный инженер». Инженеры по подсказкам несут ответственность за получение правильных результатов от ChatGPT, предоставляя соответствующие подсказки. Другими словами, чат-боты требуют большого внимания к их удобству использования.


ChatGPT — известный чат-бот и LLM.


Pi, еще один пример мобильного чат-бота


Вводы чат-бота

Продукты чат-ботов обычно используют шаблоны ввода текстовых подсказок. Такой подход позволяет пользователям вводить и отправлять в систему любой запрос в виде текста и писать все, что они хотят. Он обеспечивает широчайшие возможности для ввода и вывода результатов.


Шаблон запроса пользователя обычно отображается в виде элемента пользовательского интерфейса текстового поля. В чат-ботах он обычно остается фиксированным.


ChatGPT использует текстовое поле, расположенное внизу страницы.


Текстовая подсказка Google Bard


В сочетании с подсказками также часто добавляются заранее написанные подсказки, что уменьшает непонимание и неверные представления пользователя о том, что делать с этим чат-ботом, дает предложения и упрощает выбор.


ChatGPT показывает примеры подсказок пользователю в начале нового чата.


Также чат-боты довольно часто предлагают использовать голосовой ввод для заполнения поля ввода текста, позволяя использовать голос вместо набора текста с клавиатуры. Он создает почти органичный диалог между человеком и компьютером.


Например, Bard предоставляет возможность ввести подсказку с помощью голосового ввода пользователя.


Обработка чат-бота

Важно показать, в каком состоянии находится система и как она обрабатывает запрос пользователя. Разные приложения используют разные подходы. Самый распространенный подход в чат-ботах — генерация текста в реальном времени. Поскольку для получения результата алгоритму может потребоваться некоторое время, демонстрация генерации текста на ходу является хорошей практикой, позволяющей сосредоточить внимание пользователя и сделать переход между вводом и выводом более плавным.


Помощник чат-бота Pi показывает результаты процесса генерации в режиме реального времени.


Вывод чат-бота

В приложениях чат-ботов типы вывода могут сильно различаться. Это может быть текст, изображения (например, созданные при вводе текста) или другие результаты, которые зависят от целевой темы приложения и его функций. Важно, чтобы конечный копирайтинг отражал действия пользователя, а также желаемый характер и индивидуальность приложения (если это применимо).


Если вы собираетесь разработать чат-бота, вам следует учитывать лучшие практики, которые уже используют другие приложения.


  1. Несколько выходов. Поскольку результаты системы могут быть разными и иногда не высокого качества или система может неправильно понять запрос пользователя, рекомендуется добавить возможность нескольких выходных данных, чтобы увеличить вероятность того, что система угадает запрос, который хочет пользователь. видеть.


Бард предлагает три варианта ответа системы


Генератор изображений Bing создает несколько изображений в одном запросе


  1. Извините за неточность. Искусственный интеллект внутри системы может давать неправильные результаты, которые приводят к путанице, оскорбительному содержанию или чувству беспокойства у пользователя. Система приносит извинения за любые потенциальные неточности, которые могут возникнуть.


Бард заранее приносит извинения за потенциально неточные результаты


  1. Сохраненные взаимодействия. Запоминайте недавние действия пользователей в системе, что позволяет нам легче к ним обращаться. Показ недавних пунктов назначения, поисковых запросов и других данных может стать полезным стимулом для облегчения когнитивной нагрузки.


Бард показывает историю недавних разговоров



2. Первичный (ИИ-сначала)

Этот тип продуктов очень похож на чат-ботов, основанных на моделях изучения языка, за исключением того, что их позиционирование сужено до конкретных случаев использования, и они могут давать самые разные типы результатов: от изображений до сложных интерактивных ответов на вопросы в конкретной отрасли.


Эти продукты используют искусственный интеллект в качестве основного рабочего процесса посредством полноэкранного взаимодействия и пошаговых форм.


Copy.ai выглядит как чат-бот, но его основная функция сужена: помочь вам написать маркетинговый текст.


Оперативный ввод DALLE занимает первое место в рабочем процессе системы, но вывод его в виде изображений, генерирующих изображения.


Ввод для основного типа

Как мы уже упоминали, ввод похож на шаблоны ввода чат-бота, которые обычно выглядят как поле подсказки для текста. Лучшие практики также остаются схожими, например, шаблоны подсказок (которые помогут начать мыслительный процесс) и голосовой ввод.


Поле подсказки Copy.ai с возможностью настройки входных параметров


Кроме того, иногда имеет смысл разрешить пользователю устанавливать некоторые параметры, если их можно применить к выходным данным системы. Это означает использование ползунков критериев и других стандартных шаблонов пользовательского интерфейса, знакомых пользователю.


Приложение для создания графических ресурсов Recraft использует ползунок критериев для настройки уровня детализации вывода.


Обработка для основного типа

При использовании шаблонов обработки, соответствующих другим типам рабочих процессов, рекомендуется просто генерировать выходные данные системы на ходу. Но при разработке обработки для рабочих процессов, ориентированных на искусственный интеллект, обратите внимание на результат, если есть возможность показать его по частям. Например, если изображение можно показать в процессе генерации, или ваша технология позволяет показать его только завершенным.


В этом случае рассмотрите возможность предоставления детальных сообщений о ходе выполнения во время вычислений.


Bing Creator показывает индикатор выполнения во время создания изображения



Вывод для основного типа

В рабочих процессах, ориентированных на искусственный интеллект, типы вывода могут варьироваться от изображений до различных структур пользовательского интерфейса (или даже динамических элементов пользовательского интерфейса), в зависимости от того, что система пытается дать своему пользователю и какое решение она пытается достичь.


При разработке этого типа рабочего процесса рассмотрите возможность использования нескольких результатов вывода, разрешите точную настройку вывода, чтобы пользователь мог достичь желаемого результата, разрешите повторные подсказки и предоставьте возможность добавлять отзывы о работе системы.


Bing Create показывает несколько изображений из одного запроса


Copy.ai показывает две кнопки «палец вверх» и «палец вниз» для оценки результата со стороны пользователя.


Recraft позволяет бесконечно обновлять существующее изображение.




3. Контекстуальный

В этом типе рабочий процесс ИИ добавляется поверх существующего основного рабочего процесса посредством триггеров и контекстных действий. Используя LLM, он предлагает решения контекстных задач через различные элементы пользовательского интерфейса.


ClickUp предлагает использовать своего AI-помощника в контексте уже предлагаемых функций.


Linear предлагает свои услуги искусственного интеллекта для быстрого создания сложной фильтрации данных



Ввод для контекстных рабочих процессов

Входные данные в контекстных рабочих процессах зависят от типов задач и могут сильно различаться. Это может быть текстовый ввод, шаблоны подсказок или кнопки для выполнения определенных задач, например обобщения текста.


При использовании этого подхода рассмотрите возможность разработки процесса активации/деактивации, в зависимости от того, каким образом пользователь запускает эти запросы или команды.


ClickUp запускает своего AI-помощника при вводе AI в документ и позволяет выбирать между набором заранее созданных подсказок.


В будущих функциях Dovetail AI вы также сможете суммировать данные из различных источников. Например, упростите длительную беседу со службой поддержки или превратите часовую стенограмму интервью с клиентом в несколько пунктов.


Быстрое строительство

Этот шаблон выглядит как управляемые мастера, которые помогают пользователям создавать подробные подсказки без их написания, и использует различные элементы ввода пользовательского интерфейса, такие как текстовые поля, раскрывающиеся списки, переключатели и другие. Все это объединяется в структуры форм, которые адаптируются к контексту задачи и позволяют разбить сложную подсказку на небольшие логические части, снижая нагрузку на пользователя и освобождая его от необходимости много думать о формате быстрый. Это может быть особенно полезно, когда у вас часто повторяющийся запрос с одной и той же структурой, тогда вы можете позволить пользователю заполнять только те части, которые меняются, чтобы не утруждаться каждый раз написанием нового запроса.


ClickUp позволяет пользователям заполнять форму для создания подробного запроса в зависимости от контекста рабочего процесса.


Обработка для контекстных рабочих процессов

Неудивительно, что контекстные системы требуют контекстного подхода к обработке дизайна. Опять же, правильный путь во многом зависит от типов задач, которые необходимо выполнить программному обеспечению, но общие правила остаются прежними. Если возможно, покажите вывод результатов по мере их генерации. Если нет, покажите шаг, на котором в данный момент работает алгоритм, и явный индикатор обработки (значок загрузки или индикатор выполнения).


ClickUp AI генерирует результаты на ходу


Вывод для контекстных рабочих процессов

При разработке выходных данных для интегрированных рабочих процессов искусственного интеллекта позвольте пользователю проверять выходные данные в контексте, прежде чем применять их к основному рабочему процессу. Это позволит пользователю проверить правильность результата, сгенерированного искусственным интеллектом, и в случае неверных результатов удалить или изменить его.


ClickUp позволяет проверять сгенерированный текст перед его вставкой в документ.


Объедините преимущества подходов взаимодействия на основе команд и намерений. В зависимости от задачи, которую решает ваш продукт, позвольте пользователям модифицировать и использовать данный результат для достижения своих целей. Обеспечьте как можно более плавный и легкий поток.


Например, в ситуациях, когда основного текста много, пользователи с когнитивными проблемами или проблемами с грамотностью хотят знать, что содержится в этом контенте, без необходимости читать весь текст. Пользователь может нажать, чтобы просмотреть сокращенную и упрощенную версию текста, созданного ИИ.


Бард использует раскрывающееся меню для отображения возможных модификаторов ответа, что позволяет сделать результат короче или длиннее.


Также рекомендуется сохранять и отображать недавние запросы, чтобы при необходимости можно было быстро вернуться к ним.


ClickUp показывает недавние запросы пользователя



4. Невидимый

Рабочие процессы с невидимым ИИ можно считать наиболее традиционными. Эти типы существуют уже давно и появились задолго до недавнего ажиотажа вокруг языковых моделей. «Невидимый» ИИ буквально невидим, поскольку система обрабатывает действия пользователя в фоновом режиме. Работая автономно, алгоритмы машинного обучения пытаются найти соответствующий контент, улучшить подсказки, а также рассчитать и проанализировать поведение. Точки соприкосновения и взаимодействия в невидимых системах сведены к минимуму


TikTok рекомендовал видео как пример невидимого рабочего процесса. Анализируя поведение и интерес пользователя, их алгоритмы искусственного интеллекта предсказывают, что будет для пользователя наиболее интересным.


Невидимые системы также могут помогать пользователям выполнять различные задачи, прерывая их рабочие процессы. Предложения и адаптация автодополнения на ходу — способы реализации этой идеи на практике. Функции автозаполнения, предлагающие несколько предложений одновременно, также являются способом уменьшить количество ошибок, а когда система искусственного интеллекта не уверена, чего хочет пользователь, она позволяет пользователю выбирать из выбранного списка, а не предлагать ему один вариант. Тем не менее, обратите внимание: даже если некоторые исправления, внесенные искусственным интеллектом, разумны, они все равно могут быть неправильными, и отменить их не должно быть сложно. Разработан таким образом, чтобы можно было принимать, редактировать или отклонять предложения ИИ.


Dovetail предоставляет рассчитанные предложения по отображению соответствующих тегов для более быстрого анализа, которые являются бесшовными и связаны с текущей задачей, приближаясь к принципам невидимого взаимодействия.


При создании невидимого опыта убедитесь, что система отображает соответствующую информацию, основанную на текущих действиях пользователя, и отдайте приоритет персонализированным рекомендациям. Обновление дает рекомендации быстро и часто.


Показывая рекомендации пользователю, четко указывайте источник данных и объясняйте, почему был предсказан или предложен конкретный результат.


Spotify показывает исходного исполнителя и объясняет, почему он выбрал эти плейлисты.


Предоставьте пользователям системы ИИ возможность выражать свои предпочтения посредством регулярного взаимодействия. Примите к сведению отзывы пользователей и сообщите им, когда будут внесены изменения. Вместо того, чтобы просто благодарить пользователей, объясните, какую пользу им принесет их отзыв. Это повысит вероятность того, что они снова предоставят обратную связь. Когда пользователь нажимает кнопку «Не нравится», система должна немедленно предоставить обратную связь и подтвердить, что в будущем он будет видеть меньше такого рода контента.


Кнопка удаления Spotify позволяет пользователям уточнять предложения, сообщая системе, что они хотят видеть меньше похожих песен.


Заключение

ИИ определенно изменит способ нашего взаимодействия с компьютерными системами. Однако разработка рабочих процессов ИИ требует тщательного рассмотрения типа создаваемого рабочего процесса и целевого пользователя. Независимо от того, является ли ваша система ИИ основанной на чате, контекстной, невидимой или основной, крайне важно учитывать лучшие практики, возникшие в других подобных системах ИИ. Предоставление нескольких вариантов вывода, извинения за неточности и предоставление пользователям возможности выражать свои предпочтения — это лишь несколько примеров установленных передовых практик. Кроме того, важно учитывать этапы ввода, обработки и вывода рабочего процесса и проектировать их таким образом, чтобы они были простыми и понятными для пользователя. Следуя этим рекомендациям и учитывая уникальные потребности ваших пользователей, вы сможете создавать эффективные, действенные и удобные для пользователя продукты ИИ.