Когда мне впервые было поручено интегрировать генеративный ИИ в платформу IVR Viamo, обслуживая миллионы людей по всей Африке и развивающимся рынкам Азии, мне не потребовалось много времени, чтобы осознать, что мы не могли просто приложить к нему чат-интерфейс и позвонить ему в один день, поскольку это упростило бы некоторые из наших технических и разработок. Этот проект научил меня уроку о проектировании для ИИ, который я думаю, что все дизайнеры должны научиться: Дизайн для агентского ИИ не о том, чтобы сделать его удобным для общения, а о проектировании интеллектуальных систем, которые могут работать надежно, прозрачно и предсказуемо внутри рабочих процессов, которым люди уже доверяют. Смертельный недостаток чат-первого мышления Существует опасная парадигма, которая укоренилась в этой отрасли из-за своей одержимости чат-интерфейсами на продуктах ИИ, и это то, что каждый пытается построить «ChatGPT для Y». никто не останавливается и говорит: «Ну, на самом деле, просто потому, что мы можем построить это и чат является частью этого, что на самом деле не имеет ничего общего с тем, есть ли или нет чат-интеракция на самом деле то, что нам нужно на этом». Это не обязательно верно. Чат идеально подходит для открытых исследований и творческих задач, которые включают в себя путешествия, поскольку они включают в себя места назначения. Но большинство бизнес-задач требуют точности, аудитности и повторяемости. При проектировании интерфейса поставщика для Waypoint Commodities, системы, которая обрабатывает миллионы долларов удобрений и химических торговых транзакций, пользователи не нуждались в удобном для пользователя интерфейсе чата, который мог бы облегчить исследовательские разговоры о своих транзакциях. Они требовали интерфейсов, которые позволяли ИИ-системам указывать на ошибки, определять оптимальные маршруты и подчеркивать вопросы соответствия, не скрывая критические транзакции с какой-либо неопределенностью или неясностью. Основная проблема с ИИ, ориентированным на чат, заключается в том, что он позволяет принимать решения под фасадом разговора. Пользователи не могут легко проверить, какая информация была использована, что было применено, и что было исследовано в качестве альтернативного варианта. Конечно, это приемлемо для опросов с низкими ставками, но катастрофично для последовательных выборов. При проектировании нашей системы мониторинга поставок, которая отслеживала заказы на протяжении всего выполнения, наш проект Waypoint сталкивался с вызовом, который требовал, чтобы пользователи были уверены, что ИИ сообщения о потенциальных задержках или колебаниях рынка не были основаны на вымышленных наблюдениях, а на реальных фактах, изученных и проверенных самим ИИ. Многоагентные системы требуют многомодальных интерфейсов Но затем произошло сдвиг парадигмы в моем мышлении, поскольку я перестал проектировать только одну модель ИИ и сосредоточился на проектировании для среды, состоящей из нескольких специализированных организаций ИИ, работающих вместе как система. Это означало, что нам пришлось полностью отказаться от парадигмы системы чата с одним окном. Вместо этого мы построили многооконный интерфейс, через который можно было использовать несколько методов взаимодействия одновременно. Быстрые факты получали бы мгновенные ответы через голосовой выход ИИ. Решение проблем включало бы управляемое взаимодействие, посредством которого ИИ отвечал бы на предварительные вопросы, прежде чем перенаправить пользователя на экспертную систему. Пользователи, ищущие информацию о государственных учреждениях, получали бы форматированные ответы, которые будут цитировать источники соответственно. Эти результаты доказали, что эта стратегия была действительной, и мы испытали улучшенную точность ответа более чем на тридцать процентов и повышенные уровни участия пользователей. гораздо более существенно, уровни отказа пользователей снизились на двадцать процентов, поскольку пользователи перестали покидать разговоры из-за фрустрации из-за несоответствий ожиданий. Проектирование для проверки, а не только для автоматизации Один из важнейших принципов агентского дизайна UX, который я поддерживаю, заключается в том, что «автоматизация без проверки» - это просто «технический долг, маскирующийся как ИИ».Должен быть «убежищный хэтч», предоставляемый рядом с каждым «агентом ИИ», используемым в системе, что позволяет «пользователям подтверждать его рассуждения» и «перевергать его решение» по мере необходимости, «не потому, что у человека нет веры» в «способности ИИ», а потому, что «уважается факт», что «пользователи имеют конечную ответственность» при «регулируемой среде или транзакциях с высокой стоимостью». Когда я отвечал за проектирование панели администрирования для загрузки новых пользователей в Waypoint, у нас был типичный случай проекта автоматизации, типа, который позволил бы ИИ обрабатывать документы интеграции, абстрагировать важную информацию и автоматически популяризировать пользовательские профили, тем самым сокращая загрузку пользователей с нескольких часов до нескольких минут.Конечно, мы понимали, что неточности могут потенциально привести компанию в случай несоблюдения или, что еще хуже, создать мошеннические пользовательские профили. В нашем интерфейсе мы внедрили следующую систему для указания уровней уверенности в ИИ для каждого извлеченного поля: Поля, имевшие высокий уровень точности, имели черный цвет текста и зеленые метки; Средняя точность имела оранжевый цвет, и использовался нейтральный символ; Поля с низкой точностью или отсутствующей информацией были красного цвета и предупреждающего символа. Чтобы выявить любые ошибки, которые пропустили системы ИИ, тридцать секунд на профиль было достаточно для администраторов, так как они получили достаточно контекста через эту систему. Но результат был ясен: мы добились сокращения времени ввода в эксплуатацию на сорок процентов по сравнению с полностью ручными методами и большей точностью, чем только человеческие или AI-подходы. но более существенно, администраторский персонал доверял этой системе, потому что они могли фактически следовать ее логике. Прогрессивное раскрытие возможностей агентов Еще одна тонкая, но важная область агентического UX, с которой большинство дизайнеров борются, - это предоставление пользователям информации о том, что их агенты могут и не могут достичь, не переполняя их возможностями и потенциальными приложениями этих возможностей. Это особенно верно для систем, которые применяют генеративный ИИ, и, поскольку мы боролись на работе в FlexiSAF Edusoft, где я разработал эти системы, у них есть приложения, которые охватывают широкий диапазон, но непредсказуемы в разных задачах или деятельности. Наша реализация предоставила подсказки о возможностях, основанные на взаимодействии, что означает, что при использовании системы им будут предоставлены примеры вопросов, на которые ИИ был силен в ответе, в отличие от вопросов, которые могли бы быть более адекватно отвечены сотрудниками человеческих ресурсов в учреждении, что означает, что, когда пользователь вводит вопросы о сроках подачи заявки, они будут видеть примеры вопросов, на которые ИИ был силен в ответе, например, «Когда истекает срок для инженерных приложений?» в отличие от вопросов, на которые они могли бы более эффективно ответить, например, «Могу ли я быть освобожден от уплаты сборов за подачу заявки?» Кроме того, мы включили цикл обратной связи, через который пользователи могли выразить, был ли их вопрос полностью отвечен ответом на ИИ или нет. Это было не только для улучшения модели, но это позволило функцию UX, через которую пользователи могли выразить, что они требуют эскалации своей проблемы и что они были застряли в системе ИИ. Релевантные ресурсы были бы предоставлены через эту систему, и, если нет, они также были бы связаны с человеческими ресурсами, что привело к снижению билета поддержки, но без жертв удовлетворения пользователей, так как люди почувствовали, что их слушали и что они не были застряли через систему ИИ. Прозрачность и ее полезность как фактор доверия Доверие, конечно, создается не улучшенными алгоритмами ИИ, а прозрачным дизайном системы, который позволяет пользователю увидеть, что знает система, почему она сделала свои выводы, и где находятся ее ограничения. eHealth Africa, наш проект, связанный с логистикой и хранением данных цепочек поставок в медицинском секторе, сделал это одним из своих невыгодных для обсуждения: «Если компьютерные агенты ИИ предсказывали сроки поставок вакцин или указали оптимальные маршруты доставки, эти обоснования должны были быть объяснимыми, потому что люди, принимающие решения, будут решать, получают ли сельские клиники спасающие жизни товары вовремя». Чтобы решить этот вопрос, мы создали то, что я называю «панелями рассуждений», которые обеспечивали выход наряду с предложениями ИИ. Эти панели рассуждений не отображали детали модели своих вычислений, а только информацию о том, почему она достигла своих рекомендаций, включая дорожные условия, предыдущие сроки доставки для этого маршрута, погоду и доступную транспортную способность. Для этого мы создали полезные состояния неудач, которые могли бы описать, почему ИИ не смог предложить свои рекомендации, а не вернуться к какому-то общему сообщению об ошибке.Если, например, он не смог предложить оптимальный маршрут, потому что ему не хватало информации о подключении, это было явным образом сообщено, и пользователь был проинформирован о том, что они могли бы сделать, если у них еще не было рекомендации маршрута. Дизайн рукопожатий между агентами и людьми Но, пожалуй, одна из самых неразвитых тем агентического UX - это передача, или как именно и когда агент ИИ должен передать контроль над системой или взаимодействием человеку, будь то человеческий коллега или сам пользователь этой системы или взаимодействия. Наш протокол для контекстной передачи был разработан таким образом, что после каждого взаимодействия ИИ на экране оператора появилось структурированное резюме, прежде чем они могли приветствовать пользователя, и это резюме содержало то, что было запрошено пользователем, что ИИ намеревался сказать, и почему ИИ эскалировал этот вызов. В случаях, когда операторы были вынуждены направить своих пользователей обратно в автоматизированную систему, функциональность пользовательского интерфейса была эффективно использована операторами для коммуникации адекватных ожиданий автономии ИИ на основе определенных задач, которые позволяли бы пользователям быть отправленными обратно в автоматизированную систему, а не делать это с ожидаемыми разочарованиями. Принципы прагматического дизайна Agentic UX Будучи практикующим дизайнером систем, поддерживающих ИИ в течение многих лет, сегодня я сформулировал некоторые прагматические руководящие принципы, которые помогут мне эффективно разрабатывать агентские UX: Во-первых, дизайн для рабочего процесса, а не для технологии. Пользователи не заботятся о том, помогают ли им ИИ, правила или человеческий интеллект. Они заботятся только о том, могут ли они выполнять свои задачи эффективно и удобно. Начните с обратной инженерии с целевого результата, выявляя области с добавленной стоимостью и добавленной сложностью из-за агентов, поддерживаемых ИИ, а затем остановитесь и продолжайте соответственно. Пользователи должны знать, когда они покидают одну сферу интеллекта и входят в другие сферы, такие как интеллект поиска, интеллект моделей и человеческий интеллект, и установить последовательные визуальные и руководящие принципы взаимодействия соответственно, чтобы они не задумывались, какой ответ они получат и когда они получат его. В идеале системы ИИ должны помочь ускорить принятие решений, принося соответствующую информацию и предлагая курсы действий, но в конечном счете это должны сделать люди, которые обладают контекстом, недоступным для самих систем ИИ. Из-за проектов, которые успешно обеспечили финансирование, увеличили участие определенными увеличениями и обрабатывали число пользователей в тысячах, мы не преуспели, потому что мы владели или пытались создать сложные системы ИИ. Это потому, что мы предоставили этим пользователям, через наш интерфейс, возможность понять, что происходит на их конце этой системы ИИ и, благодаря этому, помогли им доверять ей достаточно, чтобы выполнять все более сложные задачи с течением времени, что действительно сделало их успешными примерами агентического UX.