paint-brush
Flujos de trabajo de IA y patrones de diseño de aplicaciones modernaspor@artemivanov
4,231 lecturas
4,231 lecturas

Flujos de trabajo de IA y patrones de diseño de aplicaciones modernas

por Artem Ivanov12m2023/12/08
Read on Terminal Reader

Demasiado Largo; Para Leer

La Inteligencia Artificial está remodelando el diseño de la experiencia del usuario, introduciendo el paradigma de interacción basada en la intención. Las interfaces tradicionales están dando paso a interacciones más naturales, donde los usuarios expresan sus deseos, no órdenes. Los chatbots, los flujos de trabajo primarios de IA, las interacciones contextuales y los sistemas de IA invisibles presentan diversos patrones, cada uno de los cuales requiere consideraciones de diseño únicas. Los diseñadores enfrentan desafíos como la carga cognitiva y la intuición de la interfaz. Al adoptar las mejores prácticas, múltiples opciones de salida, indicaciones contextuales y comentarios de los usuarios, la UX impulsada por IA se esfuerza por lograr fluidez y facilidad de uso. La evolución de la IA en las interacciones de los usuarios promete experiencias transformadoras con una cuidadosa consideración de las etapas de entrada, procesamiento y salida en diversos flujos de trabajo.
featured image - Flujos de trabajo de IA y patrones de diseño de aplicaciones modernas
Artem Ivanov HackerNoon profile picture
0-item


El diseño de la experiencia del usuario evoluciona constantemente, pero el auge actual de la inteligencia artificial ha trastocado por completo todo el campo. La IA está marcando el comienzo de una nueva era de interacción con un nuevo paradigma. Las interfaces de usuario tradicionales se basan en un patrón de comando y control, donde los usuarios le dicen a la computadora una serie de comandos para realizar algunas tareas del usuario. Sin embargo, la IA hace posible que los usuarios interactúen con las computadoras de manera más natural, diciéndoles lo que quieren, no cómo hacerlo.


Este nuevo paradigma de interacción con la IA, conocido como paradigma basado en intenciones, aún se encuentra en sus primeras etapas, pero tiene el potencial de revolucionar la forma en que interactuamos con las computadoras. Por ejemplo, imagine poder decirle a su computadora: "Quiero reservar un vuelo a París" y que automáticamente encuentre los mejores vuelos y los reserve para usted. O imagina poder decir: "Necesito ayuda con mis impuestos" y que tu computadora te guíe paso a paso por el proceso. Abre muchas oportunidades absolutamente nuevas para diseñar UX "definitivo" y hacerlo completamente holístico y fluido.


La interacción basada en la intención no está exenta de desafíos. Los modelos modernos de aprendizaje de idiomas, también conocidos como LLM, ya son muy buenos para comprender el lenguaje natural. Sin embargo, el estado de la IA en UX está lejos de ser perfecto: el estilo actual de interacción basado en chat adolece de requerir que los usuarios escriban sus problemas en forma de texto en prosa, por lo que produce una alta carga cognitiva.


Además, puede resultar difícil diseñar interfaces de usuario que sean intuitivas y fáciles de usar para este tipo de interacción. Sin embargo, los beneficios potenciales de la interacción basada en la intención son significativos y los diseñadores de UX ya están explorando cómo implementar mejor este nuevo paradigma.


En este artículo, exploraremos el auge de la interacción basada en intenciones y sus implicaciones para el diseño de UX. Analizaremos los tipos de productos impulsados por IA que existen actualmente, de qué manera utilizan patrones de entrada y salida, y cómo están diseñados para mejorar la experiencia del usuario en el entorno de IA.


Descripción general del contenido

  • Cómo la IA cambió el trabajo del diseñador
  • Principales tipos de flujos de trabajo de IA en productos
    • Chatbots
    • Primario (IA-primero)
    • Contextual
    • Invisible
  • Conclusión

Cómo la IA cambió el trabajo del diseñador

Como ya descubrimos, el nuevo desafío para los diseñadores que trabajan con productos de IA es diseñar en un marco de paradigma de intención primero. Cuando piensas en el software tradicional, la forma en que interactúas con él es enviando una cadena de comandos dentro del sistema para obtener el resultado deseado. Su entrada es un comando, puede ser cualquier cosa interactiva en su pantalla, como botones, menús desplegables, formularios, etc. Las combinaciones de sus acciones en su GUI forman un comando, que lo guía paso a paso a través de su viaje.


Interacción basada en comandos


Después de una serie de pasos, navegando por la arquitectura de la información en un producto, finalmente obtendrá una solución a su problema, el resultado del sistema. Por ejemplo, cuando intentas pedir un taxi, estás enviando un conjunto de comandos para elegir un punto de destino, configurar los parámetros del viaje y, finalmente, enviar un comando para confirmar un viaje, cuando el sistema elige un conductor por ti.


La interacción basada en la intención se reduce al sistema de entrada-procesamiento-salida. Literalmente le das al sistema lo que quieres obtener en el resultado (el llamado mensaje), el sistema procesa tu entrada y te da una salida. Todos los pasos del cálculo están en el sistema, usted obtiene sólo lo que necesita. Volviendo a nuestro ejemplo con el taxi, en el sistema basado en intenciones, solo necesita dar su mensaje ("Solicite un taxi a casa") y obtendrá un viaje.


Interacción basada en la intención


Este paradigma seguirá requiriendo comandos en los flujos de trabajo, porque las máquinas pueden cometer errores y los humanos a veces pueden querer modificar y controlar una salida o usarla en diferentes flujos, para configurar mejor el comportamiento del sistema según sus objetivos.


Principales tipos de flujos de trabajo de IA en productos

Acordemos estos nombres; sin embargo, cuando integramos la IA en el flujo de usuarios, puede funcionar de manera diferente según los flujos de trabajo del producto, las tareas, los problemas, las características técnicas y otras limitaciones. Durante el proceso de nuestra investigación y análisis, ciertos patrones en los productos son visibles, echémosle un vistazo. Además, le diremos cómo este o aquel producto utiliza el patrón entrada-procesamiento-salida, qué soluciones de interfaz de usuario utiliza y cómo resuelve los problemas de usabilidad estándar para los productos de IA. Así que pongámonos en marcha.


1. Chatbots

Hablemos del ejemplo más obvio. El revuelo actual en torno a la IA se centra principalmente en los chatbots y sus capacidades. En este patrón, al usar LLM, el flujo de trabajo de IA se produce a través del diálogo de ida y vuelta a través de una interfaz de chatbot. El usuario interactúa con el chatbot manteniendo una conversación con él y el chatbot responde a las preguntas e indicaciones del usuario. Por lo general, este tipo de flujo de trabajo se puede utilizar para completar una amplia gama de tareas y soluciones, las solicitudes más amplias, estudiar nuevos temas, etc.


Sin embargo, el estilo actual de interacción basado en chat crea una alta carga cognitiva para los usuarios, ya que les exige escribir sus problemas en forma de texto en prosa. Para abordar esta cuestión, se ha desarrollado un nuevo rol: el "ingeniero rápido". Los ingenieros de avisos son responsables de obtener los resultados correctos de ChatGPT proporcionando los avisos apropiados. En otras palabras, los chatbots requieren mucha atención en su diseño de usabilidad.


ChatGPT es un conocido chatbot y LLM


Pi, otro ejemplo de chatbot móvil


Entradas del chatbot

Los productos de chatbot suelen utilizar patrones de entrada de texto que solicitan. Este enfoque permite a los usuarios escribir y enviar cualquier solicitud en forma de texto al sistema y escribir lo que quieran. Proporciona la más amplia posibilidad para los resultados de entrada y salida.


El patrón de indicaciones al usuario suele aparecer como un elemento de la interfaz de usuario de un campo de texto. En los chatbots normalmente permanece fijo en su lugar.


ChatGPT utiliza un campo de texto, ubicado en la parte inferior de la página.


Mensaje de texto de Google Bard


En combinación con las indicaciones, a menudo también se agregan indicaciones escritas previamente, lo que reduce los malentendidos y las ideas erróneas del usuario sobre qué hacer con este chatbot, brinda sugerencias y simplifica las opciones.


ChatGPT muestra ejemplos de mensajes de usuario al comienzo de un nuevo chat


Además, los chatbots suelen sugerir el uso de la entrada de voz para completar el campo de entrada de texto, permitiendo usar la voz en lugar de escribir con el teclado. Crea un diálogo casi orgánico entre una persona y una computadora.


Por ejemplo, Bard ofrece la posibilidad de ingresar una pista utilizando la entrada de voz del usuario.


Procesamiento de chatbots

Es importante mostrar en qué estado se encuentra el sistema y cómo procesa la solicitud del usuario. Diferentes aplicaciones utilizan diferentes enfoques. El enfoque más común en los chatbots es la generación de texto en tiempo real. Dado que el algoritmo puede tardar un poco en ofrecer un resultado, mostrar la generación de texto sobre la marcha es una buena práctica, ya que le permite mantener la atención del usuario enfocada y hacer que la transición entre la entrada y la salida sea más fluida.


El asistente del chatbot Pi muestra el resultado en el proceso de generación en tiempo real


Salida del chatbot

En las aplicaciones de chatbot, los tipos de resultados pueden variar mucho. Puede ser texto, imágenes (generadas mediante entrada de texto, por ejemplo) u otros resultados que dependen del tema de destino de la aplicación y sus funciones. Es importante que la redacción de salida refleje la entrada del usuario y el carácter y personalidad deseados de la aplicación (si es relevante).


Si vas a diseñar un chatbot, debes considerar las mejores prácticas que ya utilizan otras aplicaciones.


  1. Múltiples salidas. Dado que los resultados del sistema pueden ser diferentes y a veces no de alta calidad o el sistema puede malinterpretar la solicitud del usuario, es una buena práctica agregar la posibilidad de múltiples resultados para aumentar las posibilidades de que el sistema adivine la consulta que el usuario desea. ver.


Bard sugiere que respondan tres borradores del sistema.


Bing Image Generator crea múltiples imágenes en un solo mensaje


  1. Disculpe la inexactitud. La inteligencia artificial dentro del sistema puede producir resultados incorrectos que generen confusión, contenido ofensivo o una sensación de inquietud para el usuario. El sistema se disculpa por cualquier posible imprecisión que pueda surgir.


Bard se disculpa de antemano por resultados potencialmente inexactos


  1. Interacciones guardadas. Recordar acciones recientes de los usuarios dentro del sistema, permitiéndonos consultarlos más fácilmente. Mostrar destinos recientes, búsquedas y otras entradas puede ser un empujón útil para aliviar la carga cognitiva.


Bard muestra el historial de conversaciones recientes.



2. Primario (IA-primero)

Este tipo de producto es muy similar a los chatbots, impulsados por modelos de aprendizaje de idiomas, excepto que su posicionamiento se limita a casos de uso específicos y pueden producir tipos de resultados muy diferentes, desde imágenes hasta respuestas interactivas complejas a preguntas en una industria específica.


Estos productos utilizan la IA como su flujo de trabajo principal a través de interacciones en pantalla completa y formularios por pasos.


Copy.ai parece un chatbot, pero su función principal se reduce a ayudarte a redactar textos de marketing.


La entrada rápida de DALLE ocupa el primer lugar en el flujo de trabajo de los sistemas, pero su salida en forma de generación de imágenes


Entrada para tipo primario

Como ya mencionamos, la entrada se parece a los patrones de entrada del chatbot, que generalmente se parecen al campo de solicitud de texto. Las mejores prácticas también son similares, como las plantillas de indicaciones (para ayudarle a iniciar el proceso de pensamiento) y la entrada de voz.


Campo de solicitud Copy.ai con la posibilidad de configurar parámetros de entrada


Además, a veces tiene sentido dejar que el usuario configure algunos parámetros si se pueden aplicar a la salida del sistema. Significa el uso de controles deslizantes de criterios y otros patrones de interfaz de usuario estándar, que resultan familiares para el usuario.


La aplicación para generar recursos gráficos Recraft utiliza un control deslizante de criterios para configurar el nivel de salida de detalles


Procesamiento para tipo primario.

Al procesar patrones consistentes con los otros tipos de flujo de trabajo, la mejor práctica aquí es generar resultados de sistemas sobre la marcha de manera sencilla. Pero al diseñar el procesamiento para flujos de trabajo que priorizan la IA, preste atención al resultado, si es posible mostrarlo parte por parte. Por ejemplo, si una imagen se puede mostrar en proceso de generación, o tu tecnología solo te permite mostrarla completa.


Si este es el caso, considere proporcionar mensajes de progreso granulares durante los cálculos.


Bing Creator muestra la barra de progreso mientras genera una imagen



Salida para tipo primario

En los flujos de trabajo centrados en la IA, los tipos de salida pueden variar desde imágenes hasta diferentes estructuras de interfaz de usuario (o incluso elementos dinámicos de la interfaz de usuario), dependiendo de lo que el sistema intenta ofrecer al usuario y de la solución que intenta lograr.


Al diseñar este tipo de flujo de trabajo, considere utilizar múltiples resultados de salida, permita ajustar una salida para que el usuario logre el resultado deseado, permita volver a solicitar y brinde la posibilidad de agregar comentarios sobre el trabajo del sistema.


Bing Create muestra varias imágenes desde un solo mensaje


Copy.ai muestra dos botones de pulgar hacia arriba y hacia abajo para calificar una salida desde el lado del usuario


Recraft permite una reprografía infinita de la imagen existente




3. Contextuales

En este tipo, el flujo de trabajo de IA se agrega al flujo de trabajo principal existente a través de activadores y acciones contextuales. Al utilizar LLM, ofrece soluciones a tareas contextuales a través de varios elementos de la interfaz de usuario.


ClickUp sugiere utilizar su asistente de IA en el contexto de las funciones que ya se ofrecen


Linear ofrece sus servicios de IA para crear rápidamente filtrado de datos complejos



Entrada para flujos de trabajo contextuales

Las entradas en los flujos de trabajo contextuales dependen de los tipos de tareas y pueden variar mucho. Puede ser una entrada de texto, plantillas de mensajes o botones para habilitar tareas específicas, como el resumen de texto.


Al utilizar este enfoque, considere diseñar el proceso de activación/desactivación, de qué manera el usuario activa estas indicaciones o comandos.


ClickUp activa su asistente de IA al ingresar IA en el documento y permite elegir entre un conjunto de indicaciones preconstruidas


En las próximas funciones de Dovetail AI, también podrá resumir datos de varias fuentes. Por ejemplo, simplifique una larga conversación de soporte o convierta la transcripción de una entrevista con un cliente de una hora de duración en unos pocos puntos.


Construcción inmediata

Este patrón aparece como asistentes guiados que ayudan a los usuarios a crear indicaciones detalladas sin escribirlas y utiliza diferentes elementos de entrada de la interfaz de usuario, como campos de texto, menús desplegables, botones de opción y otros. Todo esto se combina en estructuras de formulario, que se adaptan al contexto de la tarea y permiten dividir un mensaje complejo en pequeñas partes lógicas, reduciendo la carga para el usuario y liberándolo de la necesidad de pensar mucho en el formato del inmediato. Esto puede ser especialmente útil cuando tiene una consulta repetida con frecuencia con la misma estructura, luego puede permitir que el usuario complete solo las partes que cambian, para no molestarse en escribir un mensaje nuevo cada vez.


ClickUp permite a los usuarios completar el formulario para crear un mensaje detallado debido al contexto de su flujo de trabajo.


Procesamiento para flujos de trabajo contextuales

No sorprende que los sistemas contextuales requieran un enfoque contextual para el diseño del procesamiento. Nuevamente, la forma correcta depende en gran medida de los tipos de tareas que el software debe realizar, pero las prácticas generales siguen siendo las mismas. Si es posible, muestre el resultado de los resultados a medida que se generan. De lo contrario, muestre el paso en el que el algoritmo está funcionando actualmente y un indicador explícito de procesamiento (icono de carga o barra de progreso)


ClickUp AI genera resultados sobre la marcha


Salida para flujos de trabajo contextuales

Al diseñar resultados para flujos de trabajo de IA integrados, permita que un usuario verifique el resultado en el contexto antes de aplicarlo al flujo de trabajo principal. Esto permitirá al usuario verificar la exactitud del resultado generado por la inteligencia artificial y, en caso de resultados incorrectos, eliminarlo o cambiarlo.


ClickUp permite verificar el texto generado antes de que pueda insertarse dentro del documento


Combine los beneficios de los enfoques de interacción basados en comandos y en intenciones. Dependiendo de la tarea que resuelva su producto, permita que los usuarios modifiquen y utilicen el resultado proporcionado para lograr sus objetivos. Proporcione un flujo lo más suave y fácil posible.


Por ejemplo, en situaciones en las que hay mucho cuerpo de texto, los usuarios con problemas cognitivos o de alfabetización quieren saber qué contiene ese contenido sin tener que leer el texto completo. El usuario puede hacer clic para ver una versión abreviada y simplificada del texto generado por una IA.


Bard utiliza un menú desplegable para mostrar posibles modificadores de respuesta, lo que permite acortar o alargar el resultado.


También es una buena práctica almacenar y mostrar consultas recientes para permitirle volver a ellas rápidamente si es necesario.


ClickUp muestra las indicaciones recientes del usuario



4. Invisibles

Los flujos de trabajo de IA invisibles pueden considerarse los más tradicionales. Estos tipos existen desde hace mucho tiempo y aparecieron mucho antes de la reciente exageración de los modelos lingüísticos. La IA "invisible" es literalmente invisible porque el sistema procesa las acciones del usuario en segundo plano. Trabajando de forma autónoma, los algoritmos de aprendizaje automático intentan encontrar contenido relevante, mejorar las indicaciones y calcular y analizar el comportamiento. Se minimizan los puntos de contacto y las interacciones en sistemas invisibles.


Vídeos recomendados por TikTok como ejemplo del flujo de trabajo invisible. Al analizar el comportamiento y el interés del usuario, sus algoritmos de inteligencia artificial predicen qué será lo más interesante para el usuario.


Los sistemas invisibles también pueden ayudar a los usuarios a realizar diversas tareas, interrumpiendo sus flujos de trabajo. Las sugerencias y la adaptación del autocompletado sobre la marcha son formas de implementar esta idea en la práctica. Las funciones de autocompletar que ofrecen múltiples sugerencias a la vez también son una forma de reducir los errores y cuando el sistema de inteligencia artificial no está seguro de lo que quiere un usuario, permitiéndole elegir entre una lista seleccionada en lugar de darle una sola opción. Aún así, preste atención, incluso si ciertas correcciones impulsadas por la IA son sensatas, aún así pueden ser incorrectas y anularlas no debería ser difícil. Diseñado para permitir aceptar, editar o rechazar sugerencias de IA.


Dovetail proporciona sugerencias computarizadas para mostrar etiquetas relevantes para un análisis más rápido, que son fluidas y están relacionadas con la tarea actual, acercándose a los principios de interacción invisible.


Al crear la experiencia invisible, asegúrese de que el sistema muestre información relevante, basada en las actividades actuales del usuario y priorice las recomendaciones personalizadas. La actualización proporcionó recomendaciones de forma rápida y frecuente.


Mostrar recomendaciones al usuario, indicar claramente la fuente de datos y explicar por qué se predijo o sugirió un resultado específico.


Spotify muestra el artista fuente y explica por qué eligió estas listas de reproducción.


Haga posible que los usuarios del sistema de IA expresen sus preferencias a través de interacciones periódicas. Reconozca los comentarios de los usuarios e infórmeles cuando se realizarán ajustes. En lugar de simplemente agradecer a los usuarios, explique cómo les beneficiarán sus comentarios. Esto hará que sea más probable que vuelvan a proporcionar comentarios. Cuando un usuario toca el botón No me gusta, el sistema debería proporcionar comentarios inmediatos y confirmar que verá menos de ese tipo de contenido en el futuro.


El botón Eliminar de Spotify permite a los usuarios aclarar sugerencias, informando al sistema que quieren ver menos canciones similares.


Conclusión

La IA definitivamente cambiará la forma en que interactuamos con los sistemas informáticos. Sin embargo, diseñar flujos de trabajo de IA requiere una consideración cuidadosa del tipo de flujo de trabajo que se crea y el usuario objetivo. Ya sea que su sistema de IA esté basado en chat, sea contextual, invisible o primario, es fundamental tener en cuenta las mejores prácticas que han surgido de otros sistemas de IA similares. Proporcionar múltiples opciones de resultados, disculparse por las imprecisiones y permitir a los usuarios expresar sus preferencias son sólo algunos ejemplos de las mejores prácticas que se han establecido. Además, es esencial considerar las etapas de entrada, procesamiento y salida del flujo de trabajo y diseñarlas de manera que sean fluidas y fáciles de entender para el usuario. Si sigue estas mejores prácticas y considera las necesidades únicas de sus usuarios, podrá crear productos de IA que sean efectivos, eficientes y fáciles de usar.