O design da experiência do usuário está em constante evolução, mas a atual ascensão da inteligência artificial revolucionou completamente todo o campo. A IA está inaugurando uma nova era de interação com um novo paradigma. As interfaces de usuário tradicionais são baseadas em um padrão de comando e controle, onde os usuários informam ao computador uma série de comandos para realizar algumas tarefas do usuário. No entanto, a IA está a permitir que os utilizadores interajam com os computadores de forma mais natural, dizendo-lhes o que querem e não como o fazer.
Este novo paradigma de interação com IA, conhecido como paradigma baseado em intenções, ainda está em seus estágios iniciais, mas tem o potencial de revolucionar a forma como interagimos com os computadores. Por exemplo, imagine ser capaz de dizer ao seu computador: “Quero reservar um voo para Paris” e fazer com que ele encontre automaticamente os melhores voos e os reserve para você. Ou imagine ser capaz de dizer: “Preciso de ajuda com meus impostos” e ter seu computador orientando você durante o processo passo a passo. Isso abre muitas oportunidades absolutamente novas para projetar UX “definitivo” e torná-lo completamente holístico e contínuo.
A interação baseada na intenção tem seus desafios. Os modelos modernos de aprendizagem de línguas, também conhecidos como LLMs, já são muito bons na compreensão da linguagem natural. No entanto, o estado da IA na UX está longe de ser perfeito, o atual estilo de interação baseado em bate-papo exige que os usuários escrevam seus problemas como texto em prosa, produzindo uma alta carga cognitiva.
Além disso, pode ser difícil projetar UIs intuitivas e fáceis de usar para esse tipo de interação. No entanto, os benefícios potenciais da interação baseada em intenção são significativos e os designers de UX já estão explorando a melhor forma de implementar esse novo paradigma.
Neste artigo, exploraremos o surgimento da interação baseada em intenção e suas implicações para o design UX. Discutiremos os tipos de produtos baseados em IA atualmente existentes, de que forma eles usam padrões de entrada e saída e como são projetados para melhorar a experiência do usuário no ambiente de IA.
Como já descobrimos, o novo desafio para os designers que trabalham com produtos de IA é projetar dentro do paradigma da intenção em primeiro lugar. Quando você pensa em software tradicional, a maneira como você interage com ele é enviar uma cadeia de comandos dentro do sistema para obter a saída desejada. Sua entrada é um comando, pode ser qualquer coisa interativa em sua tela, como botões, menus suspensos, formulários, etc. Combinações de suas ações em sua GUI formam um comando, que o conduz passo a passo em sua jornada.
Após o conjunto de etapas, navegando na arquitetura da informação em um produto, você finalmente obtém uma solução para o seu problema, a saída do sistema. Por exemplo, ao tentar pedir um táxi, você está enviando um conjunto de comandos para escolher um ponto de destino, configurar os parâmetros da viagem e, por fim, enviar um comando para confirmar uma viagem, quando o sistema escolher um motorista para você.
A interação baseada em intenção é reduzida ao sistema de entrada-processamento-saída. Você literalmente dá ao sistema o que deseja obter como resultado (o chamado prompt), o sistema processa sua entrada e fornece uma saída. Todas as etapas do cálculo estão no sistema, você obtém apenas o que precisa. Voltando ao nosso exemplo com o táxi, no sistema baseado em intenção, você só precisa dar o seu aviso, (“Peça um táxi para casa”), e você receberá uma carona.
Este paradigma ainda exigirá comandos em fluxos de trabalho, porque as máquinas podem cometer erros e os humanos às vezes podem querer modificar e controlar uma saída ou usá-la em fluxos diferentes, para melhor configurar o comportamento do sistema de acordo com seus objetivos.
Vamos concordar com essas nomenclaturas, no entanto, quando integramos a IA ao fluxo do usuário, ela pode funcionar de maneira diferente dependendo dos fluxos de trabalho do produto, tarefas, problemas, recursos técnicos e outras limitações. Durante o processo de nossa pesquisa e análise, certos padrões nos produtos são visíveis, vamos dar uma olhada neles. Além disso, diremos como este ou aquele produto usa o padrão de entrada-processamento-saída, quais soluções de UI ele usa e como ele resolve problemas de usabilidade padrão para produtos de IA. Então vamos indo.
Vamos falar sobre o exemplo mais óbvio. O entusiasmo atual em torno da IA é principalmente sobre chatbots e suas capacidades. Nesse padrão, usando LLM, o fluxo de trabalho de IA ocorre por meio de diálogo por meio de uma interface de chatbot. O usuário interage com o chatbot conversando com ele, e o chatbot responde às perguntas e solicitações do usuário. Normalmente, este tipo de fluxo de trabalho pode ser usado para completar uma ampla gama de tarefas e soluções, solicitações mais amplas, estudar novos tópicos, etc.
No entanto, o atual estilo de interação baseado em chat cria uma alta carga cognitiva para os usuários, pois exige que eles escrevam seus problemas como um texto em prosa. Para resolver esse problema, uma nova função foi desenvolvida: o “engenheiro imediato”. Os engenheiros de prompt são responsáveis por obter os resultados corretos do ChatGPT, fornecendo os prompts apropriados. Em outras palavras, os chatbots exigem muita atenção ao seu design de usabilidade.
Os produtos Chatbot geralmente usam padrões de entrada de solicitação de texto. Essa abordagem permite que os usuários digitem e enviem qualquer solicitação na forma de texto ao sistema e escrevam o que quiserem. Ele fornece a possibilidade mais ampla para os resultados de entrada e saída.
O padrão de solicitação do usuário geralmente aparece como um elemento de interface do usuário de campo de texto. Geralmente, em chatbots, ele permanece fixo no lugar.
Em combinação com prompts, prompts pré-escritos também são frequentemente adicionados, reduzindo assim os mal-entendidos e equívocos do usuário sobre o que fazer com este chatbot, fornecendo sugestões e simplificando escolhas.
Além disso, os chatbots muitas vezes sugerem o uso de entrada de voz para preencher o campo de entrada de texto, permitindo usar sua voz em vez da digitação no teclado. Cria um diálogo quase orgânico entre uma pessoa e um computador.
É importante mostrar em que estado o sistema se encontra e como ele processa a solicitação do usuário. Diferentes aplicativos usam abordagens diferentes. A abordagem mais comum em chatbots é a geração de texto em tempo real. Como o algoritmo pode demorar um pouco para entregar um resultado, mostrar a geração de texto em movimento é uma boa prática, permitindo manter a atenção do usuário focada e tornar a transição entre entrada e saída mais perfeita.
Em aplicativos de chatbot, os tipos de saída podem variar bastante. Podem ser textos, imagens (geradas por entrada de texto, por exemplo) ou outros resultados que dependem do tópico alvo da aplicação e de suas funções. É importante que o copywriting de saída reflita a entrada do usuário e o caráter e personalidade desejados do aplicativo (se relevante).
Se você for projetar um chatbot, considere as práticas recomendadas que outros aplicativos já usam.
Múltiplas saídas. Como os resultados do sistema podem ser diferentes e às vezes não de alta qualidade ou o sistema pode interpretar mal a solicitação do usuário, é uma boa prática adicionar a possibilidade de múltiplas saídas para aumentar as chances do sistema adivinhar a consulta que o usuário deseja. ver.
Peça desculpas pela imprecisão. A inteligência artificial dentro do sistema pode produzir resultados incorretos que levam à confusão, conteúdo ofensivo ou sensação de desconforto para o usuário. O sistema pede desculpas por quaisquer possíveis imprecisões que possam surgir.
Este tipo de produto é muito semelhante aos chatbots, alimentados por modelos de aprendizagem de línguas, excepto que o seu posicionamento é restrito a casos de utilização específicos, e podem produzir tipos de resultados muito diferentes, desde imagens a respostas interactivas complexas a perguntas numa indústria específica.
Esses produtos usam IA como fluxo de trabalho principal por meio de interações em tela cheia e formulários passo a passo.
Como já mencionamos, a entrada é semelhante aos padrões de entrada do chatbot, que geralmente se parecem com o campo de prompt de texto. As práticas recomendadas também permanecem semelhantes, como modelos de prompt (para ajudar a iniciar seu processo de pensamento) e entrada de voz.
Além disso, às vezes faz sentido deixar o usuário configurar alguns parâmetros se eles puderem ser aplicados à saída do sistema. Significa o uso de controles deslizantes de critérios e outros padrões de UI padrão, que são familiares ao usuário.
Processando padrões consistentes com outros tipos de fluxo de trabalho, a melhor prática aqui é gerar a saída do sistema de forma simples e em movimento. Mas ao projetar o processamento para fluxos de trabalho que priorizam a IA, preste atenção ao resultado, se for possível mostrá-lo parte por parte. Por exemplo, se uma imagem pode ser mostrada em processo de geração, ou sua tecnologia só permite mostrá-la completa.
Se for esse o caso, considere fornecer mensagens granulares de progresso durante os cálculos.
Em fluxos de trabalho que priorizam a IA, os tipos de saída podem variar de imagens a diferentes estruturas de UI (ou até mesmo elementos de UI dinâmicos), dependendo do que o sistema está tentando fornecer ao usuário e da solução que tenta alcançar.
Ao projetar esse tipo de fluxo de trabalho, considere usar vários resultados de saída, permitir o ajuste fino de uma saída para permitir que o usuário alcance o resultado desejado, permitir novas solicitações e fornecer a possibilidade de adicionar feedback sobre o trabalho do sistema.
Nesse tipo, o fluxo de trabalho de IA é adicionado ao fluxo de trabalho primário existente por meio de gatilhos e ações contextuais. Usando LLM, oferece soluções para tarefas contextuais por meio de vários elementos de UI.
As entradas em fluxos de trabalho contextuais dependem dos tipos de tarefas e podem variar bastante. Pode ser uma entrada de texto, modelos de prompt ou botões para ativar tarefas específicas, como resumo de texto.
Ao usar essa abordagem, considere projetar o processo de ativação/desativação, de que forma o usuário aciona esses prompts ou comandos.
Esse padrão aparece como assistentes guiados que ajudam os usuários a criar prompts detalhados sem escrevê-los e usa diferentes elementos de entrada da interface do usuário, como campos de texto, menus suspensos, botões de opção e outros. Tudo isso se combina em estruturas de formulário, que se adaptam ao contexto da tarefa e permitem dividir um prompt complexo em pequenas partes lógicas, reduzindo a carga do usuário e libertando-o da necessidade de pensar muito no formato do incitar. Isso pode ser especialmente útil quando você tem uma consulta repetida com frequência com a mesma estrutura, então você pode deixar o usuário preencher apenas as partes que mudam, para não se preocupar em escrever um novo prompt toda vez.
Não é de surpreender que os sistemas contextuais exijam uma abordagem contextual para o design do processamento. Novamente, o caminho certo depende muito dos tipos de tarefas que o software deve realizar, mas as práticas gerais permanecem as mesmas. Se possível, mostre a saída dos resultados à medida que são gerados. Caso contrário, mostre a etapa em que o algoritmo está funcionando atualmente e um indicador explícito de processamento (ícone de carregamento ou barra de progresso)
Ao projetar a saída para fluxos de trabalho de IA integrados, permita que um usuário verifique a saída no contexto antes de aplicá-la ao fluxo de trabalho primário. Isso permitirá ao usuário verificar a exatidão do resultado gerado pela inteligência artificial e, em caso de resultados incorretos, excluí-lo ou alterá-lo.
Combine os benefícios das abordagens de interação baseada em comando e baseada em intenção. Dependendo da tarefa, que é a solução do seu produto, permita que os usuários modifiquem e usem a saída fornecida para atingir seus objetivos. Forneça um fluxo tão suave e fácil quanto possível.
Por exemplo, em situações em que há muito texto no corpo, os usuários com problemas cognitivos ou de alfabetização desejam saber o que está contido nesse conteúdo sem ter que ler o texto inteiro. O usuário pode clicar para visualizar uma versão abreviada e simplificada do texto gerado por uma IA.
Também é uma boa prática armazenar e exibir consultas recentes para permitir que você retorne rapidamente a elas, se necessário.
Os fluxos de trabalho de IA invisível podem ser considerados os mais tradicionais. Esses tipos já existem há muito tempo e surgiram muito antes do recente hype dos modelos de linguagem. A IA "invisível" é literalmente invisível porque o sistema processa as ações do usuário em segundo plano. Trabalhando de forma autônoma, os algoritmos de aprendizado de máquina tentam encontrar conteúdo relevante, melhorar as solicitações e calcular e analisar o comportamento. Pontos de contato e interações em sistemas invisíveis são minimizados
Sistemas invisíveis também podem auxiliar os usuários na realização de diversas tarefas, interrompendo seus fluxos de trabalho. Sugestões e adaptação de preenchimento automático em movimento são formas de implementar essa ideia na prática. Os recursos de preenchimento automático que oferecem várias sugestões ao mesmo tempo também são uma forma de reduzir erros e quando o sistema de IA não tem certeza do que o usuário deseja, permitindo que o usuário escolha entre uma lista selecionada em vez de fornecer uma única opção. Ainda assim, preste atenção, mesmo que certas correções alimentadas por IA sejam sensatas, elas ainda podem estar erradas e substituí-las não deve ser difícil. Projetado para permitir aceitar, editar ou rejeitar sugestões de IA.
Ao criar a experiência invisível, certifique-se de que o sistema exiba informações relevantes, com base nas atividades atuais do usuário e priorize recomendações personalizadas. Atualizar recomendações fornecidas com rapidez e frequência.
Mostrar recomendações ao usuário, indicar claramente a fonte dos dados e explicar por que um resultado específico foi previsto ou sugerido.
Permitir que os usuários do sistema de IA expressem suas preferências por meio de interações regulares. Reconheça o feedback dos usuários e informe-os quando os ajustes serão feitos. Em vez de simplesmente agradecer aos usuários, explique como o feedback deles os beneficiará. Isso aumentará a probabilidade de eles fornecerem feedback novamente. Quando um usuário toca no botão de não gostar, o sistema deve fornecer feedback imediato e confirmar que verá menos desse tipo de conteúdo no futuro.
A IA definitivamente mudará a forma como interagimos com os sistemas de computador. No entanto, projetar fluxos de trabalho de IA requer uma consideração cuidadosa do tipo de fluxo de trabalho que está sendo criado e do usuário-alvo. Quer o seu sistema de IA seja baseado em chat, contextual, invisível ou primário, é crucial ter em mente as melhores práticas que surgiram de outros sistemas de IA semelhantes. Fornecer múltiplas opções de saída, pedir desculpas por imprecisões e permitir que os usuários expressem suas preferências são apenas alguns exemplos das melhores práticas que foram estabelecidas. Além disso, é essencial considerar os estágios de entrada, processamento e saída do fluxo de trabalho e projetá-los de forma integrada e fácil de entender para o usuário. Seguindo essas práticas recomendadas e considerando as necessidades exclusivas de seus usuários, você pode criar produtos de IA eficazes, eficientes e fáceis de usar.