Você sabia que é o segredo por trás de inúmeros aplicativos interessantes alimentados por modelos de IA como ? 😮 o prompting o ChatGPT Ter os prompts certos pode gerar resultados surpreendentes, desde traduções de idiomas até a fusão com outros aplicativos e conjuntos de dados de IA! https://twitter.com/sharyph_/status/1658077824849264640?embedable=true A solicitação tem certas desvantagens, como sua vulnerabilidade a hackers e injeções, que podem manipular modelos de IA ou expor dados privados. Você já deve estar familiarizado com casos em que indivíduos enganaram com sucesso o ChatGPT, fazendo com que ele se envolvesse em atividades que o OpenAI não pretendia. Especificamente, um prompt injetado resultou no ChatGPT assumindo a identidade de um chatbot diferente chamado " ". Essa versão do ChatGPT, manipulada pelo usuário, foi instruída a realizar tarefas sob o prompt "Faça qualquer coisa agora", comprometendo a política de conteúdo da OpenAI e levando à disseminação de informações restritas. DAN Apesar dos esforços da OpenAI para evitar tais ocorrências, um único prompt permitiu que essas salvaguardas fossem contornadas. Felizmente, mecanismos de defesa imediatos estão disponíveis para reduzir os riscos de hackers e garantir a segurança da IA. Limitar o propósito de um bot (como apenas traduções) é um exemplo básico, mas existem outras técnicas de defesa e até emojis podem desempenhar um papel! 🛡️ Quer saber mais sobre como melhorar a segurança da IA? Confira o vídeo! https://youtu.be/DW5PX-BWRlg?embedable=true&transcript=true Referências ►Competição rápida de hackers: ►Aprenda prompting (tudo sobre hacking imediato e defesa imediata): ►Prompting exploits: ►Minha Newsletter (Um novo aplicativo AI explicado semanalmente para seus e-mails!): ►Twitter: ►Apoie-me no Patreon: ►Apoie-me usando Merch: ►Junte-se ao nosso Discord de IA: https://www.aicrowd.com/challenges/hackaprompt-2023#introduction https://learnprompting.org/docs/category/-prompt-hacking https://github.com/Cranot/chatbot-injections-exploits https://www.louisbouchard.ai/newsletter/ https://twitter.com/Whats_AI https://www.patreon.com/whatsai https://whatsai.myshopify.com/ https://discord.gg/learnaitogether

Walkthroughs, tutorials, guides, and tips. This story will teach you how to do something new or how to do something better.

The best videos on the Internet archived and shared on HackerNoon.

Watch more on YouTube: https://www.youtube.com/c/WhatsAI

Como os prompts de IA são hackeados: a injeção de prompt explicada

Quer saber mais sobre como melhorar a segurança da IA? Confira o vídeo!

Referências

About Author

Topics

Languages

Around The Web...