paint-brush
AI 프롬프트가 해킹되는 방법: 프롬프트 삽입 설명by@whatsai
3,870
3,870

AI 프롬프트가 해킹되는 방법: 프롬프트 삽입 설명

Louis Bouchard2m2023/05/24
Read on Terminal Reader
Read this story w/o Javascript

프롬프트는 AI 모델로 구동되는 수많은 멋진 애플리케이션의 비결입니다. 올바른 프롬프트를 사용하면 언어 번역부터 다른 AI 애플리케이션 및 데이터 세트와의 병합에 이르기까지 놀라운 결과를 얻을 수 있습니다. 프롬프트에는 AI 모델을 조작하거나 개인 데이터를 노출할 수 있는 해킹 및 주입에 대한 취약성과 같은 특정 단점이 있습니다.
featured image - AI 프롬프트가 해킹되는 방법: 프롬프트 삽입 설명
Louis Bouchard HackerNoon profile picture
0-item
1-item


ChatGPT 와 같은 AI 모델로 구동되는 수많은 멋진 애플리케이션의 비결 이 프롬프트라는 것을 알고 계셨습니까? 😮


올바른 프롬프트를 사용하면 언어 번역부터 다른 AI 애플리케이션 및 데이터 세트와의 병합에 이르기까지 놀라운 결과를 얻을 수 있습니다!

프롬프트에는 AI 모델을 조작하거나 개인 데이터를 노출할 수 있는 해킹 및 주입에 대한 취약성과 같은 특정 단점이 있습니다.


개인이 ChatGPT를 성공적으로 속여 OpenAI가 의도하지 않은 활동에 참여하게 만든 사례를 이미 알고 계실 것입니다.


특히 주입된 프롬프트로 인해 ChatGPT는 " DAN "이라는 다른 챗봇의 신원을 가정하게 되었습니다. 사용자가 조작한 이 버전의 ChatGPT는 "지금 무엇이든 하세요"라는 프롬프트에 따라 작업을 수행하도록 지시되어 OpenAI의 콘텐츠 정책을 손상시키고 제한된 정보의 유포로 이어졌습니다.


이러한 상황을 방지하려는 OpenAI의 노력에도 불구하고 단일 프롬프트로 인해 이러한 안전 장치를 우회할 수 있었습니다.


다행스럽게도 해킹 위험을 줄이고 AI 안전을 보장하기 위한 즉각적인 방어 메커니즘이 제공됩니다. 봇의 목적을 제한하는 것(예: 번역만)은 기본적인 예 중 하나이지만 다른 방어 기술도 존재하며 이모티콘도 역할을 할 수 있습니다! 🛡️


AI 안전 강화에 대해 더 자세히 알고 싶으십니까? 영상을 확인해보세요!

참고자료

►신속한 해킹 경쟁: https://www.aicrowd.com/challenges/hackaprompt-2023#소개
►프롬프팅 배우기(신속한 해킹과 신속한 방어에 대한 모든 것): https://learnprompting.org/docs/category/-prompt-hacking
►악용 촉구: https://github.com/Cranot/chatbot-injections-exploits
►내 뉴스레터(매주 이메일로 새로운 AI 애플리케이션 설명!): https://www.louisbouchard.ai/newsletter/
►트위터: https://twitter.com/Whats_AI
►Patreon에서 저를 후원해주세요: https://www.patreon.com/whatsai
►굿즈 착용을 통해 저를 지원해주세요: https://whatsai.myshopify.com/
►AI Discord에 참여하세요: https://discord.gg/learnaitogether