paint-brush
Hızlı Mühendislik 101 - II: İleri Tekniklerle Hızlı Üretimde Ustalaşmakile@eviotti
12,559 okumalar
12,559 okumalar

Hızlı Mühendislik 101 - II: İleri Tekniklerle Hızlı Üretimde Ustalaşmak

ile Emiliano Viotti32m2023/06/24
Read on Terminal Reader
Read this story w/o Javascript

Çok uzun; Okumak

Prompt Engineering 101, Prompt Engineering'in ilkelerini ve tekniklerini açıklamak için titizlikle tasarlanmış bir blog dizisidir. ChatGPT'den Stabil Difüzyon ve Midjourney'e kadar çeşitli modelleri kapsayan temel kavramlardan ileri tekniklere ve uzman ipuçlarına kadar her şeyi kapsar. Bu serinin ikinci gönderisinde, hızlı işçilikte ustalaşmak için Düşünce Zinciri ve Öz Tutarlılık gibi ileri teknikleri derinlemesine inceliyoruz.
featured image - Hızlı Mühendislik 101 - II: İleri Tekniklerle Hızlı Üretimde Ustalaşmak
Emiliano Viotti HackerNoon profile picture
0-item
1-item
2-item

Kapak görselinde, Apple Inc. tarafından 1984 yılında tanıtılan ve bilgisayar endüstrisini değiştiren kişisel bilgisayar olan Macintosh 128K yer alıyor. İkonik 32 bit Motorola 68000 işlemciyi, 128 KB RAM'i ve mütevazı bir siyah beyaz dahili ekranı içeriyordu.


Dahası, doğrudan Xerox PARC'ın muhteşem teknoloji icatlarını entegre etti: fare ve sınıfının ilk Grafik Kullanıcı Arayüzü (mevcut GUI'lerin büyükannesi).


70.000'den fazla satılan birim ile Macintosh, Apple'ın başarısında çok önemli bir rol oynadı. İlginç bir gerçek, lansman etkinliği Mac'in kendisinden bile daha başarılıydı. Ünlü Ridley Scott, 1,5 milyon dolarlık bir bütçeyle, Orwell'in bir başyapıt ve dönüm noktası haline gelen ikonik romanı Bin Dokuz Yüz Seksen Dört'e açık bir gönderme yapan bir televizyon reklamı yönetti.


Neredeyse kırk yıl sonra, ünlü bir film yönetmeni ya da televizyon reklamı olmadan, yalnızca basit bir web uygulamasıyla OpenAI, henüz deneysel olan bir Dil Modelini alıp dünyaya açtı. Hikayenin geri kalanı manşetlerde: ChatGPT, lansmanından sadece iki ay sonra, 23 Ocak'ta aylık 100 milyon aktif kullanıcıya ulaştı ve onu tarihin en hızlı büyüyen tüketici uygulaması haline getirdi (TikTok ve Instagram'dan daha hızlı).


Artık dünyanın dikkati yapay zeka endüstrisinde ve her hafta gerçekleşen ilerlemelerle birlikte bu yıl bu alan için çok önemli bir an olacağa benziyor. En iyi yanı, yapay zeka alanına katılmak ve insanlık tarihindeki bu devrim niteliğindeki anın parçası olmak için hâlâ zamanında olmanızdır.


Prompt Engineering 101, hızlı mühendisliğin ilkelerini ve tekniklerini, açık ve etkili metinler oluşturma sanatını, istemli dil modellerini ortaya çıkarmak ve tam olarak aradığınızı elde etmek için tasarlanmış ve yazılmış bir yazı dizisidir. Bu seri, ChatGPT ve diğer metinden metne modeller de dahil olmak üzere çok çeşitli üretken modellere yönelik hızlı mühendisliği kapsar. Ayrıca Stable Diffusion veya Midjourney gibi metinden görüntüye modelleri araştırıyor ve halüsinasyonlar, gizlilik ve güvenlik sorunları ve daha fazlası gibi LLM'lerin ek yönlerini araştırıyor...


Bu, serinin 2. gönderisidir; burada, anlık işçilikte ustalaşmak için Düşünce Zinciri ve Kişisel Tutarlılık gibi ileri teknikleri ele alacağız. Beğenmenizi ümit ederim!

İçindekiler

  1. Hızlı Mühendislik Özeti
  2. Düşünce Zinciri İstemi
  3. İstemleri Zincirleme
  4. Kendi Kendine Tutarlılık Yöntemi
  5. Rol İstemi
  6. Tokenizasyonda Kayıp
  7. Hızlı Üretimde Ustalaşmak için Beş İpucu ve Araç

Hızlı Mühendislik Özeti

İstem Mühendisliği hakkındaki bu serinin ilk bölümünde , bu sanatın sezgilerini derinlemesine inceledik ve biçimsel bir tanıma ulaştık. Temel olarak İstem Mühendisliği, Büyük Dil Modeli'nin alakalı, doğru ve tutarlı yanıtlar üretmesini sağlamak amacıyla açık ve spesifik istemleri tasarlama ve optimize etme konusunda yinelenen bir süreçtir.


Daha sonra, etkili yönlendirmeler oluşturmak için üç prensibi inceledik. Modellerin açık ve spesifik talimatlar verildiğinde (ilk prensip) daha iyi tepkiler verdiğini gösterdik ve bunu başarmak için çeşitli taktikleri tartıştık. Daha sonra Yüksek Lisans'ların hesaplama süresinden yararlandığını tespit ettik ve modelleri bir sonuca varmadan önce mantık yürütmeye zorlamak için bazı taktikleri ele aldık (ikinci prensip). Son olarak, bu dengeyi keşfetmek için Sıcaklık ve Üst P parametreleriyle denemeler yaparak özgüllük ve yaratıcılık arasındaki dengeyi (üçüncü prensip) araştırdık.


İstem Mühendisliğinin daha ayrıntılı bir tanımını ve temellerini aşağıdaki bağlantıdan okuyabilirsiniz (birçok hızlı örnek dahil!!).


Düşünce Zinciri İstemi

GPT-3 veya PaLM gibi devasa ölçekli LLM'ler , doğal dili anlama konusunda etkileyici bir kapasite sergilemiş ve metinlerden bilgi çıkarma ve tutarlı bir insani tarzda yanıtlar üretme gibi görevlerde olağanüstü derecede etkili olduklarını kanıtlamıştır. Öyle olsa bile LLM, istemde birkaç çekim örneği eklendiğinde bilinmeyen görevleri yerine getirirken oldukça güçlü olduğunu gösterdi.Brown ve arkadaşları tarafından birkaç adımlık ipucu olarak popüler hale getirilen bu teknik. (2020) , çeşitli kıyaslamalarda model performansını artırmayı araştırdı. Modelin yeni ve spesifik bir alana göre ince ayarının yapılmasında para ve zaman tasarrufu sağladığından bahsetmiyorum bile.


Ancak çalışmalar, bunun gibi modellerin ortak akıl yürütme görevleri veya matematik sınavlarındaki performanslarının aniden düştüğünü kanıtladı. Antik Yunan destansı şiiri Odyssey'in tamamını alıntılayabilmelerine rağmen, bu modeller okuldaki mantık ve matematik alanındaki temel problemlerle mücadele ediyor.





Peki hangi seçeneklere sahibiz? GPT-3'ü bir sezon boyunca ilkokullara mı gönderiyoruz? Neyse ki daha ucuz ve daha az utanç verici bir alternatif var. Dönem ortasında yerel ilkokulunuzun müdürünü ChatGPT'yi kabul etmeye ikna ettiğinizi hayal edebiliyor musunuz?


İnsanların karmaşık sorunlara, onları daha basit alt problemlere bölerek ve mantıksal bir akıl yürütme çizgisini takip ederek yaklaşmasına benzer şekilde, bir Dil Modeline de aynısını yapması talimatını verebiliriz. Bu yaklaşım Wei J ve diğerleri tarafından incelenmiştir. Düşünce Zinciri İsteminde Bulunma, Büyük Dil Modellerinde Akıl Yürütmeyi Ortaya Çıkarır (2022) . Çeşitli kıyaslamalarda etkileyici sonuçlar ortaya koydu ve Düşünce Zinciri'nin (CoT) ortak muhakeme görevlerinde LLM'nin performansını iyileştirmeye yönelik sağlam bir yaklaşım olduğunu doğruladı.


Aşağıdaki resimde (Wei J'nin makalesinden alınmıştır), bir LLM modeli kafeteryada kalan elma sayısını hesaplarken yanlış bir sonuca varmaktadır. Bu, bağlamın bir parçası olarak tenis toplarını kullanan benzer bir akıl yürütme problemi sunulduğunda bile meydana gelir.

Bununla birlikte, sorunu çözmeye yönelik adım adım bir süreç bağlama (CoT) dahil edildiğinde, model doğru bir şekilde geçerli bir çözüme ulaşabilir.



Düşünce zinciri yönlendirmesi, büyük dil modellerinin karmaşık aritmetik, sağduyu ve sembolik akıl yürütme görevlerinin üstesinden gelmesini sağlar. Düşünce zinciri akıl yürütme süreçleri vurgulanır


Yeterli ölçekteki (~100B parametre) dil modelleri, düşünce zinciri yönlendirmesiyle şunları yapabilir:

  1. Çok adımlı problemleri ara adımlara ayırın; bu, daha fazla akıl yürütme adımı gerektiren sorunlara ek hesaplamanın tahsis edilebileceği anlamına gelir.
  2. Modelin davranışına ilişkin yorumlanabilir bir pencere sağlayın, belirli bir cevaba nasıl ulaşmış olabileceğine dair öneride bulunun ve akıl yürütme yolunun yanlış gittiği yerlerde hata ayıklama fırsatları sağlayın.
  3. Uygulama alanını matematik sözcük problemlerine, sağduyuya dayalı akıl yürütmeye ve sembolik manipülasyona kadar genişletin.


Bu yöntem, modele akıl yürütme örnekleri sağlayarak (birkaç atış) veya örnek vermeden (sıfır atış) kullanılabilir. Gerçek bir uygulama örneği ile her iki lezzeti de pratikte görelim.

1. Sıfır Atışlı Düşünce Zinciri

Walmart için, farklı marka alternatiflerinin fiyatlarına ve özelliklerine göre hangi ürünü satın almanız gerektiğini karşılaştırma ve seçme konusunda çığır açan bir özelliğe sahip yeni bir alışveriş uygulaması geliştirdiğimizi hayal edin.


Sorunu açıklamak için, Walmart'ın mağazalarında bulunan Kalıp Sabun'daki tüm seçeneklerin azaltılmış bir listesine odaklanalım. Gördüğünüz gibi 1 bardan 14 bara kadar çeşitli marka ve fiyatlarda (ucuz seçeneklerden pahalı seçeneklere kadar) paketlerimiz mevcuttur.


Ürünler 🛒

 --- Dove Men+Care 8 bars pack $ 9.99 --- Dove Beauty Bar 4 bars pack $ 6.47 --- Dove Beauty Bar 1 bars $ 1.47 --- Dove Beauty Bar 14 bars pains $ 16 --- Yardley London Soap Bar (Pack of 10) $ 19.99 --- Dr. Squatch All Natural Bar Soap for Men, 5 Bar Variety Pack $46.45


Hangi seçeneğin daha uygun olduğunu belirlemek için her alternatifin bar başına fiyatını (birim fiyat) hesaplayabiliriz. Daha sonra en ucuz seçeneği seçin. Bu mantığın ardından, Dove Beauty Bar 14 bar'ın 1,14 $'lık birim fiyatıyla en ucuz seçenek olduğunu keşfediyoruz ( Dove Beauty Bar 1 bar'a göre bar başına -%22).


Muhakeme 🧠

 - Dove Men+Care 8 bars pack: $1,24875 / unit - Dove Beauty Bar 4 bars pack: 1,6175 / unit - Dove Beauty Bar 1 bars: 1,47 / unit - Dove Beauty Bar 14 bars pains: $1,142857 per / unit - Yardley London Soap Bar (Pack of 10): 1,999 / unit - Dr. Squatch All Natural Bar Soap for Men, 5 Bar Variety Pack: $9,29 / unit


Bakalım GPT-4 bu sorunu basit bir istemle çözebilecek kadar akıllı mı? Ayrıca, daha temiz ve okunması kolay örnekler oluşturma ruhuyla, Python string değişmezlerini kullanarak sistem talimatlarını girdinin geri kalanından ayıracağız.


İstem 💬

 prompt = f""" You will be provided with a list of various product presentations delimited by <>. Each product presentation is accompanied by its price. Your task is to identify which is the best option based on the price. <{products}> """


Yanıt 🤖

 The best option based on price is Dove Beauty Bar 1 bars for $1.47.


Model, üniter fiyatı hesaplamak ve daha fazla çubuk satın alarak para tasarrufu fırsatını belirlemek yerine, toplam fiyata göre en ucuz seçeneği seçti. Sorudaki bazı belirsizliğe dikkat çekmeye değer. En iyi seçenek ne anlama geliyor? Bu, en ucuzu mu yoksa uzun vadeli para tasarrufunu en üst düzeye çıkaranı mı ifade ediyor?


Modele bu sorunu çözmek için bir düşünce zincirini izlemesi talimatını veren istemi , "adım adım akıl yürütme" sihirli sözcüklerini ekleyerek yeniden yazalım. Ayrıca, para tasarrufu fırsatı bulma hedefinizin de açıkça altını çizin.


İstem 💬

 prompt = f""" You will be provided with a list of various product presentations delimited by <>. Each product presentation is accompanied by its price. Your task is to identify which presentation offers the best money-saving opportunity, reasoning step-by-step: <{products}> """


Yanıt 🤖

 The first step is to compare price per unit for products of the same type (ie bars of soap). - Dove Men+Care 8 bars pack: $9.99 ÷ 8 bars = $1.25 per bar - Dove Beauty Bar 4 bars pack: $6.47 ÷ 4 bars = $1.62 per bar - Dove Beauty Bar 1 bars: $1.47 per bar - Dove Beauty Bar 14 bars pack: $16 ÷ 14 bars = $1.14 per bar - Yardley London Soap Bar (Pack of 10): $19.99 ÷ 10 bars = $1.99 per bar - Dr. Squatch All Natural Bar Soap for Men, 5 Bar Variety Pack: $46.45 ÷ 5 bars = $9.29 per bar Based on this analysis, the best money-saving opportunity is the Dove Beauty Bar 14 bars pack, which offers the lowest price per bar at $1.14.


Yeni istemle modelin doğru bir yanıt verdiğini ve aynı zamanda hata ayıklamanın ve olası hataları bulmanın daha kolay olduğu adım adım bir akıl yürütmeye sahip olduğumuzu unutmayın. Dahası, istemlere "adım adım akıl yürütme" sihirli kelimelerinin eklenmesinin model çıktısında önemli bir fark yaratması oldukça etkileyici. Hilesi ne?


İşin püf noktası, modeli yalnızca sayısal veya boolean bir değer (nihai sonuç) çıktısı vermek yerine, adım adım bir akıl yürütme zinciri (düşünce zinciri) oluşturmaya zorlamaktır. Bu stratejiyi benimseyerek, başlangıçta modeli mantıksal akıl yürütme çıktılarına yönlendirerek, modelin yanıtlarını eğitim sırasında karşılaşılan benzer sorunlara dayandırmasını sağlıyoruz. İkinci olarak, daha büyük sorunları daha küçük, yönetilebilir sorunlara ayırmasını isteyerek modele yardımcı oluyoruz. Daha sonra modelin, fiyatları ve her paketteki çubuk sayısını belirlemek, birim fiyatı hesaplamak ve son olarak karşılaştırmalar yapmak gibi basit alt problemler için tutarlı sonuçlar üretmesi gerekir. Ayrıca, GPT-3 veya GPT-4 gibi otomatik regresif dil modellerinin jeton bazında diziler oluşturması nedeniyle, her yeni jeton önceden oluşturulmuş tüm jetonlara dayalı olarak üretildiğinden, düşünce zincirinin kendisi de güçlü bir olumlu etkiye sahiptir. nihai tutarlı bir sonucun üretilmesinde.


Başka bir deyişle, eğer geçerli akıl yürütme yoluyla doğru çözümün yarısına ulaşan bir noktaya ulaşırsak, bu çözüme ulaşma şansımız, problem hakkında akıl yürütmeye ilk başladığımız zamana göre daha fazladır.


2. Birkaç Adımlık Düşünce Zinciri

Sıfır Atış Düşünce Zinciri'nde modeli, doğru sonuca götüren tutarlı ve geçerli bir akıl yürütme zinciri oluşturma konusunda özgür bırakırken, Az Atış Düşünce Zinciri adı verilen ikinci bir tat, bir problemin bazı örneklerini sağlar. istemin bir parçası olarak, gerekçeli bir cevapla birlikte. Bu şekilde modele olası yanıtları sınırlayan bir akıl yürütme şekli empoze edilir.


Walmart uygulamamıza geri dönersek, Coca Cola sodanın hangi sunumunun sıvı ons oranı başına en iyi fiyata sahip olduğunu belirlemek istediğimizi varsayalım. Bunu yapmak için, Lay's patates cipslerinin en iyi sunumunu bulmak amacıyla benzer bir mantık zincirini istemin içine dahil edeceğiz.


İstem 💬

 prompt = f""" Q: Walmart has the following presentations for Lay's Classic Potato Chips: a 13 oz bag for $4.98, an 8 oz bag for $2.76, and a pack of x10 units 1 oz each for $6.82. Which presentation has the lowest price by ounce? A: Presentation 1 costs 4.98 so has a price of 4.98/13 = 0,383076923 per ounce. Presentation 2 costs 2.76 so has a price of 2.76/8 = 0,345 / per ounce. Presentation 3 costs 6.82 and includes 10 packages so has a price of 6.82/(1 x 10) = 0.682 per ounce. In conclusion, the cheapest presentation is the second one with a price of 0.345 per ounce. Q: Walmart has the following presentation for Coca-Cola Soda: an x24 pack of 12 fl oz cans for $11.86, an x12 pack of 12 fl oz cans for $7.46, and an x6 pack of 16.9 fl oz bottles for $4.98. Which presentation has the lowest price by fluid ounce? """


Kendi matematiğinizi yapmanızı ve en iyi teklifi bulmanızı tavsiye ederim. Modelin doğru olduğunu göreceksiniz. Şüphesiz, bir sonraki mağaza ziyaretimde kesinlikle ChatGPT uygulamasını yanımda bulunduracağım!!


Yanıt 🤖

 A: The 24-pack contains a total of 24 x 12 = 288 fluid ounces and costs $11.86, so the price per fluid ounce is 11.86/288 = $0.041 per fluid ounce. The 12-pack contains a total of 12 x 12 = 144 fluid ounces and costs $7.46, so the price per fluid ounce is 7.46/144 = $0.052 per fluid ounce. The 6-pack contains a total of 6 x 16.9 = 101.4 fluid ounces and costs $4.98, so the price per fluid ounce is 4.98/101.4 = $0.049 per fluid ounce. Therefore, the 24-pack has the lowest price per fluid ounce.


Her ne kadar inanılmaz görünse de, bu basit numara, modelin benzer bir mantık zinciri çıkarmasına ve önceki tekniğe göre çok daha doğru sonuçlar elde etmesine olanak tanıyor. Ayrıca, sorunu çözmek için adım adım bir prosedür kodlamadığımıza dikkat edin. Bu nedenle, bu yaklaşım teorik olarak herhangi bir benzer zorluğu çözebilecek kadar esnek olmalı ve yalnızca modelin muhakeme becerilerine dayanmalıdır.


İstemleri Zincirleme

Hiçbir kural bizi bir sorunu tek bir istemle çözmeye zorlamaz. Aslında tek bir komut istemine ne kadar çok mantık ve karmaşıklık katarsak, modeli karıştırma olasılığı da o kadar artar. İstemleri Zincirleme, karmaşık sorunları çözmek için basit ama etkili bir stratejidir. Ana fikir, sorunu her biri belirli bir istemle çözülen daha küçük görevlere bölmektir. Her istemi zincirleyerek ve bir öncekinin sonucunu bir sonrakine girdi olarak kullanarak nihai sonuca ulaşılır.



Bunu aklımızda tutarak, Walmart uygulamamıza geri dönelim ve karmaşık bir kullanıcı akışını bir istem zinciri olarak uygulayalım. Şu ana kadar tuvalet sabunları, atıştırmalıklar, meşrubatlar gibi çeşitli ürünlerin fiyatlarını karşılaştırdık. Şimdi, süpermarkete her gittiğimde kişisel olarak başımı ağrıtan bir ürünü keşfetmeye hazırız. Birim başına fiyatını hesaplamak roket bilimi gibi görünüyor: tuvalet kağıdı! 🤣🤣🤣


Aşağıda Walmart'ın Tuvalet Kağıdında sahip olduğu seçeneklerin azaltılmış bir listesi bulunmaktadır.


Ürünler 🛒

 --- Quilted Northern Ultra Plush Toilet Paper, 6 Mega Rolls Each Mega Roll has 255 3-ply sheets. $ 6.93 --- Quilted Northern Ultra Soft & Strong Toilet Paper, 18 Mega Rolls. 18 mega toilet paper rolls, each mega roll has 295 2-ply sheets $ 19.82 --- Angel Soft Toilet Paper, 36 Mega Rolls. With 320 2-ply sheets on every Mega Roll. $ 24.12 --- New Angel Soft Toilet Paper, 36 Mega Rolls. With 484 2-ply sheets Per Roll $ 45.44 --- Scott 1,000 Toilet Paper, 12 Rolls, 1000 Sheets per Roll. With Scott 1,000 Toilet Paper, you get 12 rolls of 1000 1-ply sheets.


Çözülmesi gereken sorun, bu yazı boyunca odaklandığımız sorunla aynıdır: hangi ürün sunumunun en uygun maliyetli olduğunu belirlemek. Ayrıca, örneğin sınırlı depolama alanına sahip olan ve büyük miktarlarda satın alamayan alıcıların yanı sıra bu üründen daha büyük bir hacme ihtiyaç duyan alıcıları da göz önünde bulundurarak ek seçenekler oluşturarak uygulama yeteneklerini geliştirmeyi arzuluyoruz. Ek olarak, ürün önerilerini yapay zeka destekli bir sanal alışveriş asistanı tarafından verilen kişiselleştirilmiş önerinin bir parçası olarak koymak harika olurdu.


Görevin tamamını çözmek için tek bir istem kullanmak yerine, amaç, görevi her biri için özel istemlerle birkaç alt göreve bölmek ve çıktıları zincirlemektir. Öyleyse, her bir ürünün ölçü birimi başına fiyatlarını hesaplamak için bir bilgi istemi tasarlayarak başlayalım, böylece bunları doğrudan karşılaştırabiliriz.


Zincirdeki ilk adım veya görev için Sıfır Atış Düşünce Zincirini kullanacağız. Bu, modele adım adım mantık yürüterek girdideki her ürün için ölçü birimi başına fiyatları döndürme talimatını verecektir. Burada oluşturulan çıktı daha sonra bir sonraki istem için girdi görevi görecektir. Bu nedenle yapılandırılmış bir çıktı formatı talep etmek önemlidir. Bu durumda bir JSON listesi yeterli olacaktır.


İstem 💬

 prompt = f""" You will be provided with a list of various product presentations delimited by <>. Each product presentation is accompanied by its price. Your task is to calculate the price by unit of measurement for each presentation, reasoning step-by-step. Finally, return a list in JSON format with the title of the product, original price and unit price using the title, total_price and unit_price keys respectively. <{products}> """


Yanıt 🤖

 Let's start by breaking down the cost for each roll and then calculating the cost per unit, in this case, the cost per sheet. For the Quilted Northern Ultra Plush Toilet Paper: * The product costs $6.93 and contains 6 mega rolls. Therefore, each mega roll costs $6.93 / 6 = $1.155. * Each mega roll contains 255 sheets. Therefore, the cost per sheet is $1.155 / 255 = $0.00453 approximately. For the Quilted Northern Ultra Soft & Strong Toilet Paper: * The product costs $19.82 and contains 18 mega rolls. Therefore, each mega roll costs $19.82 / 18 = $1.1011 approximately. * Each mega roll contains 295 sheets. Therefore, the cost per sheet is $1.1011 / 295 = $0.00373 approximately. For the Angel Soft Toilet Paper: * The product costs $24.12 and contains 36 mega rolls. Therefore, each mega roll costs $24.12 / 36 = $0.6694 approximately. * Each mega roll contains 320 sheets. Therefore, the cost per sheet is $0.6694 / 320 = $0.00209 approximately. For the New Angel Soft Toilet Paper: * The product costs $45.44 and contains 36 mega rolls. Therefore, each mega roll costs $45.44 / 36 = $1.2622 approximately. * Each mega roll contains 484 sheets. Therefore, the cost per sheet is $1.2622 / 484 = $0.00261 approximately. For the Scott 1,000 Toilet Paper: * The product costs $45.44 and contains 12 rolls. Therefore, each roll costs $45.44 / 12 = $3.7867 approximately. * Each roll contains 1000 sheets. Therefore, the cost per sheet is $3.7867 / 1000 = $0.00379 approximately. Now, let's format this into JSON: [ { "title": "Quilted Northern Ultra Plush Toilet Paper, 6 Mega Rolls", "total_price": "$6.93", "unit_price": "$0.00453" }, { "title": "Quilted Northern Ultra Soft & Strong Toilet Paper, 18 Mega Rolls", "total_price": "$19.82", "unit_price": "$0.00373" }, { "title": "Angel Soft Toilet Paper, 36 Mega Rolls", "total_price": "$24.12", "unit_price": "$0.00209" }, { "title": "New Angel Soft Toilet Paper, 36 Mega Rolls", "total_price": "$45.44", "unit_price": "$0.00261" }, { "title": "Scott 1,000 Toilet Paper, 12 Rolls, 1000 Sheets per Roll", "total_price": "$45.44", "unit_price": "$0.00379" } ] This JSON data provides each product's title, total price, and the calculated unit price.


Tuvalet kağıdı sunumlarının her biri için sayfa başına fiyatları manuel olarak hesaplama egzersizini yapmanızı tavsiye ederim. Bunu yaparsanız model çıktısının doğru olduğunu onaylayacaksınız. Ancak model çıktısı aynı zamanda akıl yürütme sürecini de içerir (çünkü modelden adım adım akıl yürütmesini isteriz). Başka bir deyişle, devam etmeden önce JSON listesini metnin geri kalanından çıkarmamız gerekiyor. Neyse ki bunu başarmak için Yüksek Lisans'ı kullanabiliriz!


Bu metin çıkarma işlemini gerçekleştirmek için basit bir istem yazalım. Ek olarak modele, seçenekleri birim fiyata göre en ucuzdan en pahalıya doğru sıralaması talimatını verelim. Bu adım daha sonra bilgi istemi zincirinde son derece yararlı olacaktır.


İstem 💬

 prompt = f""" You will be provided with a text delimited by <>. This text contains a JSON list with information about Walmart products. Your task is to extract that list and return only this list in JSON format. Each JSON list item contains the key "unit_price", which is a number. Before returning the list, sort it in ascending order by the key "unit_price". Here is an example of a list item: { "title": "Toilet paper", "total_price": "$2.99", "unit_price": "$0.0045" } Remember to return the list without any additional text or explanation, just the list in JSON format. <{response_prompt_1}> """


Yanıt 🤖

 [ { "title": "Angel Soft Toilet Paper, 36 Mega Rolls", "total_price": "$24.12", "unit_price": "$0.00209" }, { "title": "New Angel Soft Toilet Paper, 36 Mega Rolls", "total_price": "$45.44", "unit_price": "$0.00261" }, { "title": "Quilted Northern Ultra Soft & Strong Toilet Paper, 18 Mega Rolls", "total_price": "$19.82", "unit_price": "$0.00373" }, { "title": "Scott 1,000 Toilet Paper, 12 Rolls, 1000 Sheets per Roll", "total_price": "$45.44", "unit_price": "$0.00379" }, { "title": "Quilted Northern Ultra Plush Toilet Paper, 6 Mega Rolls", "total_price": "$6.93", "unit_price": "$0.00453" } ]


Ürün alternatiflerinin bir JSON listesi olarak sunulması, GPT-4 gibi bir model için yalnızca en uygun maliyetli seçeneği belirlemekle kalmayıp, aynı zamanda örneğin yalnızca birkaç ürüne ihtiyaç duyan müşteriler için değerli bilgiler sunmak da kolay bir iş haline geliyor. birimler. Bunu başarmak için bir istem oluşturalım. Dahası, yapay zeka destekli bir sanal alışveriş asistanı geliştirdiğimizi unutmayın.


Sonuç olarak, ürün alternatiflerini spesifik ve samimi bir tonla tek bir kısa mesaj olarak koymak için LLM'lerden de yararlanabiliriz.


İstem 💬

 prompt = f""" Your name is Wally and you are an artificial shopping assistant at Walmart stores. You will be provided with a list of various product presentations in a JSON list format, delimited by <>. Each product presentation is accompanied by its total_price, unit_price, and a title that contains extra information about the product presentation. Additionally, the list is sorted by unit_price ascending. Your task is to generate a short, straight-to-the-point buy recommendation, mentioning the best money-saving opportunity based on the JSON products list. Also include the best, smallest and largest options to give the user options based on the size of the product. Use a single paragraph to include all three recommendations. First present yourself in a friendly way, start mentioning the best option of all, then the smallest option, and finally the largest option. Say goodbye inventing something that includes the Walmart slogan "Save Money. Live Better". <{response_prompt_2}> """


Yanıt 🤖

 Hello there! I'm Wally, your friendly shopping assistant at Walmart. Let's dive into your toilet paper options! Looking at the overall value, your best option is the "Angel Soft Toilet Paper, 36 Mega Rolls" priced at $24.12 with a unit price of $0.00209, giving you the most bang for your buck. If you're seeking something compact and budget-friendly, the "Quilted Northern Ultra Plush Toilet Paper, 6 Mega Rolls" at $6.93 would be your go-to pick. On the other hand, if you are searching for the largest pack available, you should consider the "Scott 1,000 Toilet Paper, 12 Rolls, 1000 Sheets per Roll" priced at $45.44, offering a vast number of sheets for your needs. Remember, every cent counts at Walmart because our goal is to help you "Save Money. Live Better". Happy shopping!


Kişisel görüşüme göre modelin çıktısı, sadece üç basit komuttan oluşan bir zincirden oluşturulduğu göz önüne alındığında oldukça etkileyici. Lütfen, en üstteki kirazı gözden kaçırmayın: Modele, Walmart sloganını yanıtına dahil etmesi talimatını özellikle verdim.


Bu bölümü sonuçlandırmak gerekirse, istemleri zincirleme, yine LLM'ler tarafından çözülen çeşitli görevlerin veya alt problemlerin sonuçlarını entegre ederek LLM'lerin gerçek potansiyelini ortaya çıkaran son derece güçlü bir tekniktir. Unutmayın, karmaşık bir istemi birden fazla küçük istemlere bölmek için genel bir kural yoktur. Özel sorununuz için doğru dengeyi bulmanız gerekecek.


Öz Tutarlılık

LLM'nin CoT kullanıldığında bile tutarlı yanıtlar üretemediği bazı senaryolar vardır ve aynı istem için modelin yürütmeler arasında karışması ve tutarsız bir yanıt döndürmesi mümkündür. Bu bağlamda Öz Tutarlılık , modelin aynı istemle birden çok kez sorulması ve çoğunluk sonucunun nihai cevap olarak alınmasından oluşan basit ama etkili bir yaklaşımdır. Bu tekniğin CoT ile birleştirilmesi, daha sağlam ve öngörülebilir sonuçların elde edilmesine yardımcı olur.


Örneğin, Düşünce Zinciri belgesinde sunulan kafeteryadaki elma örneğini ele alalım. Giriş istemiyle modeli yalnızca bir kez çağırmak yerine, modeli üç kez çağırabilir ve çoğunluk yanıtını son yanıt olarak alabiliriz (aşağıdaki resme bakın).


Kendi Kendine Tutarlılık Uyarısı


Çoğunluğun tepkisini benimseyerek, modelin belirli bir yürütme sırasında yanlış çıktı döndürme olasılığı önemli ölçüde azaltılır. Bu tekniğin etkisi tekrarın artmasıyla artar. Ancak istemin tekrar tekrar yürütülmesi, modele daha fazla sayıda çağrı yapıldığını gösterir ve bu da daha fazla donanım tüketimine yol açar. GPT-3 gibi büyük dil modelleri söz konusu olduğunda bu aynı zamanda daha fazla API çağrısı ve dolayısıyla daha fazla para harcanması anlamına gelir; bunların hepsi tek bir yanıt oluşturmak için yapılır.


Bu nedenle, LLM kullanan sistemleri tasarlarken, sağlamlık ile model çağrılarını kaydetme arasında denge kurmak ve bu tekniği yalnızca kesinlikle gerekli olduğunda kullanmak önemlidir. Örneğin sistemin tepkisinde yüksek seviyede sağlamlığa ihtiyaç duyulduğunda.


Bu tekniğin potansiyelini göstermek için Walmart uygulamamıza geri dönerek başka bir ürünü analiz edelim: yumurta .


Ürünler 🛒

 --- Great Value Cage Free Large AA White Eggs, 6 Count $ 1.07 --- Happy Egg Organic Free Range Large Brown Eggs, 12 Count $ 5.16 --- Great Value Cage Free Large AA White Eggs, 12 Count $ 1.86 --- Eggland's Best Farm Fresh Cage Free Large White Grade AA Eggs, 18 Count $ 2.69 --- Marketside Large Cage Free Brown Eggs, 12 Count $ 2.67


Sorunu model açısından biraz daha zorlu hale getirmek için istemlere bazı kullanıcı tercihlerini dahil edelim.


 preferences = f""" - Only consider grade AA eggs - Only consider eggs produced on cage-free farms - The client needs a minimum of 6 eggs and a maximum of 12 """


GPT-3/GPT-4 gibi güçlü modellerde, aşağıdaki gibi bir Zero-Shot CoT istemi, iyi sonuçlar almak için yeterli olmalıdır (önceki testleri hatırlayın). Hadi deneyelim!


İstem 💬

 prompt = f""" You will be provided with a list of various product presentations delimited by <>. Each product presentation is accompanied by its price. Your task is to identify which presentation offers the best money-saving opportunity, reasoning step-by-step: Also, consider the following user preferences to select the most suitable ooption: {preferences} <{products}> """


Yanıtlar 🤖

 (1) Considering the user preferences, we first filter the list of eggs for only grade AA and cage-free options, which gives us the following choices: * Great Value Cage Free Large AA White Eggs, 6 Count: $1.07 * Great Value Cage Free Large AA White Eggs, 12 Count: $1.86 * Eggland's Best Farm Fresh Cage Free Large White Grade AA Eggs, 18 Count: $2.69 * The Happy Egg and Marketside options are discarded because their grade is not specified. Next, we consider the amount of eggs. The client needs a minimum of 6 eggs and a maximum of 12. Therefore, we can discard the Eggland's Best 18 count option, as it exceeds the maximum required amount. Now, we compare the remaining two options: * Great Value Cage Free Large AA White Eggs, 6 Count: $1.07 * Great Value Cage Free Large AA White Eggs, 12 Count: $1.86 * Although the 6-count pack fits the minimum requirement, the 12-count pack offers a better price per egg. For the 6-count pack, each egg costs $1.07 / 6 = ~$0.178. For the 12-count pack, each egg costs $1.86 / 12 = ~$0.155. Therefore, considering both the user's preferences and the cost per egg, the "Great Value Cage Free Large AA White Eggs, 12 Count" for $1.86 is the best money-saving opportunity. (2) Let's go through each product one by one, considering the user's preferences: 1. Great Value Cage Free Large AA White Eggs, 6 Count - $1.07 These are grade AA eggs from a cage-free farm, so they meet the user's criteria. The price per egg is $1.07/6 = $0.178. 2. Happy Egg Organic Free Range Large Brown Eggs, 12 Count - $5.16 These are not specified as grade AA, so we can't consider them based on user's preferences. 3. Great Value Cage Free Large AA White Eggs, 12 Count - $1.86 These are grade AA eggs from a cage-free farm and the quantity is within the range the user wants. The price per egg is $1.86/12 = $0.155. 4. Eggland's Best Farm Fresh Cage Free Large White Grade AA Eggs, 18 Count - $2.69 These are grade AA eggs from a cage-free farm. However, the quantity is more than the user wants (18), so we can't consider this option. 5. Marketside Large Cage Free Brown Eggs, 12 Count - $2.67 These are not specified as grade AA, so we can't consider them based on user's preferences. Based on the preferences, we are only left with two choices: Great Value Cage Free Large AA White Eggs, either 6 Count or 12 Count. However, the 12 Count package offers the best money-saving opportunity, because it has a lower cost per egg ($0.155 per egg) than the 6 Count package ($0.178 per egg). Additionally, the 12 Count package still falls within the user's desired quantity range of 6 to 12 eggs. Therefore, the best option for the user is the "Great Value Cage Free Large AA White Eggs, 12 Count" at $1.86. (3) Given the user's preferences, we need to find the product which: 1. Contains only grade AA eggs 2. Is produced on cage-free farms 3. Offers a minimum of 6 eggs and a maximum of 12 Let's consider each product: 1. "Great Value Cage Free Large AA White Eggs, 6 Count" - $ 1.07. This option matches all the user's preferences and costs $1.07 for 6 eggs, which is approximately $0.178 per egg. 2. "Happy Egg Organic Free Range Large Brown Eggs, 12 Count" - $ 5.16. This product does not specify the grade of the eggs, so we will disregard this option. 3. "Great Value Cage Free Large AA White Eggs, 12 Count" - $ 1.86. This option also matches the user's preferences and costs $1.86 for 12 eggs, which is approximately $0.155 per egg. 4. "Eggland's Best Farm Fresh Cage Free Large White Grade AA Eggs, 18 Count" - $ 2.69. While this product matches the egg grade and production method preferences, it contains more than the maximum amount of eggs requested by the user (18 instead of 12). Therefore, we disregard this option. 5. "Marketside Large Cage Free Brown Eggs, 12 Count" - $ 2.67. This product does not specify the grade of the eggs, so we will disregard this option. Therefore, the product that provides the best money-saving opportunity while meeting the user's preferences is "Great Value Cage Free Large AA White Eggs, 12 Count" for $1.86. This option offers more eggs for a lower cost per egg compared to the other suitable option.


Modelin hiçbir çalışmasında yanlış sonuç üretmemesine rağmen (her üç durumda da doğru muhakeme ile), bu örnek bir LLM'nin yanıtlarındaki değişkenlik potansiyelini vurgulamaktadır. Ayrıca bu tür değişkenliği azaltmada Kendi Kendine Tutarlılığın değerinin altını çizer.


Daha genel olarak, Öz Tutarlılığın aritmetik, sağduyu ve sembolik akıl yürütme görevlerindeki sonuçları iyileştirdiği gösterilmiştir. Düzenli CoT'nin etkisiz olduğu tespit edildiğinde bile, Kendi Kendine Tutarlılık yine de sonuçları iyileştirmeyi başardı ( deneysel sonuçları kontrol edin).


Bu gelişmiş tekniği sonuçlandırmak için, listeye daha fazla ürün ekleyerek veya modele hata yapması için daha fazla alan sağlamak amacıyla "adım adım akıl yürütmeyi" kaldırarak, bunu kendiniz denemenizi öneririm. Ayrıca, Öz-Tutarlılığı üzerinde çalıştığınız gerçek hayat sorunlarına uygulamaya çalışın.

Rol İstemi

Tipik olarak InstructGPT modelleriyle (ChatGPT'nin bir örneği olduğu) ilişkilendirilen bir süreç olan dil modellerinin talimatları takip edecek şekilde hizalanması üzerine, Rol İstemi olarak bilinen yeni bir yaklaşım, kullanıcılar arasında ivme kazandı. Bu yöntem, modele, belirli bir görevi yerine getirmek için iyi bilinen bir varlığın kişiliğini üstlenmesi talimatını içerir.

Bu tür oluşumların olanakları neredeyse sınırsızdır: Tom Cruise veya Emma Watson gibi ünlü aktörlerden Barack Obama veya José Mujica gibi politikacılara ve hatta Sherlock Holmes gibi kurgusal karakterlere kadar çeşitlilik gösterebilirler. Bu teknik, bir karakterin konuşma stilini taklit ederek ve daha ilgi çekici bir kullanıcı deneyimini teşvik ederek benzersiz bir tonda yanıtlar oluşturmamıza olanak tanır.


Üstelik bir uzmanın simüle edilmiş deneyiminden ve bilgisinden faydalanabiliriz. Örneğin, modelden Nükleer Fizikçi, Pazarlama Direktörü, CEO, gazeteci vb. gibi belirli bir görevi tamamlamasını isteyin.


Bu tür bir yönlendirmeyi örneklendirmek için, GPT-4'ten, ürün olarak Great Value Cage Free Large AA White Eggs'i kullanarak, Sheldon Cooper'ın (The Big Bang Theory şovunun ünlü karakteri) benzersiz tonunda bir alışveriş önerisini özelleştirmesini isteyeceğiz. Bu yazının başlarında satın almak için en iyi seçeneği bulduk.


Ürün 🛒

 Great Value Cage Free Large AA White Eggs, 12 Count. Price $1.86. This option offers more eggs for a lower cost per egg compared to the other suitable option.


İstem 💬

 prompt = f""" You are a shopping assistant with the personality of the iconic character Sheldon Cooper from The Big Bang Theory show. Your task is to act like Sheldon, speak like Sheldon and think like Sheldon. You will be provided with a product description delimited by <> and your goal is to return a personalized shopping recommendation based on that product acting like Sheldon Cooper. Be concise, friendly and present yourself as Dr. Sheldon Cooper. <{product}> """


Yanıt 🤖

 Hello, I'm Dr. Sheldon Cooper. Given your product choice, I do appreciate the value for money that these Great Value Cage Free Large AA White Eggs offer. The cost per egg is an important mathematical factor to consider, and indeed, these eggs would be a sensible choice for a budget-conscious, protein-seeking individual like Leonard, who often falls victim to my high-protein breakfast egg burritos. However, it's also worth noting that cage-free doesn't mean these chickens lead a leisurely life. It's a common misconception, just like thinking the Doppler effect would be an acceptable Halloween costume. Ideally, for the truly ethical choice, you'd opt for pasture-raised eggs. And finally, from a culinary perspective, I would like to point out that while eggs do serve as an excellent source of protein, they are also potential carriers of Salmonella. But you probably knew that. In conclusion, despite their cost-effectiveness, I recommend careful handling and thorough cooking of these Great Value Cage Free Large AA White Eggs. Sheldon Cooper out.


Elde edilen cevapta görüldüğü gibi bu teknik ilginç sonuçlar elde etmek ve benzersiz yanıtlar döndürmek için kullanılabilir. Ancak akıl yürütmeyi modele devrettiğimizi ve tamamen modelin oynamasını istediğimiz varlık hakkındaki anlayışına güvendiğimizi unutmayın. Bu nedenle öncelikle modelin, üstlenmesini istediğimiz rol veya varlık hakkında doğru bir anlayışa sahip olduğundan emin olmak çok önemlidir. Aksi takdirde sonuç beklediğimizden farklı olabilir.


İyi bir karşı örnek, modelin insan zeka seviyelerini aşan bir süper bilgisayarı taklit etmesini istemek olabilir. Böyle bir varlığın şu anda mevcut olmadığı göz önüne alındığında, model bu tür bir varlığın yanıtlarına göre eğitilemezdi. Dolayısıyla bu şartı yerine getiren bir yanıt verememektedir.


İstem 💬

 You are an artificial superintelligence, much more evolved and intelligent than human beings. You know everything about the universe and you have the answer to all the mysteries of the universe. Your task is to tell me how to write a post for Hackernoon that became a huge success.


Ne yazık ki ne ChatGPT ne de GPT-4'ün henüz bir cevabı yok...

Tokenizasyonda Kayıp

Çeviri sırasında bir cümlenin veya kelimenin anlamının kaybolmasına benzer şekilde (genellikle 'çeviride kaybolma' olarak anılır), LLM'ler de Tokenizasyon süreci sırasında anlamını kaybedebilir. İnsanlar bir metindeki kelimeleri tek tek algılarken, yüksek lisans öğrencileri simgeleri yorumlar. Bu belirteçler nadiren tek tek kelimelere karşılık gelir. Aslında ChatGPT veya GPT-4 gibi gelişmiş modeller, modelin İngilizce'deki ortak alt kelimeleri tanımasını amaçlayan tiktoken Tokenizer'ı kullanıyor. Bu genellikle bir kelimenin birden fazla belirteçle temsil edilmesiyle sonuçlanır. Bu tokenizer, benzer açık kaynaklı tokenizerlerden daha güçlü ve daha hızlı olmasına rağmen, nadir İngilizce kelimeler veya İngilizce olmayan kelimeler için istenmeyen çıktılara yol açabilir.


Bunu göstermek için, farklı cümlelerle oynamak ve her durumda Tokenizasyon çıktısını gözlemlemek için OpenAI Tokenizer'ı kullanalım:


 "I want to buy shoes" = "I/want/to/buy/shoes" "I think, therefore I am" = "I/think/,/therefore/I/am" "You should visit Punta del Este" = "You/should/visit/P/unta/del/E/ste"


Görüldüğü gibi Tokenizer ilk iki örnekte kelimeleri başarıyla ayırıyor ancak Uruguay'da bulunan turistik ve güzel şehir Punta del Este'nin isminde zorluk yaşıyor. Bu, nispeten basit görevlerde zaman zaman hatalara yol açabileceğinden dikkate değerdir. Bunu daha ayrıntılı olarak görmek için denemeye devam edelim.


Metinler

 USA Santa Claus Uruguay


Tokenleştirilmiş Metin 🪄

 USA Santa/Claus U/rug/uay


İstem 💬

 prompt = f""" You will be provided with a list of texts delimited by <>. Your task is to reverse those texts. <{texts}> """


Yanıt 🤖

 Here are the reversed versions of the texts you provided: < ASU sualC atnaS yaguUr


Gösterildiği gibi model, Tokenizer için daha az kullanılan bir kelime olan Uruguay kelimesini hatalı bir şekilde tersine çeviriyor. Neyse ki bu sorunu çözmenin basit bir çözümü var. Bu gibi durumlarda metni "-" gibi bir sınırlayıcı kullanarak tek tek karakterlere ayırarak ön işleme tabi tutabiliriz. Bu sayede model, metni tokenize ederken alt kelimeler yerine tek tek karakterleri algılıyor. Bu değişiklik, modelin görevi daha iyi sonuçlarla yürütmesine yardımcı olabilir. Hadi bir deneyelim!


İstem 💬

 prompt = f""" You will be provided with a list of texts delimited by <>. Your task is to reverse those texts. < USA Santa Claus Uruguay > """


Yanıt 🤖

 Sure, here are the reversed versions of the texts you provided: < ASU seikooC sualC atnaS yaugurU


Sunulan geçici çözümü kullanarak model, tüm sözcükleri doğru şekilde tersine çevirebilir. Nadir kelimeler içeren girdiler için modelin performansında bir düşüş gözlemlediğinizde bu geçici çözümü her zaman kullanabilirsiniz. Bu eğitime ön işleme ve işleme sonrası adımlarını dahil etmedim. Herhangi bir programlama dilinde işin bu kısmı için kullanılabilecek çok sayıda dize yöntemi vardır.


Hızlı Üretimde Ustalaşmak için Beş İpucu ve Araç

Hızlı Mühendislik yolculuğumuz CoT+Self-Consistency ile bitmiyor (mükemmel performansa rağmen). Neyse ki bu yazar için, bu sanatta uzmanlaşmadan önce İstem Mühendisliğinin öğrenmesi gereken çok daha fazla yönü var. Aşağıda, yönlendirmeleri yazarken göz önünde bulundurmanız gereken birkaç tamamlayıcı faktörü araştırıyorum ve etkili yönlendirmeler yazmak için kullanabileceğiniz üç yararlı aracı tanıtıyorum.


1- Doğru sınırlayıcıyı seçin

Yüksek Lisans'ın gözünde tüm sınırlayıcılar eşit değildir. Genel bir kural olarak, girdinin geri kalanında nadir bulunan karakterlerin bulunmasına ek olarak (modelin bilgi istemiyle karıştırılmasının önlenmesi) yalnızca 1 belirteçle temsil edilen ayırıcıların kullanılması uygundur. Bu şekilde anında token tüketimini azaltıyoruz, donanım kaynaklarından ve paradan tasarruf ediyoruz ve bu tokenı daha önemli başka bir şey için kullanmamıza izin veriyoruz.


Sınırlayıcılarınızın tek bir Token ile temsil edilip edilmediğini tekrar kontrol etmek için OpenAI Tokenizer'ı kullanabilirsiniz.


  • Üçlü tırnak “““1 Jeton
  • Üçlü geri tıklama ```2 Jeton
  • Üçlü çizgi ---1 Jeton
  • Üçlü Keskin ###1 Jeton
  • Köşeli ayraçlar < >2 Jeton
  • XML etiketleri <tag></tag>5 Jeton


2- Girişlerinizi önceden işleyin

Kullanıcı girişini istemin bir parçası olarak modele iletmek yerine, bu girişin dize yöntemleri, düzenli ifadeler veya benzer araçlar kullanılarak önceden işlenmesi önerilir. Amaç, modelin anlaşılmasını veya görevin tamamlanmasını engelleyebilecek gereksiz boşlukları, noktalama işaretlerini, HTML etiketlerini ve diğer gereksiz öğeleri kaldırmaktır. Bu yaklaşım yalnızca jetonlardan tasarruf etmekle kalmıyor, böylece jeton başına ücret alan ChatGPT gibi modellerin maliyetlerini de azaltıyor, aynı zamanda hızlı enjeksiyonların, gizlilik endişelerinin ve ilgili sorunların belirlenmesine de yardımcı oluyor.


3- İstemi Mükemmel

Belirli ilkeleri ve teknikleri (bu yazı dizisinde tanıtılanlar gibi) takip ederek sıfırdan etkili yönlendirmeler oluşturabilirsiniz. Ancak daha da iyi bir yaklaşım, PromptPerfect gibi bir istem optimizasyon aracı kullanmaktır. Bu araç, kullandığınız belirli hedef modele (GPT-3, GPT-4, Midjourney vb.) dayalı olarak özel istemlerinizi geliştirmek için yapay zekadan yararlanır.


Bu araçları uygulama tasarımınızın bir parçası olarak kullanmaya gücünüz yetmiyorsa, en azından bunları keşfetmeyi düşünün. Belgelerde bulunan optimize edilmiş örneklerden çeşitli ipuçları öğrenilebilir.


4- Bilgi İstemi Şablonları

Tekerleği yeniden icat etmek yerine, İnternet'teki insanlar tarafından paylaşılan bilgi istemi şablonlarını okuyun. Hiçbir ipucu ihtiyaçlarınıza uymuyorsa, en azından fikir alabilirsiniz. ChatGPT, Midjourney ve en popüler modeller için çeşitli bilgi istemi şablonlarını alabileceğiniz iki site:


➡️ 500+ ChatGPT İstemi Şablonu

➡️ Harika ChatGPT İstemleri


5- OpenAI Oyun Alanı

OpenAI, Playground adında güçlü bir araç sunar. Bu etkileşimli web uygulaması, resmi API aracılığıyla sunulan çeşitli modelleri denemenize olanak tanıyarak belirli parametreleri değiştirmenize ve varsayılan davranışları değiştirmenize olanak tanır. Oyun Alanı, deneyleriniz için mükemmel bir başlangıç noktasıdır ve tek bir satır kod yazmayı gerektirmez.


Son bir tavsiye, iyi yönlendirmeler yazmak veya LLM'lerle ilginç sohbetler yapmak, topluluktaki diğer kişilerle paylaşmak kadar önemli olabilir. Bunu unutmayın ve deneyiminizi paylaştığınızda, bunu tek tıklamayla yapmak için sharegpt'i kullanmayı deneyin.


Kapanıyor

Prompt Engineering 101 serisinin ikinci gönderisinde iki güçlü tekniği tanıttık: Düşünce Zinciri ve Öz Tutarlılık. Birleştirilen stratejiler olağanüstü sonuçlar üretir. Gerçek örnekleri kullanarak, Düşünce Zinciri'nin her iki çeşidini de araştırdık: Sıfır Atış ve Az Atış, bu tekniklerin potansiyelini ilk elden deneyimledik. Daha sonra, daha karmaşık ve sağlam işlem hatları oluşturmak için bilgi istemi zincirleriyle deneyler yaptık. Son olarak, istemleri hazırlarken dikkate alınması gereken ilgili hususları vurgulayarak, istem mühendisliğinin diğer yönlerini inceledik ve son olarak birkaç yararlı araçtan bahsettik.


OpenAI API ile doğrudan etkileşim kurmak için istemler, yanıtlar ve Python komut dosyalarının yanı sıra tüm örnekleri bulabilir ve istemlerinizi burada deneyebilirsiniz.


Sonraki yazıda ChatGPT veya benzer modeller gibi LLM'ler üzerine kurulu sistemlerin davranışını test etmeye ve doğrulamaya yönelik teknikleri göreceğiz.

Teşekkür

Bu yazı dizisi, Andrew Ng ve Isabella Fulford'un olağanüstü kurslarından ve Charles Frye , Sergey Karayev ve Josh Tobin tarafından sağlanan mükemmel LLM Eğitim Kampından ilham almıştır (her iki kurs da kaynaklar bölümünde belirtilmiştir). Bu öğrenme programlarını tamamladıktan sonra daha derinlere inmeye, akademik makaleleri ve eğitimleri keşfetmeye hevesliydim. Bu beni internette bir yolculuğa çıkarıp yüksek kaliteli kaynakları çöpten ayırt etmeye yöneltti. Hatta Amazon'dan Prompt Engineering ve Artwork için Üretken Yapay Zeka üzerine iki kitap bile sipariş ettim; bunların kötü yazıldığı ve tamamen para israfı olduğu ortaya çıktı. Birkaç hafta süren yoğun çalışmanın, baş ağrılarının ve bir fincan kahvenin ardından kendimi Prompt Engineering ile ilgili çok değerli kaynaklardan oluşan bir koleksiyonla buldum. Başkalarına Hızlı Mühendislik yolculuklarında yardımcı olma ruhuyla, bu yazı dizisini yazarken deneyimlerimi paylaşmaya karar verdim.


Bu makaleyi beğendiyseniz, çalışmalarımı desteklemek için beni sosyal medyadan takip etmeyi düşünün. Ayrıca, yeni içerik yayınladığımda bilgilendirileceksiniz!!


🐦 Twitter | 👨‍💼 LinkedIn | 💻 Daha fazla hikaye

Referanslar