"Şeytanın yaptığı en büyük hile, dünyayı var olmadığına inandırmaktı." diyen meşhur sözü duymuşsunuzdur.
Burada teolojik referanslar önemlidir çünkü son zamanlardaki herhangi bir teknolojik gelişmeden daha çok, Üretken Yapay Zeka etrafındaki çılgınlık, bilim veya mühendislikten ziyade dindir.
Bu blogun amacı, bir karşı ağırlık için hype trenine (ben Gary Marcus'u öneriyorum) karşı koymak değil. Bu, şüphesiz tüketiciye satılan yılan yağının eleştirel bir analizidir. Basit bir tezim var. Agentic AI çerçeveleri güvenilmez ve temelde gerçekçi olmayan soyutlamalardır. LLM'leri kullanarak karmaşık, zincirlenmiş ve tekrarlanabilir akışlar oluşturmak bilgi, beceri ve sıkı çalışma gerektirir.
Kısa bir çözüm, tek bir sihirli formül aramak cazip gelebilir; ancak ya raylar düşene kadar bu heyecan trenine binebilir ya da uzun vadeli temelleri inşa edebilirsiniz.
Buğday ile saman arasındaki fark
"Agentic AI, yapay zekada çığır açan bir gelişmedir. Farklı AI tekniklerinin, modellerinin ve yaklaşımlarının bir kombinasyonu, verileri analiz edebilen, hedefler belirleyebilen ve bunlara ulaşmak için harekete geçebilen yeni bir otonom ajan türünü güçlendirir; tüm bunları asgari düzeyde insan denetimiyle yapar. Agentic AI, bu otonom ajanların birçok alanda neredeyse insan bilişine ulaşmasını sağlar ve onları dinamik ortamlarda gelişen ve her etkileşimde sürekli öğrenen ve gelişen sorun çözme makinelerine dönüştürür.
Vay canına. Muhteşem. Akıl almaz.
Tamamen saçmalık... Bir deneyeyim bakalım,
Agentic AI, karmaşık iş akışlarında Generative AI'nın kullanımıdır. LLM'ler tarafından üretilen çıktılar, atanan görevle alakalı olabilir veya olmayabilir. Agentic AI, çıktısının karmaşıklığını, zekasını ve güvenilirliğini, çoğu oldukça soyutlanmış, acemiler tarafından yazılmış ve zar zor işleyen bir sistemle sonuçlanacak olan sistem talimatlarından ve programlamadan devralır.
Agentic AI, deneyimsiz tüketiciler için demolar yapmak için harikadır, ancak sonucun gerçekten önemli olduğu herhangi bir kullanım durumunda uygulamak için genellikle kötüdür. Uzman değilseniz hiç işe yaramayacaktır, ancak neredeyse kesinlikle değilsinizdir.
Açıkça söyleyeyim, Gen AI'ya dair en ufak bir şüphem yok, bence uzmanca kullanılırsa ve henüz var olmayan araçlarla, görevleri gerçekleştirme şeklimizi değiştirecek iş akışları uygulayabiliriz. Belki de AI felaket tellallarının bahsettiği ölçüde değil, ancak kesinlikle birçok çalışma şekli için bir paradigma değişimine yol açacak ölçüde.
Gen AI için ilk öldürücü kullanım örneğinin programlama olması tesadüf değildir çünkü programlama her zaman uygun araçlar ve altyapıya sahip olacak ilk alan olacaktır. Bunun nedeni basittir. Programlama araçları için araçları ve altyapıyı, hımm, programlama ile inşa ediyoruz. Programlama düşük seviyeli bir endişe, mükemmel bir ilk kullanım örneğidir. Ayrıca, bu arada, günler, haftalar, aylar, yıllar ve muhtemelen gelecek nesiller boyunca (eğer 'o' değilse) hala alakalı ve en çok arzulanan yetenek olacak bir beceridir.
Kodlama araçları Gen AI'nın potansiyelini kanıtladı. Kodlama için günlük olarak kullandığım ve (ücretini ödediğim) iki ayrı LLM aracım var çünkü bunlar genellikle yoğun talep ve yeşil altyapı tarafından engelleniyor. Bunları farklı IDE pencerelerinde eş zamanlı olarak kullanıyorum. Bunun nedeni yeni olmaları, dolayısıyla yavaş ve bazen de dengesiz olmaları.
Bunlar böyle bile olsa, iş akışımı devrim niteliğinde değiştirdiler. Bilgisayarımı açtığımda kötü bir gün geçiriyorum ve Claude meşgul oluyor, bu yüzden bunun yerine o1-mini ile konuşuyorum. Ve bu, Gen AI'nın çalışma şeklinizi değiştireceği değişen yolların başlangıcı...
Bu araçlar sıfırdan inşa ediliyor; yepyeni ve henüz güvenilir değiller. Bu heyecan verici çünkü bu bir başlangıç. Yeni bir dalganın ortasındayız. Bu beni bu blogun konusuna getiriyor. Agentic AI'nın yalanı ve aşırılığı.
Karmaşık ve güvenilmez bir API'nin basit bir soyutlaması.
Yıllar önce bir geliştirme ajansı yönetiyordum ve ekibimize yeni mezun bir geliştirici katıldı. Onlara oldukça basit bir görev verdim (PHP'de bir web formu oluşturmak). Düzenli olarak kontrol ederdim.
"Nasıl gidiyor?
"Gerçekten iyi!
Günler ve haftalar geçti ve klavye tık tık tık diye sesler çıkardı. Çok uzun sürüyordu, bu yüzden programcıya gittim ve üzerinde çalıştıkları kodu bana göstermelerini istedim. Binlerce satır koda ulaşan iç içe geçmiş bir forEach döngüsü katmanıydı.
Midem bulandı (müşteri bunu bekliyordu...) ve kelimelerimi kaybettim. Fiziksel bir darbeydi, her şey tıkırındaydı. Rehberlik etmediğim için benim hatam mıydı? Programcı umutsuz bir vaka mıydı? Müşteriye bunun için kimin ödeme yapması gerektiğini ne cehenneme söyleyeceğim? (Zamanı faturalandırdık, sonuçları değil...)
Konudan sapmamın sebebi, karşılaştığım herhangi bir Agentic Framework'ün belgelerini okuduğumda hissettiğim duygunun aynısı olmasıdır. Yalnız değilim.
Belirli bir çerçeveyi ele almak istemiyorum (bunu uygulayamayacağım bir Python Agentic Framework henüz bulamadım), ancak belgeleriniz rollerden, çalışanlardan, patronlardan ve geçmiş hikayelerden bahsetmeye başladığında, tüm konsept bir fantastik roman gibi okunmaya başlıyor.
Sebebi, tüm bunların bir fantezi romanı olmasıdır. Bu, öncü teknoloji üzerine inşa edilmiş, yeni başlayanlar için kutudan çıktığı gibi çalışan devrim niteliğinde ve sofistike bir araçtır. Ve kulağa geldiği kadar karmaşık ve çelişkilidir.
Karmaşık LLM iş akışlarının işe yaramayacağını söylemiyorum; gereken uzmanlığın ve nüans kontrol düzeyinin son derece yüksek olduğunu ve araçlar daha olgunlaşana ve temeller daha sağlam olana kadar 'basit ve erişilebilir' çerçevelerin oluşturulmasının imkansız olduğunu söylüyorum.
Şu anda dünyada (aramızda dolaşsalar da!) güvenilir, karmaşık yinelemeli iş akışları (Gen AI tabanlı olsun veya olmasın!) oluşturma ve sürdürme konusunda uzmanlığa sahip çok az insan var ve bu kişiler Agentic iş akışlarının tanımına uygun çalışıyor ve çoğunluğa satılıyor.
Ama beni rahatsız eden şey şu; bu birkaç öncü, muhtemelen farkında olmadığımız son teknoloji kullanım örnekleri üzerinde çalışıyor. Twitter'da kamuya açık bir şekilde inşa etmiyorlar, bloglar ve nasıl yapılır kılavuzları yazmıyorlar. LinkedIn gönderilerinizi kolayca otomatikleştirebilmeniz için bir çerçeve oluşturmaya odaklanmıyorlar. İşlerini sessizce ve kapalı kapılar ardında yapıyorlar.
Anlıyorum, gerçekten anlıyorum.
İnsanlar, gerçek iş sonuçlarına sahip güvenilir ve karmaşık iş akışları oluşturmalarına olanak tanıyan erişilebilir, kullanımı kolay bir çerçeve istiyor. Birçok şey istiyorum. Yaşam iksiri. Birkaç santimetre daha uzun olmak. Spor kulübümde tenis şampiyonu olmak. Bu aracı çerçevelerin ortalama kullanıcı için işe yaramasından çok, ebedi gençliğe sahip uzun boylu yerel tenis şampiyonu olmam daha olasıdır ve bana ve beni tenis oynarken gören herkese inanın, bunun son derece olası olmadığını söylüyorum.
Agentic framework'ler, HTML için tek bir birleşik standart üzerinde anlaşmaya varmadan önce bir WYSIWYG web sitesi oluşturucusu oluşturma girişimidir. Bunlar erkendir.
Bu atın önüne arabayı koyma olayı değil; bu, elektriği keşfetmeden önce bir roket gemisi inşa etmeye çalışmaktır. Zaten başarılı olmuş fırsatçı bir toprak kapma girişimi.
Kırık bir alet.
İşlevselliği soyutlamanıza izin veren bir araç veya çerçeve sağlamanın sorunu, bir dizi varsayımla gelmesidir. Bir çekiç satın aldığımda, çalışacağını varsayarım. Bir basınçlı temizleyici satın aldığımda, çalışacağını varsayarım.
Sorun şu ki bir framework kullandığımda, işe yarayacağını varsayıyorum. Ancak, altta yatan teknolojinin olgunluğu göz önüne alındığında bu tam anlamıyla imkansız. Agentic Framework'ler, benimsenmeyi artırmaktan çok uzak, tipik kullanıcının elinde asla gerçekten işe yaramayacak olan son derece kontrollü demolar ve sınırlı kullanım örneklerinin üstünde bir yanılsama satıyor (ve milyonlarcası var...).
Verdikleri zarar önemli. Tıpkı günümüzdeki geliştiricilerin javascript öğrenmeden önce React öğrenmesi veya programlama prensiplerini öğrenmeden önce framework'leri benimsemesi gibi. Bir nesil hevesli teknoloji uzmanı 'x' framework'ünü öğrenmek için hype trenine atlıyor. Mesele şu ki; işe yaramayacak (makul bir standarda göre), aslında bir demo veya prototip oluşturmak kendi başına oldukça büyük bir başarı.
Ancak bu, Gen AI veya LLM'lerin "işe yaramadığı" anlamına gelmez, kısa vadede bu varsayım haline gelse bile. Bu, temel teknolojinin üzerine sağlam soyutlamalar güvenli bir şekilde inşa edilebilecek olgunluk seviyesine ulaşmadığımız anlamına gelir. Önce çözülmesi gereken çok fazla sorun var. LLM sağlayıcıları tarafından derinlemesine çözülmesi gereken birkaç temel sorun şunlardır, ancak bunlarla sınırlı değildir:
Gecikme
Kullanılabilirlik
Emniyet
Güvenilir çıktı
Ölçek
Yani evet, dediğim şey, temeldeki API'lerin sıklıkla kullanımdan bunaldığı; yavaş, saldırıya (özellikle ani saldırıya) karşı savunmasız olduğu ve haftalık olarak bozucu değişiklikler getirdiğidir. Gerçek yenilikçiler, bu sorunlar üzerinde kapalı kapılar ardında sıkı bir şekilde çalışmaktadır. Ancak daha fazla ilerleme kaydedene kadar, güvenilir bir üretim sistemi inşa etmekte bol şans, bir çerçeve inşa etmekten çok daha fazlası.
Altta yatan API'leri (bu arada, hepimizin üzerinde çalıştığı gerçek değerli atılımdır) anlamazsanız, bunun üzerine nasıl bir sistem kurabilirsiniz? Bazı API'ler, sınırlamalarını anlamamızı gerektirmez çünkü bunlar sadece çalışan bir kara kutudur. LLM'lerin bu olgunluk seviyesine ulaşması yıllar, hatta bir nesil alacaktır, o zamana kadar "Yalnızca Uzmanlar için Üretim kullanımı" uyarı işaretiyle birlikte gelmelidir.
Kayan kumların üzerine güvenilir bir soyutlama inşa etmek imkansızdır. Aslında bu, bilgisayar programlamanın temel ilkesini bozar. Bilgisayar biliminde soyutlama, daha önemli unsurlardan dikkat dağıtan unsurları kaldırma sürecidir. Düşük seviyeli sistem güvenilir olmadığında yüksek seviyeli ayrıntılara odaklanamayız; nüansları anlamamız ve karmaşık bir paradigma içinde kullanmamız gerekir. Düşük/kodsuz sihirli bir çerçeve değil (fantastik soyutlamalarla).
Bu bizi hayal kırıklığı çukuruna sürüklüyor. Bu, kendi başına bir sorun olmasa da, gerçek değer taşıyan şeyler inşa etmek için alan sağladığı için yine de gözlemlenmesi hayal kırıklığı yaratıyor.
Jura döneminde tekerleğin icat edilmesi.
Agentic AI çerçevelerinin şimdiye kadar yaptığı en büyük hile, sizi gerekli olduklarına ikna etmektir. Onlar LLM manzarasının şeytanıdır.
Hiçbir zaman işe yaramayacak şeyleri gösteren ekiplere, ajanlara, arka plan hikayelerine ve güzel grafik arayüzlere ihtiyacınız yok.
LLM'lerin fantastik romanlardan alınmış hikayeler olmadan anlamanız gereken güçlü araçlar olduğunu anlamalısınız. Hello World ve demo uygulamalarınız elle, kodla oluşturulmalıdır. Nasıl, neden ve ne olduğunu anladığınızda ve Gen AI modellerinin girdilerini ve çıktılarını kontrol edebildiğinizde, dünyaya çıkıp faydalı bir şey inşa etmek için bir temele sahip olacaksınız. Ve muhtemelen biraz zaman alacaktır.
Büyücülerle, yöneticilerle, ajanlarla ve ejderhalarla değil, yapay zekadaki bir atılımın kesin, kesin kullanımlarıyla.
Orijinal yayın tarihi: https://tyingshoelaces.com/blog/agentic-framework-lie