paint-brush
Yapay Zeka Araştırmasının Ön Planında: Çok Modluluk, Aracılar, Açık Kaynak Yüksek Lisans ve Ötesiile@viceasytiger
1,434 okumalar
1,434 okumalar

Yapay Zeka Araştırmasının Ön Planında: Çok Modluluk, Aracılar, Açık Kaynak Yüksek Lisans ve Ötesi

ile Vik Bogdanov9m2024/07/04
Read on Terminal Reader

Çok uzun; Okumak

Portal.ai'nin CTO'su ve Kurucu Ortağı ve Amazon'un eski Yapay Zeka Araştırma Bilimcisi Hamudi Naanaa ile yapay zeka araştırmalarının bir sonraki sınırlarını keşfediyoruz. Yapay zekanın mevcut durumunu, çok modluluğun ve yapay zeka aracılarının önemini, açık kaynak geliştirmenin önemini ve yapay zekadaki etik zorlukları tartışıyoruz. Naanaa yapay zeka yolculuğunu, yapay zekanın çeşitli endüstriler üzerindeki potansiyel etkisini ve yapay zekanın iş yönetimi uygulamalarını dönüştürmedeki rolünü paylaşıyor. Sorumlu yapay zeka geliştirme ihtiyacını vurguluyor ve kişisel robotlar ve yapay zeka ile birlikte geliştirilen ilaçlar da dahil olmak üzere yapay zekanın gelecekteki heyecan verici olanaklarını vurguluyor.
featured image - Yapay Zeka Araştırmasının Ön Planında: Çok Modluluk, Aracılar, Açık Kaynak Yüksek Lisans ve Ötesi
Vik Bogdanov HackerNoon profile picture
0-item

Kısa süre önce yazarın, 2023'ün yapay zeka açısından çılgın bir yıl olduğunu, kurumsal yönetim kurullarında ve medyada sıcak bir konu olduğunu ve hatta halka açık borsa performansını artırdığını ancak 2024'ün bir keşif ve keşif yılı olacağını savunduğu bir makaleye rastladım. Yapay zekanın mevcut durumunu, potansiyelle dolu ama hala şekilsiz bir "ilkel çorba" aşamasına benzetiyor ve hızlı ve kolay sonuçların peşinde koşarak yapay zekanın keşif aşamasından aktif kullanıma çok hızlı geçtiğimizi iddia ediyor. Artık "sıfırlama düğmesine basma zamanı" ve yapay zekayı anlamlı değer yaratmaya yönelik daha fazla keşfetme zamanı.


Bu makale bende ilgi uyandırdı ve yapay zeka araştırmalarının bugününü ve geleceğini şekillendiren zihinleri anlama konusunda merak uyandırdı. Daha derin içgörüler elde etmek için Portal.ai'nin CTO'su ve Kurucu Ortağı, Amazon'da eski bir Yapay Zeka Araştırma Bilimcisi ve Apple'da Ar-Ge Laboratuvarı Müdürü olan Mohammad (Hamudi) Naanaa ile röportaj yaptım. Konuşmamız, yapay zeka araştırmalarının mevcut durumunu ve bir sonraki sınırlarını, sorumlu ve etik yapay zeka gelişiminin zorluklarını ve fırsatlarını, gölge yapay zekanın potansiyel etkisini, sağlam yapay zeka uzmanlığı oluşturmak için neler gerektiğini ve çok daha fazlasını ele alıyor.


Okumanın tadını çıkarın!


Hamudi, seni yapay zeka araştırma alanına çeken şey neydi ve şu anda hangi spesifik alanları araştırıyorsun?


Yapay zeka yolculuğum üniversite yıllarımda çığır açan AlexNet makalesiyle başladı. Görüntüleri sınıflandırmak için bir model eğitme fikri hayranlık uyandırıcıydı ve geleneksel yazılımlarla ulaşılamaz görünüyordu. Bu karmaşıklıktan ilham alarak sinir ağlarını daha iyi anlamak için yapay zeka araştırmalarına yöneldim. Eğer görüntü sınıflandırmasını çözebilirsek, daha karmaşık veri ve problemlerle başa çıkmamızın ve sonuçta zeka geliştirmemizin an meselesi olacağına dair güçlü bir sezgim vardı. Ben de o yolculuğun bir parçası olmak istedim.


Başlangıçta, üretken yapay zekanın, özellikle de GAN'ların ve yayılma modellerinin yaratıcı olanaklarından etkilenerek bilgisayarlı görme alanına daldım. Daha sonra Transformer kağıdı ile dil modellerinin patlaması dikkatimi çekti ve gerçek yapay zeka hayalini daha da yakınlaştırdı. Bugün, hem metin hem de görsellerde üretken yapay zekanın heyecan verici kesişim noktasındayım.


Yapay zeka keşfinde bir sonraki sınır olarak ne görüyorsunuz?


Şimdi, yıllar sonra bile yapay zekanın potansiyelinin sadece yüzeyini çiziyoruz. Bu çok sıcak bir konu; Pek çok trendin gelip gittiğini görüyorsunuz ve sınırlar her gün şekilleniyor.


Bu sınırda öne çıkan yönlerden biri çok modluluktur . Dünya metinden çok daha fazlasıdır ve metni, görüntüleri, sesi ve daha fazlasını entegre eden doğal çok modlu yapay zekanın parlak bir geleceğini görüyorum. Pek çok büyük yapay zeka şirketi bunu zaten benimsiyor ve çeşitli girdileri destekleyen temel modellerin olduğunu görüyoruz.


Hakkında çok fazla beklenti ve heyecan gördüğüm bir diğer alan da acenteler . Bu sistemler gözlemler, akıl yürütme, durum, eylemler ve yansımayı içeren eksiksiz bir geri bildirim döngüsüne sahiptir. Bugün çoğu LLM tabanlı yapay zekada gördüğümüz "girdi-çıktı" paradigmasının ötesine geçiyorlar.


Giriş-çıkış jeton makineleri gibi transformatör tabanlı mimarilerin "gerçek" zeka için yeterli olup olmadığı konusunda süregelen bir tartışma var.


Temelde yeni mimarileri keşfetmek umut verici ama zorlu bir yön. Transformatörlerin bazı kusurlarını giderebilecek Nöral Turing Makineleri (NTM'ler) veya Diferansiyel Sinir Bilgisayarları (DNC'ler) gibi durum bilgisi olan belleğe özgü mimarilerin bir rönesansını görebiliriz.


Tüm bu gelişmeler robot biliminde devrim yaratacak ve akıllı asistanları beklenenden daha kısa sürede günlük hayatımıza sokacak. Birkaç yıl, hatta daha da kısa bir süre içinde ilk robotların aramızda dolaştığını göreceğimize inanıyorum.


Ancak teknolojiyi geliştirmek başka, onun üzerine faydalı ürünler ortaya çıkarmak başka.


Multimodal ses tabanlı yapay zekanın değeri, kullanıcıların içine duyguları kattıkları son derece kişiselleştirilmiş şarkılar üretebilmesidir. Temel teknoloji aynı, ancak doğru ambalajdaki ürün insanlara güç veriyor. Modellerin daha güvenilir, kontrol edilebilir ve sağlam hale gelmesiyle birlikte yakında pek çok keşfin gerçekleşeceğini görüyorum.


Çok modlu yapay zeka sistemlerinin insanlarla teknoloji arasındaki etkileşimi nasıl değiştirdiğini görüyorsunuz? Çok modlu yapay zekanın en önemli etkiye sahip olacağı belirli endüstriler veya uygulamalar var mı?


Multimodal yapay zeka halihazırda teknolojiyle etkileşim şeklimizi bozuyor. Chatbot'ları ele alalım; bir zamanlar insanların web sitelerinde görmezden geleceği basit metin tabanlı araçlar, artık yeni tasarımların merkezinde karmaşık, çok modlu arayüzlere dönüşüyorlar.


Çok modluluk yeni etkileşim modellerini mümkün kılıyor; Duolingo veya Khan Academy gibi eğitim uygulamalarını kullanın. Yapay zeka ortağınıza metin yazarken dil becerilerinizi geliştirebilmek, sesli sohbette telaffuzunuzu geliştirebilmek veya matematik denklemlerinizi fotoğraflarda gösterebilmek, teknolojiyle daha doğal bir şekilde etkileşim kurmanın tamamen yeni bir yoludur, üretkenliği ve katılımı artırır.


Kullanıcıların farklı uygulamalar arasında gezinmeden talimat verebileceği ve sonuç alabileceği süper uygulamaların ve hatta yeni işletim sistemlerinin olduğu bir gelecek hayal ediyorum.


Örneğin, yemek sipariş etmek için simgelere ve metinlere tıklamak yerine, daha insani bir etkileşim kurmak için konuşabilir, jest yapabilir ve hatta belirli öğelere bakabilirsiniz. Humane AI Pin ve Rabbit R1 gibi ilk benimseyenler umut vaat ediyor ama aynı zamanda öngörülemezliği ve iyileştirmeye açık olduğunu da vurguluyor. Geliştiriciler ve yapay zeka araştırmacıları olarak bu sorunları ele almamız gerekiyor ve bunu yapacağımız konusunda iyimserim.


Çok modlu yapay zeka sistemleri, farklı iletişim biçimleri arasındaki engelleri ortadan kaldırarak teknolojiyle etkileşimde devrim yaratmaya hazırlanıyor. Arayüz oluşturmanın yeni yolunu keşfetmenin henüz başlangıcındayız, ancak ortak bir model zaten göze çarpıyor:


Önceden tanımlanmış etkileşim modellerine sahip mevcut sistemler yeniden keşfedilecek.


Yapay zeka araştırmaları hızla ilerledikçe, yapay zekanın sorumlu bir şekilde geliştirilmesini sağlama ve olası olumsuz etkilerini azaltma konusunda karşılaştığımız en büyük zorluklar nelerdir?


Teknoloji hızla geliştiğinden ve sonuçları hala anlaşıldığından, yapay zekanın etik ortamında gezinmek karmaşık ama bir o kadar da önemlidir. Önyargıları ve istenmeyen sonuçları öngörmeli ve azaltmalıyız.


Bazı zorluklar insan kusurlarıyla ilgili etik sonuçlardan kaynaklanmaktadır. Örneğin yapay zeka yoldaşları oluşturmayı amaçlayan projeler yalnızlıkla mücadeleye yardımcı olabilir. Yine de insanları gerçek hayattaki etkileşimler yerine yapay zekada rahatlık bulmaya teşvik ederek durumu daha da kötüleştirebilirler. Bu durum içerik oluşturucuların uygulamalarının sonuçları ve bunları nasıl ele almaları gerektiği konusunda soruları gündeme getiriyor. Bu, görünüşte basit uygulamalardan kaynaklanan temel soruların yalnızca bir örneğidir ve bırakın onların varlığının yan etkilerini, henüz hayal etmediğimiz çok daha fazlası var.


Oluşturulan görüntülerde insanların çarpık tarihsel temsilleri gibi büyük teknolojideki son olaylar, yapay zeka teknolojisinin hızlı ilerlemesiyle birlikte gelen etik kaygılar ve istenmeyen sonuçlar da dahil olmak üzere önemli zorlukların altını çiziyor.


Basit bir cevap yok, ancak açık kaynak yüksek lisans geliştirme yoluyla şeffaflığın sağlanmasının (hem modelleri hem de eğitim aldıkları verileri ortaya çıkarmak) ve sadece mühendisler ve bilim adamlarını değil, farklı geçmişlere sahip insanları içeren multidisipliner bir yaklaşımı teşvik etmenin kritik öneme sahip olduğuna inanıyorum. Bu zorlukların üstesinden gelmek için adımlar.


Bu soruları sormak tek doğru yaklaşımdır. İnşa edilecek en güçlü teknolojilerin geleceğini şekillendirmekten sorumluyuz. Yapay zekanın yaratıcıları olarak, doğuştan gelen ve potansiyel önyargıları ve bunların nasıl azaltılabileceğini dikkate almalıyız.


Amazon'da geçirdiğiniz zamandan bu yana hangi projelerde veya araştırma çalışmalarında yer aldınız? şu an ne üzerinde çalışıyorsun?


Yapay zekanın büyüsü, onun en yararlı olabileceği lazer odaklı kullanım durumlarını anlamakta yatmaktadır. Amazon'dan ayrıldıktan sonra arkadaşım Vlad Panchenko ile geleceği ve yapay zekanın insanlığa fayda sağlayabileceği çeşitli yolları hayal ederek tartıştım. Bir süredir aracı sistemler oluşturduktan ve bu bilgiyi Vlad'ın başarılı bir seri girişimci olarak deneyimiyle birleştirdikten sonra, yapay zeka aracılarının işletmelere nasıl uygulanabileceğini düşünmeye başladık. Çoğu işletme, başarılı olmak için gereken üst düzey CMO'lara, COO'lara ve diğer uzmanlara erişimden yoksundur. Yapay zeka, istihbarata erişimi benzeri görülmemiş bir ölçekte demokratikleştirebilir. Birlikte, karmaşık iş süreçlerini küçük, tanımlanabilir görevlere ayırmayı, aracıları birleştirilebilen ve birbirleriyle iletişim kurabilen bireysel tuğlalar olarak görmeyi araştırdık. Potansiyel beni heyecanlandırdı ve bu, işletmeleri pazarlamadan lojistiğe kadar günlük operasyonlarında desteklemek ve gerçekten önemli olan şeylere odaklanmalarına olanak sağlamak için birinci sınıf yapay zeka zekası getirme inancından hareketle Portal AI'nın doğuşuna yol açtı.


Yapay zekanın iş yönetimi uygulamalarını nasıl dönüştüreceğini öngörüyorsunuz?


Yapay zeka, tekrarlanan görevleri otomatikleştirerek ve karar almayı geliştirerek iş yönetiminde devrim yaratmaya hazırlanıyor.


Pazarlama, lojistik ve İK işlerinizi yöneten, yaratıcı ve stratejik çalışmalara odaklanmanıza olanak tanıyan bir yapay zeka ortağınız olduğunu hayal edin. Bu dönüşüm, uzman bilgisine erişimi demokratikleştirerek her işletmenin daha yüksek düzeyde faaliyet göstermesine olanak tanıyacak.


Yapay zekanın operasyonları kolaylaştırma yeteneği yalnızca verimliliği artırmakla kalmayacak, aynı zamanda inovasyonu ve büyümeyi de teşvik edecek.


Yapay zeka daha karmaşık hale geldikçe, 'gölge yapay zeka'nın işyeri bütünlüğü ve siber güvenlik gibi alanlar üzerindeki potansiyel etkisi hakkındaki düşünceleriniz neler? Bu potansiyel riskleri nasıl azaltabiliriz?


' Gölge AI ' (yapay zekanın kasıtsız ve çoğu zaman gizli kullanımı) önemli riskler doğurur. Örneğin, sosyal medya algoritmalarıyla oynamak için yapay zekayı kullanan kişiler, yapay zekanın nasıl kötüye kullanılabileceğini vurguluyor. Yapay zeka içeriği internete akın ettikçe bütünlüğü ve güvenliği korumak zorlaşıyor. Etik yapay zeka araştırmaları bu gelişmelere ayak uydurmalı, şeffaflığı ve sağlam koruma önlemlerini desteklemelidir. Bu risklerin ele alınması, sürekli dikkat ve kötüye kullanıma karşı koruma sağlayacak uyarlanabilir stratejiler gerektirir.


Gerçekten aklımızda tutmamız ve tartışmamız gereken pek çok şeyin olduğu bu yeni dönemde buluyoruz kendimizi.


Alanın hızlı gelişimi göz önüne alındığında, en son gelişmelerden nasıl haberdar olursunuz ve yapay zeka konusundaki uzmanlığınızı nasıl sürdürebilirsiniz? Bu hızlı tempolu alanda uzmanlık geliştirmek isteyen birine ne gibi tavsiyelerde bulunursunuz?


Her şey o kadar hızlı hareket ediyor ve değişiyor ki, bu harika. Ancak bu aynı zamanda üç ay içinde bir şeyin güncelliğini yitirme, geçerliliğini yitirme veya modası geçmiş olma ihtimalinin yüksek olduğu anlamına da geliyor. Bu hızlı yineleme döngülerinde sadece bir kitabı okuyup güncel kalmanın yolu yok.


Alanında büyük liderler ve saygın kaynaklar var, dolayısıyla onları takip etmek güncel kalmanıza yardımcı olur. Araştırmayı daha derinlemesine incelemek için Reddit ve Twitter/X gibi platformlardaki ilgili haber bültenlerine ve topluluklara abone oluyorum ve elbette Reddit'teki konularımı özetlemek için yapay zekayı kullanıyorum.


Yapay zeka konusunda uzmanlık kazanmak isteyen biri için birden fazla yol vardır. Araştırmacı olmak istiyorsanız güçlü bir temel oluşturun; yapay zekanın kökleri matematikte derindir ve trendler değişse de temeldeki matematik aynı kalır.


Genel olarak hackathonların büyük bir savunucusuyum. Pek çok yere gittim, birkaçını organize ettim. Ve birçok proje görmem gerekiyor. İnsanların kullanacak yeni bir şeyler öğrenmeleri için harikadırlar. İster bir mühendise, ister ürün müdürüne ya da CEO'ya bir şey önerecek olsaydım, bu şu olurdu: Oraya gidin, bir şeyler inşa etmek isteyen insanlarla tanışın, ellerinizi kirletin ve işi başlatın. Bu, bazı şeyleri gerçekten anlamanın en iyi yoludur çünkü sezgilerinizi geliştirir ve eğlenirsiniz. Meraklı kalın!


20 yıl sonrasına baktığınızda yapay zekanın günlük hayatımızdaki rolünü nasıl görüyorsunuz? Sizi en çok heyecanlandıran şey nedir ve bu geleceğin hangi yönlerini tahmin etmekte en çok zorlanıyorsunuz?


Bu röportajı 20 yıl sonra okumayı gerçekten istiyorum! Yapay zeka o kadar hızlı değişiyor ki, bırakın 20 yılı, 20 ayda ne olacağını tahmin etmek bile zor. Tüm insan zekasını tek bir sistemde birleştirebilmenin ve bilgiye evrensel erişime izin vermenin ilk aşamalarında benzersiz bir andayız. Şu anda eğitim gibi kaynaklar eşit şekilde dağıtılmıyor ve yapay zekanın birçok açıdan evrensel bir dengeleyici olarak burada büyük bir etkisi olacağına inanıyorum.


Robotlara tekrar değinirsek bunun gerçek bir şey olacağını düşünüyorum. Asistanlarımız olarak bizimle birlikte yaşayacak ve tüm ev işlerini üstlenecek kişisel robotlarımız olacak.


Kendi eğitmenlerimiz, koçlarımız ve arkadaşlarımızdan oluşan son derece kişiselleştirilmiş ürünlerimiz olacak. Henüz bu varlıklara bir isim bile vermedik ama bu zaten oluyor.


Beni heyecanlandıran bir diğer şey ise araştırmaların hızlanması. Yapay zeka ile birlikte geliştirilen ilk ilaç veya tedavi ihtimali beni heyecanlandırıyor; ne kadar güzel bir dünya olurdu. Daha iyi bir geleceğe güçlü bir inancım var ve bu geleceği şekillendirmek için elimden gelen her şeyi yapacağım için heyecanlıyım.


LinkedIn profilinize göre Lübnan doğumlusunuz, Ukrayna'da büyümüşsünüz ve Almanya'da eğitimlisiniz: yolculuğunuzu bizimle ve bu farklı kültürel geçmişlerin sizi nasıl şekillendirdiğini paylaşabilir misiniz?


Bu doğru! Lübnan'da doğdum, çocukken Ukrayna'ya taşındım ve orada büyüdüm. Ukrayna beni derinden şekillendirdi. 17 yaşında üniversite için Almanya'ya taşındım, daha sonra ailem de orada yanıma geldi ve kariyerim başladı. Farklı ve eşit derecede güzel toplumlarda yaşarken, onların benzersiz zorluklarını ve fırsatlarını öğrendim.


Yapay zeka araştırmaları şu anda İngilizce konuşma merkezli bir önyargıya sahip; çoğu veri ve sistem İngilizce konuşanlar tarafından ve İngilizce konuşanlar için oluşturuldu. Yapay zekanın evrensel bir dengeleyici olması gerektiğine inandığımızdan, gerçek anlamda evrensel yapay zeka oluşturmak için her dile uyum sağlamamız ve desteklememiz gerekiyor. Beş dil konuşabildiğim için kendimi hepsiyle özdeşleştiriyorum; Lübnanlıyım, Ukraynalıyım ve Almanım. Ben insanım. Bu deneyimler, bizi birbirimize bağlayan ve benzersiz kılan şeyin ne olduğuna dair bana çok değerli bilgiler verdi ve bu bilgiyi tüm çabalarımda yanımda taşıyorum.