Selam millet!
Eğer yapay zeka altına hücum ise, Nvidia da en iyi kazma ve kürekleme şirketidir. Hesaplama açısından pahalı büyük dil modellerini dağıtmak için gereken çipleri (GPU'ları) yaratan tek şirket olarak hakimiyeti nedeniyle yapay zeka ile ilgili her şey Nvidia'dan geçiyor. Modeller büyüdükçe daha güçlü GPU'lara olan ihtiyaç artıyor ve tüm dünya bunları sağlamak için Nvidia'ya güveniyor. Nvidia'nın yapay zeka ile ilgili her şeyin merkezinde yer aldığını ve yakın zamanda altı aylık geliştirici konferansı GTC'yi (18-21 Mart) düzenlediklerini söylemek abartı olmaz. Bu yazıda, bu çok özel GTC konferansından edindiğim önemli çıkarımları ve bunun AI alanı için ne anlama geldiğini özetleyeceğim.
Yapay zekanın yapabileceklerinin ve sunabileceklerinin gücü, teknoloji dışı sektörlerde de kaybolmadı. Ekonominin tüm sektörlerindeki şirketler, yapay zekayı benimsemeleri ve ortak olmanın, yürütmenin ve önde kalmanın bir yolunu bulmaları gerektiğini düşünüyor. Buradaki kanıt, teknoloji dışı sektör şirketlerinden kaçının Nvidia ile ortaklık kurduğuna bakmaktır. Perakende, otomotiv, inşaat, tasarım ve diğer sektörlerdeki şirketler Nvidia ile ortaklık yaptıklarını duyurdular.
Transformatörlerin icat edilmesinden bu yana, LLM'lerin ölçeğini her 6 ayda bir ikiye katlıyoruz. Örneğin aşağıdaki Open AI modellerinin parametre sayısına bakın.
Yalnızca GPT-3 serisinde parametre sayısı 125M ile 175B arasında değişiyordu. Açık Yapay Zeka'dan çıkması beklenen en son modellerin trilyonun üzerinde parametre sayısına sahip olduğu ve ölçeklendirme hızı devam ederse, iki yıldan kısa bir süre içinde trilyonlara ulaşabileceği söyleniyor. Artan LLM ölçeğini desteklemek için artan hesaplama gücüne ihtiyacımız var. Nvidia, pazarı ele geçirmek için, adını istatistikçi ve matematikçi David Blackwell'den alan, Blackwell adı verilen yeni bir GPU serisini piyasaya sürüyor. Blackwell yeni bir GPU serisidir (GB200) ama aynı zamanda yeni bir süper bilgisayar platformudur.
Burada yeni Blackwell GPU ile önceki nesil GPU Hopper'ın performans karşılaştırmasını bulabilirsiniz.
Mevcut nesil bilgi işlemde her şey, farklı formatlarda saklanan bir veri parçasını almak ve onu kullanıcıya faydalı bir şekilde sunmakla ilgilidir. Ancak gelecek nesil bilgi işlem ve uygulamalarda, kullanıcının isteği üzerine bir şeyler üretilip kullanıcıya geri verildiğini daha fazla görmek üzereyiz. Örneğin chat-gpt durumunda, aldığınız yanıt önceden bir veritabanında saklanmaz, kullanıcının sorusuna hizmet etmek için gerçek zamanlı olarak oluşturulur. Metinlerin, görsellerin, videoların, kimyasalların, proteinlerin ve daha fazlasının ortaya çıktığını görmek üzereyiz.
Çıkarım, chat-gpt'ye bir soru sorduğunuz zaman modelin, jeton oluşturma biçiminde yanıtı bulması ve yanıtı jeton biçiminde döndürmesidir. Çıkarım yeterince hızlı olmazsa tüketiciler hiçbir yapay zeka uygulamasını kullanamayacaktır. Çıkarım yapmak özellikle çetrefilli bir iştir çünkü LLM'ler giderek büyümektedir ve tek bir GPU'ya sığmamaktadır, bu nedenle çıkarımın GPU'lar arasında paralelleştirilmesi zor bir iştir ve Nvidia GPU'larının birden fazla optimizasyon tekniği kullanacak şekilde programlanmasını gerektirir. Blackwell GPU'lar sayesinde Nvidia 30 kat daha yüksek çıkarım hızlarına ulaşabiliyor.
Nvidia'dan Omniverse hakkında daha fazla şey öğrendikçe, ürün ve fikir konusunda giderek daha fazla iyimserim. Bunun nedeni, yapay zekadan gerçekten faydalanmak ve otomasyon ile robot bilimindeki tüm olasılıkların kilidini açmak için aslında ihtiyaç duyulan tüm verilere sahip olmamamızdır. Örneğin, her türden harika yemeği pişiren bir robot yaratmak istediğinizi varsayalım. Şeflerin çeşitli türde yemekler pişirdiğine dair birinci şahıs bakış açısına sahip olduğunuz hiçbir veri yok. YouTube videoları biçiminde çeşitli yemek pişirmeye ilişkin genel verilere sahibiz, ancak robotların yemek pişirmeyle ilgili fiziksel hareketleri öğrenmesini sağlamak için birinci şahıs verilerine ihtiyaç var. Omniverse'teki dünyanın 3 boyutlu simülasyonu, tüm bu kullanım durumlarının kilidini açmak için gereken veri boşluğunun kapatılmasına yardımcı olabilir. Bu fikir konusunda son derece iddialıyım.
Yapay Zekanın 100 Günü'nün 22. Günü bu kadar.
Büyük teknolojide olup biten her şeyin ardındaki ikinci dereceden içgörülerden bahsettiğim Ortalamanın Üstünde adlı bir haber bülteni yazıyorum. Teknolojiyle ilgiliyseniz ve ortalama olmak istemiyorsanız abone olun .
Yapay zekanın 100 gününe ilişkin en son güncellemeler için beni Twitter , LinkedIn veya HackerNoon'da takip edin veya bu sayfayı yer imlerinize ekleyin . Teknolojiyle ilgileniyorsanız, buradaki teknoloji profesyonellerinden oluşan topluluğuma katılmak ilginizi çekebilir.