V HackerNoon si ceníme príbehy o budovaní prelomových technológií. Tieto otázky sa netýkajú len mechaniky AI – sú o inováciách, výzvach a kreativite pri uvádzaní špičkových nástrojov do života, ktoré sa perfektne hodia pre našu komunitu technologických lídrov, staviteľov a čitateľov zameraných na budúcnosť.
Volám sa Aniruth . Pracujem v tíme úložiska v Databricks , kde pracujeme na tom, aby sme zákazníkom umožnili ukladať veľké množstvá údajov v otvorenom, škálovateľnom formáte pomocou našej Data Intelligence Platform. Konkrétne pracujem na našom úsilí o interoperabilitu s Delta Lake a Apache Iceberg.
Aniruth : Databricks zjednocuje údaje a AI, aby zákazníkom poskytol použiteľnú inteligenciu – to, čo nazývame dátová inteligencia. To zahŕňa prijímanie veľkého množstva údajov, ETL, veľkokapacitné úložisko, dotazy business intelligence a pracovné zaťaženie AI. Techniky používané v strojovom učení v poslednom desaťročí existujú už od 80. rokov; Nárast veľkých dát umožnil spúšťať algoritmy vo veľkom rozsahu.
Techniky, ako je niekoľko výstrelov alebo RAG, sa spoliehajú na vysokokvalitné údaje. Modely, ktoré majú lepšie dáta, vyhrávajú nad modelmi s lepšou architektúrou. Databricks investoval značné investície do popredného úsilia v dátovom priestore, pričom je priekopníkom v architektúre Lakehouse s otvorenými dátovými formátmi a otvorenou správou, kde zákazníci môžu získať tie najlepšie prehľady s najlepším výkonom z dátových jazier.
Modely AI používame v produkte mnohými spôsobmi – ako napríklad Llama 3 pre asistenta AI. Veríme v ekosystém otvorených údajov a AI a povzbudzujeme našich zákazníkov, aby používali akýkoľvek model podľa vlastného výberu. Pomáhame zabezpečiť, aby zákazníci mali komplexné riadenie počas celého životného cyklu AI bez ohľadu na modely, ktoré používajú, aby sa mohli sústrediť na to, aby svoje modely vytvorili účelovo pre ich prípady použitia.
Vynaložili sme značné úsilie a investície do uprednostňovania presnosti a nezaujatých odpovedí na používanie AI v rámci našich produktov a naďalej vykonávame časté testovanie.
Dátový a AI priestor sa rýchlo vyvíja, takže je veľmi dôležité udržiavať aktuálne informácie. Môj deň môže zahŕňať rozhovory so zákazníkmi, analýzu trhu, zostavovanie dokumentu s požiadavkami na produkt alebo prípravu marketingových materiálov. Mojou obľúbenou časťou je vytváranie diagramov znázorňujúcich, ako budú veci fungovať, pretože je celkom zábavné premeniť nápad na vizuál.
Čoskoro príde veľa veľkých objavov. Jedna, ktorá ma obzvlášť zaujíma, je hyperpersonalizácia obsahu. Za posledné desaťročie boli reklamy doladené na konkrétneho diváka. Niektoré prvky obsahu boli vyladené, ako napríklad miniatúra, ktorú Netflix zobrazuje používateľovi, ale skutočný obsah (samotné video) nebol. Bude zaujímavé sledovať, ako režiséri/producenti vyvažujú rozprávanie príbehu, ktorý chcú, a záujmy používateľa.
Pracujem na rozsiahlom ukladaní údajov, čo môže byť veľmi mätúce na pochopenie. Máme rôzne optimalizácie údajov umelou inteligenciou, ale často sa vyskytujú otázky o tom, kedy sa tieto optimalizácie spúšťajú, ako fungujú, čo nepokrývajú atď. Pri takýchto otázkach je dôležité zabezpečiť, aby sme mali jasné a konzistentné správy o čo staviame a prečo. Zistil som, že vysvetľovanie príčiny obmedzení u zákazníkov veľmi dobre rezonuje.
Multimodálne modely sa v nasledujúcich rokoch výrazne zlepšia, čo zmení náš primárny spôsob interakcie s AI. Zistenie ľudských emócií je výrazne jednoduchšie z obrazových alebo zvukových informácií v porovnaní s textom. Myslím si, že je tu príležitosť vytvoriť prirodzenejšie interakcie v širšom spektre scenárov.
Zvyčajne chceme vidieť dobrú spätnú väzbu a používanie. Často sa rozprávam so zákazníkmi, aby som pochopil, ako a prečo si myslia o našich produktoch, čo je kľúčové na vysvetlenie, prečo vidíme určité trendy v metrikách.
Rozsiahle dátové produkty sú notoricky náročné na používanie. Jednoduché príklady sa dajú ľahko nastaviť, ale produkčné úlohy zvyčajne zahŕňajú mätúcu konfiguráciu a kód. Bolo pre mňa vysokou prioritou vybudovať funkcie, ktoré zákazníci potrebujú, a zároveň urobiť produkt veľmi jednoduchým na používanie.
Budúcnosť je miesto, kde každá firma ľahko získa prehľad zo svojich údajov. V súčasnom svete sú obchodné poznatky založené na údajoch zvyčajne obmedzené na najväčšie spoločnosti – ale aj tie by uprednostňovali jednoduchší zážitok.
Pokiaľ ide o jednotlivca, som veľmi nadšený integráciou AI do hardvéru. Doteraz sme umelú inteligenciu väčšinou videli v softvérových aplikáciách, ako sú webové stránky. Existuje mnoho väčších aplikácií stavebných zariadení, ktoré využívajú AI, a niektoré z týchto dôsledkov už začíname vidieť v autách a telefónoch.
Databricks je na ceste k tomu, aby sa stal čoraz jednoduchším a zároveň výkonnejším. Vo všeobecnosti pracujeme na mnohých snahách, od zjednodušenia práce s rozsiahlymi údajmi a výpočtovými prostriedkami až po zlepšenie výkonu pri otázkach a pracovných postupoch. Osobne si myslím, že v rámci produktu čoskoro pribudnú niektoré vzrušujúce funkcie, ktoré značne uľahčujú pracovné postupy s AI. Príklady zahŕňajú komentáre k údajom generované AI, návrhy kódu AI v editoroch notebookov a rozhrania AI na chatovanie s údajmi (napríklad Databricks AI/BI Genie).
Existujú obavy, či AI zníži počet pracovných miest. Naše produkty sú navrhnuté tak, aby poskytovali cenné informácie, ktoré často prichádzajú v spojení s používateľmi. Napríklad s AI/BI Genie môžu používatelia vytvárať rozhrania na svojich vlastných údajoch. Toto je magický zážitok, v ktorom môžu používatelia klásť otázky a získať odpovede, ktoré sú pre nich špecifické. V skutočnosti môžu používatelia dokonca skontrolovať používané SQL, aby potvrdili, že je to to, čo hľadajú. Ide o spoluprácu s analytikmi, čím sa skracuje čas, ktorý im trvá prejsť od nápadu k poznaniu.
Jedným veľkým prekvapením pre mňa bola zložitosť, ktorú majú niektoré väčšie spoločnosti. To vnáša do produktu požiadavky, o ktorých by som sám neuvažoval. Bežným príkladom je premýšľanie o migračných stratégiách pri zavádzaní nového produktu. Veľké spoločnosti zvyčajne buď zostavia existujúce technológie (zvyčajne softvér s otvoreným zdrojovým kódom), alebo vytvoria vlastný softvér na vyriešenie problému, ktorý rieši naša nová ponuka produktov. Zvyčajne to chvíľu trvá, kým pochopíte, prečo a ako sú tieto veci spojené, aby sme sa uistili, že máme riešenie, ktoré pokrýva všetky možnosti.
Chceli by ste sa pokúsiť odpovedať na niektoré z týchto otázok?