2026 m. pradžioje „Tesla Model 3“ iš „Tesla Diner“ Los Andžele nuvažiavo į Myrtle Beach, Pietų Karolinos valstiją – 2 732 mylių atstumą. Dvi dienas ir dvidešimt valandų automobilis važiavo tarpvalstybinėmis žemyno arterijomis, susidorojo su chaotišku miesto plyšių susiliejimu ir prijungė save prie „Superchargers“, kuriuos valdė nematoma „Full Self-Driving“ (FSD) ranka v14.2.1 Tai buvo autonominio vairavimo „Kitty Hawk“ momentas, demonstravimas, kad neuroninio tinklo intuicija pagaliau įvaldė atviros kelio srautą. Davidas Mossas Davidas Mossas Vis dėlto tankiose, rūko užpildytose San Francisko gatvėse vyksta kitokia revoliucija. Ten baltieji „Jaguar I-Pace“ su „Waymo“ jutiklių rinkinio sukamaisiais karūnais plaukioja sudėtingose miesto aplinkose be vairuotojo sėdynės. Šios mašinos veikia iš esmės kitokiu principu. Jie ne tik reaguoja, jie planuoja. Jie remiasi apgalvotu, pagrįstu ir patikrintu metodu – palaikoma jutiklių rinkinio, kuris mato pasaulį ne tik kaip pikselius, bet kaip tikslų geometrinį lazerio matuojamos tiesos tinklelį. Vienoje pusėje stovi Tesla, „Maverick“ maištininkas, statydamas namus tik vizijos požiūriu, kuris imituoja žmogaus biologiją: akis (kameras) ir smegenis (neuroninius tinklus). Kitoje pusėje yra Waymo, metodinis titanas, gimęs iš „Google“, dislokuojantis robotų taksi laivyną, pakraunamą sudėtingomis, brangiomis lazeriais ir radarais, lėtai, bet užtikrintai užkariaudamas miestą po miesto. Ši ataskaita yra išsamus šios technologinės lenktynės dėl autonominio vairavimo Gran Turismo ašaros. Mes atversime neuroninius tinklus, išanalizuosime jutiklių fiziką, išnagrinėsime silicio architektūrą ir analizuosime AI pionierių, tokių kaip Andrej Karpathy, įžvalgas. Mes pažvelgsime per rinkodaros hype į dar likusius žalius inžinerinius iššūkius. Nuo „March of Nines“ iki diskusijos tarp „greitos“ intuicijos ir „lėto“ motyvacijos, tai yra galutinis gilus nardymas į rytojaus autonominio vairavimo technologiją. I dalis: Minties architektūra „Sistema 1“ ir „Sistema 2: pažinimo variklis“ Norėdami suprasti, kodėl jūsų automobilis gali vieną dieną vairuoti geriau nei jūs, pirmiausia turime suprasti, kaip Nobelio premijos laureatas Danielis Kahnemanas apibūdino žmogaus pažinimą dviem būdais: 1 sistema ir 2 sistema. Jūs Sistema 1 yra greita, automatiška ir intuityvi.Tai jūsų smegenų dalis, kuri sugauti krentančią puodelį, kol jūs sąmoningai suprantate, kad jis nuslydo, arba dalis, kuri veda jūsų automobilį per pažįstamą greitkelį, o jūsų protas klajoja į tai, ką ketinate padaryti vakarienei. Sistema 2 yra lėta, apgalvota ir logiška.Tai jūsų smegenų dalis, kuri įsitraukia, kai bandote išspręsti sudėtingą matematikos problemą, arba, svarbiausia, kai susiduriate su painiava statybos zona su prieštaraujančiais rankų signalais iš darbuotojo ir policijos pareigūno.Tai reikalauja aktyvaus motyvacijos, būsimų rezultatų modeliavimo ir sąmoningo pasirinkimo. Per pastarąjį dešimtmetį autonominių transporto priemonių (AV) pramonė didžiąja dalimi kuria „System 1“ mašinas.Jie apdoroja jutiklių duomenis ir išvesties valdymo komandas per milisekundes, remiantis išmoktais modeliais.Bet neseniai generuojamojo AI ir didelių kalbų modelių (LLM) atradimai įvedė galimybę „System 2“ galvoti apie automobilius – gebėjimą „pagrįsti“ per kraštutinius atvejus, o ne tiesiog reaguoti į juos.3 „Teslos galinis neuroninis tinklas: intuityvus mokslininkas“ Tesla FSD v14 atstovauja „Sistemos 1“ požiūrio viršūnę, stumiamą iki absoliučios ribos per tai, kas žinoma kaip „apmokymas nuo galo iki galo“ (E2E). tradicinėje robotikos srityje vairavimas buvo suskirstytas į modulines užduotis: suvokimas (ką aš matau?), lokalizacija (kur aš esu?), planavimas (kur turėčiau eiti?), ir kontrolė (kaip aš pasukau ratą?). FSD v12 ir jo įpėdinis v14 pašalino daugiau nei 300 000 eilutės heuristinio C++ kodo, pakeičiant „į taisykles pagrįstą“ logiką milžiniškais neuronų tinklais, apmokytais milijonais vaizdo klipų.5 Kameros į modelį tiekia žalią vaizdo įrašą, o modelis tiesiogiai išleidžia vairavimo ir pedalo komandas. FSD v14 techninė architektūra yra pagrįsta didžiuliu duomenų įsisavinimu ir neuroniniu rodymu.Jis naudoja „Occupancy Networks“, kurie paima 2D vaizdo srautus iš aštuonių kamerų ir realiu laiku atkuria 3D apimtinį pasaulio vaizdą.7 Tai nėra paprastas objektų aptikimo sąrašas; tai yra erdvinis „važiuojamos erdvės“ ir „ kliūties“ supratimas. Šio požiūrio spindesys yra jo skalavimas. Kadangi jis mokosi iš žaliojo vaizdo, jam nereikia aukštos raiškos (HD) žemėlapių. Jam nereikia žinoti tikslios GPS koordinatės bėgių linijoje, kad žinotų, kad ji neturėtų ją kirsti. Jis tiesiog žiūri į kelią ir „intuiuoja“ kelią, kaip ir žmogaus vairuotojas nežinomame kaimo kelyje. Tai leidžia Tesla dislokuoti FSD bet kur, nuo chaotiškų Mumbajus gatvių iki sniego praeinančių Norvegijoje, be išankstinio žemėlapio komandos.8 Tačiau „Sistemos 1“ mokymosi nuo galo iki galo pobūdis taip pat yra Achilo kulnas.Jis yra tikimybinis, o ne deterministinis.Jis imituoja žmogaus elgesį, įskaitant, kartais, žmogaus klaidas.Ir kadangi jam trūksta simbolinio „protingo“ sluoksnio, jis gali stengtis paaiškinti Jis priėmė sprendimą, padarydamas patikrinimą ir saugumo patvirtinimą statistinių tikimybių košmaru, o ne patikrinama logika.9 Tai koreliacijos sistema, nebūtinai priežastinė. Kodėl Ashok Elluswamy, „Tesla“ „Autopilot“ programinės įrangos viceprezidentas, pristatė „Building Foundational Models for Robotics at Tesla“ Tarptautinėje kompiuterinės vizijos konferencijoje (ICCV) 2025 m. Spalio mėn. Ši techninė kalba suteikė mums žvilgsnį į „Tesla FSD“ „System 2“ patobulinimus, padedančius aiškinamumui ir saugumui per „mąstymo grandinės ir procesų patikrinimą“. 3D užimtumas ir srautas Daiktai, tokie kaip transporto priemonės, pėstieji, dviratininkai ir kt. eismo kontrolė Kelių sienos, keliai ir semantika Greičio apribojimai ir kiti kelio požymiai Sprendimai, išreikšti kaip paprasta kalba „Waymo“ hibridinė architektūra: apgalvotas profesorius "Waymo" ėmėsi iš esmės kitokio architektūrinio kelio. nors jie daug naudoja gilų mokymąsi suvokimui ir prognozavimui, jų planavimo ir valdymo sluoksniai istoriškai buvo labiau struktūrizuoti, remdamiesi moduliniu vamzdynu, kuris leidžia griežtas saugos garantijas. Tačiau „Waymo“ neignoruoja AI revoliucijos. „System 2“ komponentas yra aiškiai integruotas į naujausią šeštosios kartos tvarkyklę. „Waymo“ naudoja „Vision-Language-Action“ (VLA) modelį – daugiarūšio AI tipą, kuris gali apdoroti vizualinius duomenis ir „pagalvoti“ apie tai, naudojant kalbos galimybes. „Waymo“ architektūra išskiria skirtumą: Greita sistema (Sistema 1): jutiklių sintezės kodavimas, kuris reaguoja per milisekundes į automobilius, kurie pjauna, arba pėsčiuosius, kurie nusileidžia nuo kliūčių.Tai apdoroja 99% vairavimo, kuris yra įprastas.Šis sluoksnis sujungia fotoaparatą, LiDAR ir radaro įvestis į nuoseklų pasaulio būsenos vektorių.10 Lėta sistema (Sistema 2): Vairuojanti VLM (Visual Language Model), apmokyta Gemini gebėjimų. Ši sistema užsiima sudėtingu, semantiniu motyvu. Pavyzdžiui, jei Waymo transporto priemonė susiduria su deginančiu automobiliu kelyje, „greita“ sistema gali matyti tik kliūtį. „Lėta“ VLM supranta „ugnį“, „pavojų“ ir „avarinius darbuotojus“ ir gali pagrįsti, kad ji turėtų ne tik sustoti, bet galbūt atlikti U-versą arba sekti nestandartinius policijos pareigūno rankinius signalus.10 Tai patikrinama – inžinieriai gali patikrinti VLM „pagrįstą pėdsaką“, kad pamatytų, kodėl ji nusprendė ignoruoti žaliąją šviesą (galbūt todėl, kad policijos pareigūnas ją stabdė, kad ją sustabdytų).11 Šis „paaiškinamumas“ yra svarbus reikalavimas reguliavimo institucijoms ir saugos auditoriams, kurie yra nepatogūs dėl „juodųjų dėžių“ pobūdžio. Priešingai nei „Tesla“ skaliuojamas požiūris, „Waymo“ priklausomybė nuo centralizuoto, didelio patikimumo kartografavimo ir jungiamumo pasirodė esanti pažeidžiama per didelį elektros energijos tiekimo nutraukimą San Franciske 2025 m. Pabaigoje. Kai didelės miesto dalys prarado energiją, keli „Waymo“ automobiliai staiga sustojo, blokuodami sankirtas ir sukurdami lokalizuotą tinklą. Incidentas pabrėžė sistemos, priklausomos nuo nuolatinio ryšio ir iš anksto patvirtintų veiklos sričių, silpnumą. Nors transporto priemonės galiausiai buvo atkurtos be incidento, renginys tarnavo kaip ryškus priminimas, kad net labiausiai apgalvotas „System 2“ architektūra yra link „Nvidia Alpamayo“: smegenų demokratizavimas Iki šiol tik „Waymo“ ir „Tesla“ turėjo išteklių šiems milžiniškiems pasauliniams modeliams kurti. „Nvidia“ pradžioje 2026 m. „Nvidia“ pristatė „Alpamayo“, atviro kodo „System 2“ mąstymo modelį autonominiams automobiliams.4 Tradiciniame AI, modelis mato vaizdą ir išeina „Konstrukcijos zona“. „Alpamayo“ mato vaizdą ir išeina minčių seka: .3 „Aš matau oranžinius kūgius, blokuojančius dešinę juostą.Yra darbuotojas, laikantis ženklą.Ženklas sako „Lėtai“. Darbuotojas gestuoja į kairę. Šis vidinis monologas leidžia sistemai susidoroti su vairavimo įvykių „ilgais uodega“ – retais, keistais įvykiais, kurie įvyksta kas milijoną mylių. „Alpamayo“ suskaidydama problemą į logiškus žingsnius sumažina katastrofinių haliucinacijų tikimybę. „Alpamayo“ veiksmingai kompromituoja „pagrįstą“ gebėjimą, kuris anksčiau buvo technologijų milžinų nuosavybė, siūlant „smegenis dėžutėje“ tokiems senoviniams automobilių gamintojams kaip „Mercedes-Benz“, „Jaguar Land Rover“ ir „Lucid“.12 Andrėjaus Karpatos įžvalga: „Devynių žygis“ Buvęs „Tesla“ dirbtinio intelekto direktorius ir „OpenAI“ įkūrėjas suteikia kritinę intelektinę bazę šiam mūšiui suprasti. „Kelią į visišką autonomiją jis apibūdina ne kaip sprintą, o kaip „devynių žygį“. Andrius Karpavičius, Andrius Karpavičius, Norėdami gauti savarankiško vairavimo demonstravimo dirbti 90% laiko yra lengva. Tai užtrunka savaitgalį kodavimo. Norėdami jį pasiekti 99% užtrunka metus. Norėdami jį pasiekti 99,9% užtrunka penkerius metus. Norėdami pašalinti vairo, jums reikia maždaug "šešiasdešimt devynių" patikimumo (99.9999%), o tai reiškia, kad sistema nepavyksta tik vieną kartą kas kelis milijonus mylių. Karpathy teigia, kad dabartiniai „Sistemos 1“ modeliai (kaip ir ankstyvosios FSD versijos) iš esmės yra „sūdyti priežiūrą per šiaudą“.14 Jie remiasi Reinforcement Learning (RL), kur vienintelė grįžtamoji informacija yra išjungimas.Jūs vairuojate valandą (milijonus kadrų), žmogus perima vieną kartą, o modelis gauna vieną „blogą“ signalą. Jis teigia, kad tikra autonomija reikalauja išspręsti dabartinio AI „kognityvinius trūkumus“.Šiandieniniai modeliai yra panašūs į „įspūdingus savarankiškus“ variklius – jie prognozuoja kitą žetoną (arba valdymo kampą) remiantis statistine tikimybe.Bet jiems trūksta „Pasaulio modelio“ – tikro fizikos, priežastinio pobūdžio ir objektų pastovumo supratimo. Į gatvę pakreiptas kamuolys yra pavojingas; jis tiesiog žino, kad jo mokymo duomenimis „ kamuolys“ paprastai prilygsta „stūmokliui“. „Karpatija“ prognozuoja, kad šio atotrūkio perėjimas nuo imitacijos prie motyvacijos yra pagrindinis ateinančio dešimtmečio iššūkis. Kodėl Akys kelyje / Eyes on the Road: The Sensor War Didžioji schizma: vizija prieš susijungimą Jei architektūra yra smegenys, jutikliai yra akys.Ir čia, skirtumas tarp Tesla ir Waymo yra labiausiai matomas - tiesiogine prasme. 1 lentelė: „Sensor Suite“ palyginimas Feature Tesla (Vision-Only) Waymo (Sensor Fusion - Gen 6) Primary Sensors 8 External Cameras 13 Cameras, 4 LiDAR, 6 Radar, Audio Receivers Depth Perception Inferred (AI estimation via Occupancy Nets) Direct (LiDAR Time-of-Flight) Map Reliance Low (Standard Nav Maps) High (HD Centimeter-Level Maps) Cost (Est.) < $500 per vehicle > $10,000+ (Significant reduction from Gen 5) Aesthetics Invisible (Integrated into body) Visible (Roof "Dome" + Peripherals) Theory "Humans drive with eyes; cars should too." "Superhuman safety requires superhuman senses." Pagrindiniai jutikliai 8 Išorinės kameros 13 kamerų, 4 LiDAR, 6 radarai, garso imtuvai Gilus suvokimas Inferred (AI vertinimas per užimtumo tinklus) Tiesioginis skrydis (LiDAR Time-of-Flight) Žemėlapis Reliance Žemės žemėlapiai (Standard Nav Maps) Aukšto lygio žemėlapiai (HD Centimeter-Level Maps) Kaina (įskaitant kainą) 500 JAV dolerių už automobilį > $10,000+ (reikšmingas sumažinimas nuo Gen 5) estetikų Nematomas (įtrauktas į kūną) Matomas (stogas „Dome“ + periferijos) Teorija „Žmonės vairuoja akimis, o automobiliai taip pat turėtų.“ „Žmogaus saugumui reikia viršžmogiškų pojūčių.“ „Tesla“ fotoaparatų puristas Tesla filosofija, kuria vadovauja Elonas Muskas, yra įsišaknijusi pirmuose principuose: visa kelio sistema buvo sukurta biologiniams neuroniniams tinklams (smegenims) ir optiniams jutiklams (akiams). „Tesla“ iš savo transporto priemonių pašalino radarą (6) ir ultragarso jutiklius (2), remdamasi tik „Tesla Vision“ (1,3,4,5). Privalumai: Tai yra neįtikėtinai pigus ir skalavimas. Kiekvienas "Tesla Model 3" ir "Y" iš linijos yra potencialus duomenų rinkėjas ir robotaxi. Ant stogo nėra trapių sukimosi lazeriai. jutiklių rinkinio kaina yra nereikšminga, palyginti su akumuliatoriumi. Trūkumai: fotoaparatai yra pasyvūs jutikliai.Jie negali „matyti“ atstumo; jie turi jį įvertinti, kaip ir žmogus, turintis vieną akį uždarytą (monokuliarinio gylio įvertinimas).Jie taip pat yra apakinti tais pačiais dalykais kaip ir akli žmonės: tiesioginis saulės spindesys, stiprus lietus, storas rūkas ir tamsa.8 Norėdami kompensuoti, „Tesla“ savo programinėje įrangoje naudoja didžiulius „užimtumo tinklus“. Šie tinklai naudoja vaizdo srautus ir sukuria realaus laiko 3D tūrio modelį pasaulyje, efektyviai sukurdami „virtualią LiDAR“ taškų debesį iš vaizdo.7 Tai nuostabus programinės įrangos inžinerijos pasiekimas, tačiau jis išlieka įvertinimu. Jei AI neteisingai interpretuoja baltą sunkvežimį prieš ryškų dangų (kaip atsitiko ankstyvose „Autopilot“ avarijose), ji „matys“ tuščią erdvę. Žymės: The All-Seeing Fusion Waymo mano, kad norint viršyti žmogaus saugumą, reikia viršžmogiško suvokimo. Žmonės pavargsta, atitraukia dėmesį ir turi ribotą naktinį regėjimą. "Waymo" šeštosios kartos tvarkyklė yra jutiklių integracijos stebuklas.17 LiDAR (Light Detection and Ranging): Piešia pasaulį milijonais lazerio taškų, suteikiant tikslius atstumo matavimus, tikslus iki centimetro, nepriklausomai nuo apšvietimo sąlygų. Jis naudoja lazerio impulsus (905nm arba 1550nm bangos ilgiuose), kad išmatuotų skrydžio laiką. Jis veikia juodoje vietoje. Jis supjaustomas per blizgesį. Jis negali būti apgautas tunelio, nudažyto ant sienos, nuotrauka. Radaras: „Waymo“ naudoja pažangų vaizdavimo radarą, kuris mato per rūkas, lietų ir sniegą. Svarbiausia, kad radaras akimirksniu matuoja greitį, naudojant Doplerio efektą. Kameros: „Waymo“ naudoja 13 kamerų (nuo 29 iki 5 kartos), kad galėtų skaityti eismo žibintus, ženklus ir stabdžių žibintus (spalvas ir semantiką).17 Garso imtuvai: specialus mikrofonų rinkinys leidžia automobiliui „išgirsti“ sirenas, ragus ir netgi artėjančių avarinių transporto priemonių kryptį. Šeštosios kartos komplektas buvo optimizuotas atsižvelgiant į išlaidas, sumažinant jutiklių skaičių ir didinant diapazoną bei skiriamąją gebą. „Sensor Fusion“ sukuria nereikalingą saugos tinklelį.Jei fotoaparatą apakina saulė, „LiDAR“ vis dar mato automobilį priekyje.Jei „LiDAR“ supainioja smarkus lietus (kuris gali išsklaidyti lazerio spindulius), radaras jį mato.19 Debatų fizika: signalas į triukšmą Diskusijos dažnai virinamos iki „signalo ir triukšmo“ santykio. LiDAR suteikia didelio signalo, mažo triukšmo geometrijos vaizdą. Jis tiksliai nurodo, kur yra žemė ir kur yra kliūtis. Kameros suteikia didžiulius duomenų kiekius (spalvą, tekstūrą, tekstą), tačiau geometrijos atžvilgiu yra „triukšmingos“. „AI“ turi atlikti sunkų kėlimą, kad išsiaiškintų, jog plokščias modelis sunkvežimio gale nėra 3D objektas, arba kad puddle nėra sinkhole. "Tesla" lažybų, kad skaičiavimas (AI) galų gale taps pakankamai geras, kad visiškai išspręstų fotoaparatų triukšmą. "Waymo" lažybų, kad turintys "žemės tiesos" duomenis iš "LiDAR" yra saugos trumpas, kurio negalima apeiti vien programine įranga. Trečioji dalis: Širdis (Silicon) – Kompiuteris Bottleneck Perėjimas prie "Sistemos 2" mąstymo ir "End-to-End" neuroninių tinklų reikalauja didžiulės laive esančios skaičiavimo galios. Kadangi nėra viešai prieinamos informacijos apie "Waymo" kompiuterinę įrangą, nedvejodami pridėkite komentarus arba tiesiogiai ping mane. Tesla AI4: efektyvumo žaidimas Dabartinė techninė įranga, HW4 (AI4), yra individualizuotas išvadų kompiuteris, pagamintas naudojant „Samsung“ 7nm procesą.20 Apskaičiuota 100-150 TOPS (Tera operacijų per sekundę) su INT8 tikslumu. Architektūra: optimizuota vaizdo srautams apdoroti iš 8 kamerų.Jame yra specializuoti Neural Processing Units (NPU) ir nereikalingas dvigubo SoC dizainas. Tyrimai rodo, kad „Tesla“ apribojimas yra ne tik greitas greitis, bet ir atminties pralaidumas. „High Resolution“ vaizdo apdorojimas ir didžiulių „Transformers“ (pavyzdžiui, V14 modelio) veikimas reikalauja perkelti didžiulius duomenų kiekius į ir iš lustų atminties. „AI4“ naudoja GDDR6 atmintį (pavyzdžiui, žaidimų kompiuterį), kad pasiektų ~384 GB/s pralaidumo.20 Šis pralaidumo apribojimas yra labai svarbus. Dideliems „Sistemos 2“ modeliams (VLM) reikia didžiulės atminties pralaidumo, kad jie galėtų išlaikyti savo „konteksto langą“ (tą, kas ką tik atsitiko istoriją). „Tesla“ požiūris tik į viziją suvartoja didžiulį kiekį žaliųjų vaizdo duomenų, kurie prisotina atminties autobusą. Elonas Muskas teigė, kad naujos kartos lustas, AI5, turės 5x atminties pralaidumą ir 10x kompiuterį. Tačiau AI5 neturėtų būti iki 2026 ar 2027 m. Pabaigos. Tai Tesla įdeda į nepatogią padėtį: „FSD v14“ stumia dabartinės HW4 įrangos ribas. Ar jie gali pritaikyti „ Nvidia Thor: The Sledgehammer žaidimas Nors „Tesla“ kuria individualius lustus, „Nvidia“ kuria „Thor“ platformą likusiai pramonės šakai. Specifikacijos: iki 2000 TFLOPS (naudojant FP4 tikslumą).20 Architektūra: pagaminta pagal TSMC 4N procesą (pritaikytas 5nm klasės mazgas). Jis integruoja CPU, GPU ir valdymo sistemas į vieną SoC (System on Chip), pagrįstą Blackwell architektūra. Pranašumas: „Thor“ yra aiškiai suprojektuotas „Transformer“ modeliams ir „Large Language Models“ (LLM) modeliams, kurie palaiko „System 2“ argumentus. „Thor“ turi žaliavinį pagrindą paleisti tokius modelius kaip „Alpamayo“ kartu su likusia automobilio programine įranga. „Thor“ palaiko natūralų FP4 (4 bitų plūduriuojančio taško) kvantifikavimą, kuris leidžia paleisti didžiulius modelius su mažiau atminties poveikio.21 2 lentelė: „Silicon Showdown“ Spec Tesla AI4 (Current) Nvidia Thor (Next-Gen) Compute ~150 TOPS (INT8) ~2,000 TFLOPS (FP4) Process Node Samsung 7nm TSMC 4N (5nm class) Memory Type GDDR6 LPDDR5X Memory Bandwidth ~384 GB/s ~273 GB/s (per chip) Primary Use Vision Inference VLM/LLM Reasoning + Vision Adopters Tesla Mercedes, Zeekr, Lucid, BYD skaičiavimas ~ 150 TOPS (INT8) ~ 2 000 TFLOPS (FP4) Proceso mazgas „Samsung“ 7 nm TSMC 4N (5nm klasė) Atminties tipas GDDR6 naudojimas LPDDR5X apžvalga Atminties pralaidumas ~384 GB/s ~273 GB / s (per lustą) Pagrindinis naudojimas Vizija įžvelgiama VLM / LLM mąstymas + vizija Adoptuotojai Tesla „Mercedes“, „Zeekr“, „Lucid“, „BYD“ Įžvalga: "Tesla" vertikali integracija leido jiems pirmauti anksti, tačiau "Nvidia" didžiulis mokslinių tyrimų ir technologijų plėtros mastelis duomenų centruose mažėja iki automobilių. "Thor" yra monstras lustas, kuris galėtų leisti konkurentams "šokti" "Tesla" vyresnio amžiaus HW4 silicio žaliavinio mąstymo gebėjimu, jei jie gali parašyti programinę įrangą, kad ją naudotų. "Tesla" lažybų yra tai, kad jų labai optimizuota programinė įranga gali išspausti daugiau našumo iš silpnesnės aparatūros, nei konkurentai gali išeiti iš brute force.20 IV dalis: Duomenų kuro – kokybė vs. kiekis Ir lenktynėse dėl autonomijos abi bendrovės vartoja labai skirtingas dietas. „Tesla“: duomenų vandenynas "Tesla" turi daugiau nei 5 milijonų automobilių parką kelyje.Didelė jų dalis veikia FSD (prižiūrima) arba veikia " Šešėlio režimu". Šešėlio režimas: Net ir vairuojant žmogui, „Tesla“ kompiuteris veikia fone ir daro prognozes.Jei kompiuteris prognozuoja „atsisukti į kairę“ ir žmogus eina tiesiai, sistema pažymi šį skirtumą ir įkelia duomenis į „Tesla“ serverius.5 Tai leidžia „Teslai“ užfiksuoti keistų įvykių „ilgą uodegą“ – čiužinius greitkelyje, žirgus ir bugius, žaibas Šiaurės Dakotoje, kurių mažesnis laivynas niekada nematytų. V14 šuolis: su FSD v14, Tesla išplėtė savo mokymo parametrus 10x.22 Jie mokosi didžiulius klasterius Nvidia H200s (ir netrukus savo Dojo superkompiuteris), bando "brutinė jėga" sprendimą per grynai apimtis patirties. Waymo: Curated biblioteka Waymo parkas yra nedidelis palyginimui - tūkstančiai transporto priemonių, o ne milijonai.Jie sukaupė maždaug 100 milijonų autonominių mylių.10 Tačiau Waymo teigia, kad jų duomenys yra be galo aukštesnės kokybės. High-Fidelity Labels: Kadangi Waymo automobiliai naudoja LiDAR, jų mokymo duomenys ateina su tobula "žemės tiesa" gylis. Simuliacija: „Waymo“ daugiausia remiasi simuliacija (Carcraft).Jie imasi realaus pasaulio susitikimų ir sujungia juos į milijonus virtualiame pasaulyje esančių variacijų, mokydami savo sistemą milijardų simuliuotų mylių, kurie yra fiziškai tikslūs.10 „Closed Loop“ atsiliepimai: „Waymo“ sistema mokosi iš savo vairavimo.Ji naudoja „Kritinį“ modelį, kad įvertintų savo našumą ir suboptimalius elgesį pertreniruojant.Tai sukuria „flywheel“, kuriame automobilis mokosi pats.10 Įžvalga: Tesla žaidžia platumo žaidimą; jie matė viską, išskyrus „triukšmingus“ regėjimo duomenis. „Waymo“ žaidžia gylio žaidimą; jie matė mažiau, bet su „tobulu“ jutiklio tikslumu ir jie imituoja likusią dalį. „Tesla“ mano, kad „kiekis turi savo kokybę“. „Waymo“ mano, kad „švaistymas, švaistymas“ taikomas AI mokymui ir kad tik fotoaparato duomenys iš esmės yra „švaistymas“, palyginti su LiDAR duomenimis. 5 dalis: Naujausi pokyčiai ir realybės patikrinimas Pakrantės į pakrantę važiavimas: naujas standartas 2026 m. pradžioje diskusijos pasikeitė nuo teorinių prie praktinių. „Tesla“ savininkas Davidas Mossas užfiksavo nulinės intervencijos važiavimą iš Los Andželo į Myrtle Beach naudojant FSD v14.2. Kelionė truko 2 dienas ir 20 valandų. Šis pasiekimas yra svarbus dėl kelių priežasčių: Apibendrinimas: Tai įrodo, kad „nuo galo iki galo“ modelis apibendrinamas visose valstybinėse linijose, skirtinguose kelių ženklinimuose ir skirtingose oro sąlygose. Patikimumas: Nors vienas diskas yra statistiškai nereikšmingas (vieno pavyzdžio dydis), tai, kad tai įmanoma, rodo, kad FSD MTBF (vidutinis laikas tarp gedimų) pagerėjo nuo v12. Bendrijos patvirtinimas: diskas buvo stebimas per „Whole Mars“ FSD duomenų bazę, pridedant patikrinimo sluoksnį, kuris dažnai trūksta gamintojo teiginių.24 Be to, aš asmeniškai girdėjau keletą anekdotinių sėkmės istorijų apie „Tesla FSD v14“ iš savo tinklo per 2025–2026 metų atostogų sezoną. Mano draugai baigė galutinę kelionę iš San Francisko į LA ir į įlankos zoną į Tahoe ežerą (slidinėjimo kurortus) be jokio žmogaus įsikišimo. Tačiau kritikai išlieka skeptiški.Jie nurodo „Gamblerio klaidą“. Jei sistema turi nesėkmės lygį 1 iš 10 000 mylių, galite lengvai važiuoti 3 000 mylių be jokių problemų.Bet norėdami būti robotaxi (be vairuotojo), jums reikia nesėkmės lygio 1 iš 10 000 000 mylių.Žmogaus vairuotojas vis dar yra statistiškai saugesnis nei FSD v14 per visus nuvažiuotus mylias.25 Waymo realybė Nors "Tesla" švenčia vieną tarpvalstybinį važiavimą, "Waymo" valdo komercinę paslaugą Miestuose, tokiuose kaip Feniksas, San Franciskas ir Los Andželas, „Waymo“ automobiliai važiuoja tušti, renka mokančius keleivius ir kasdien susiduria su avarinėmis transporto priemonėmis, lietumi ir statyba.8 Šiandieną Šiandieną "Waymo" avarijų rodiklis yra žymiai mažesnis nei žmonių vairuotojams tose srityse, kuriose ji veikia (0,7 avarijų milijonui mylių, palyginti su 4,85 žmonėms).25 Apribojimas: Waymo yra geofenced.Jis negali tiesiog vairuoti į Myrtle paplūdimį rytoj.Jam reikia žemėlapių ir patvirtinimo. VI dalis: Ateities prognozės ir kelias į priekį Kas laimi „Gran Turismo“? atsakymas priklauso nuo laiko ir pergalės apibrėžimo. Trumpas laikotarpis (2026–2028): „Waymo“ dominuoja robotikos srityje, „Tesla“ dominuoja ADAS Waymo: Jie ir toliau plečia miestą po miesto. Jų vieneto sąnaudos mažėja (Generation 6), o jų saugos atvejis yra įrodytas. Jie turės „Uber-be-a-driver“ rinką dideliuose tankiuose metruose. VLM (System 2) pridėjimas padės jiems susidoroti su retais krašto atvejais, kurie anksčiau juos sustabdė. Tesla: FSD v14 taps neįtikėtinai „prižiūrima“ sistema. Ji nuves jus nuo kranto iki kranto, tačiau vis tiek reikės atkreipti dėmesį. Šuolis į „Neprižiūrėtą“ (pašalindamas vairo ratą) yra eksponentiškai sunkesnis nei šuolis į v14. HW4 aparatūros apribojimai gali užkirsti kelią visiškam L5 autonomijai, priversti laukti AI5. Ilgalaikė perspektyva (2029+): konvergencija „Android“ momentas: „Nvidia“ „Alpamayo“ ir „Thor“ platforma leis kitiems automobilių gamintojams patekti į priekį. "Tesla" duomenų pergalė: Jei - ir tai yra didelis jei - "Tesla" gali išspręsti "pagrįstą" problemą, naudodama savo didžiulį vaizdo įrašų parką ir mokymą nuo galo iki galo, jie laimi pasaulinį žaidimą. "Waymo" sukimasis: tai visiškai spekuliatyvu, tačiau remiantis didžiule "Google AI Research" smegenų galia ir jos greita pažanga "Gemini" daugiarūšio modelių rinkinyje, yra galimybė, kad "Google" slapta galėtų paleisti lygiagrečią programą su iš esmės kitokia sistemos architektūra. Laukinė kortelė: distiliavimo sistema 2 Pažangiausias tyrimas (nurodytas 26 straipsnyje) apima sunkios, lėtos didelių modelių „System 2“ argumentacijos „distiliavimą“ į greitus, efektyvius „System 1“ tinklus. Įsivaizduokite, kad studentas (Sistema 1) mokosi iš profesoriaus (Sistema 2). profesorius mąsto lėtai ir paaiškina, kodėl. "Tesla" ir "Waymo" abu lenktyniauja, kad tai padarytų. "Waymo" naudoja savo VLM, kad mokytų savo vairavimo politiką. "Tesla" naudoja savo kuruojamus vaizdo įrašus (žymėtus "auto-labelers"), kad mokytų savo "end-to-end" tinklą. Prognozė: nugalėtojas bus įmonė, kuri geriausiai automatizuoja šią „mokytojo-studento“ grandinę. „Tesla“ turi daugiau „studentų“ (automobilių) ir duomenų. „Waymo“ turi geresnį „profesorių“ (patikrintus, pagrįstus duomenis). Žymė: Begalinė mylios Kelionė iš Los Andželo į Myrtle paplūdimį buvo inžinerijos triumfas, liudijimas, kaip toli neuroniniai tinklai pasiekė.Bet atstumas tarp „veikia 99% laiko“ ir „veikia pakankamai gerai, kad galėtų miegoti galinėje sėdynėje“ nėra matuojamas myliomis; jis matuojamas devyniais. "Tesla" paleidžia šį kelią su visuotinės, įperkamos autonomijos vizija, kuria remiasi savo laivyno dydis ir "tik vizijos" statybos drąsa. "Waymo" kuria kelią, kai jis važiuoja, nustato jutiklių ir žemėlapių pagrindą, kuris garantuoja saugumą greičio ir masto sąskaita. Kadangi „Nvidia“ demokratizuoja automobilio „smegenis“ naudojant tokius įrankius kaip „Alpamayo“, skirtumas tarp šių dviejų gali būti neaiškus. Automobiliai išmoks mąstyti. Jie išmoks paaiškinti save. Ir kažkur nematomoje rankinėje tarp fotoaparato, lazerio ir silicio lusto, mašinos genijus pagaliau užims ratą. Referencijos Elonas Muskas atsako po to, kai "Tesla" savininkas baigė pirmąjį visiškai autonominį vairavimą visoje Amerikoje - UNILAD Tech, prieinamas 2026 m. Sausio 7 d., https://www.uniladtech.com/vehicles/car-news/musk-responds-tesla-owner-first-autonomous-drive-867091-20260102 „Tesla FSD“ sėkmingai užbaigė visą pakrantės-pakrantės važiavimą su nulinėmis intervencijomis - „Teslarati“, prieinamas 2026 m. sausio 7 d. https://www.teslarati.com/tesla-fsd-successfully-completes-full-coast-drive-with-zero-interventions/ Savarankiškas vairavimas buvo išspręstas NVIDIA?, peržiūrėta 2026 m. sausio 7 d. https://www.youtube.com/shorts/gVbpwlNdUTg „Building Autonomous Vehicles That Reason“ su „NVIDIA Alpamayo“ ..., pasiekta 2026 m. sausio 7 d. https://developer.nvidia.com/blog/building-autonomous-vehicles-that-reason-with-nvidia-alpamayo/ Gilus nardymas: „Tesla“, „Waymo“ ir Didžioji jutiklinė diskusija „Contrary Research“, prieinama 2026 m. sausio 7 d., https://research.contrary.com/report/tesla-waymo-and-the-great-sensor-debate Įdomus ilgas automatizuoto vairavimo uodega: jis skaito mintis, bet sustoja per toli nuo bilietų mašinos - "ResearchGate", prieinamas 2026 m. Sausio 7 d., https://www.researchgate.net/publication/387997832_The_curious_long_tail_of_automated_driving_It_reads_minds_but_stops_too_far_from_the_ticket_machine Tesla FSD iš naujo apibrėžia autonominį vairavimą - Veltyx, prieinamas 2026 m. sausio 7 d. https://www.veltyx.de/en/post/tesla-s-fsd-redefines-autonomous-driving Koks skirtumas tarp „Tesla FSD“ ir „Waymo“ požiūrio ir kas yra geriau?“, peržiūrėta 2026 m. sausio 7 d. https://www.reddit.com/r/SelfDrivingCars/comments/1mmxu53/whats_the_difference_in_approach_between_tesla/ Kyle kalba apie Waymo ir Tesla požiūrių privalumus ir trūkumus : r/SelfDrivingCars - Reddit, prieinamas 2026 m. sausio 7 d., https://www.reddit.com/r/SelfDrivingCars/comments/1lkcco0/kyle_talks_pros_and_cons_of_waymo_and_tesla/ „Demonstrably Safe AI For Autonomous Driving“ - „Waymo“, 2026 m. sausio 7 d., https://waymo.com/blog/2025/12/demonstrably-safe-ai-for-autonomous-driving Waymo: „Patikrintas ir saugus“ autonominis vairavimo AI - EEWorld, prieinamas 2026 m. sausio 7 d., https://en.eeworld.com.cn/news/qcdz/eic715466.html „NVIDIA“ paskelbė „Alpamayo“ atviro kodo AI modelių ir įrankių, skirtų saugiam, pagrįstam autonominių transporto priemonių kūrimui pagreitinti, šeimą, prieinamą 2026 m. sausio 7 d. https://nvidianews.nvidia.com/news/alpamayo-autonomous-vehicle-development Andrej Karpathy sakė Dwarkesh, kad AGI vis dar yra dešimtmetį. - Neuronas, prieinamas 2026 m. sausio 7 d., https://www.theneuron.ai/explainer-articles/andrej-karpathy-told-dwarkesh-that-agi-is-still-a-decade-away Be Hype: 5 kontra-intuityvios tiesos apie AI iš Andrej Karpathy, prieinamas 2026 m. sausio 7 d., https://dev.to/amananandrai/beyond-the-hype-5-counter-intuitive-truths-about-ai-from-andrej-karpathy-afk Andrej Karpathy — AGI dar yra dešimtmetis - Dwarkesh Podcast, prieinamas 2026 m. sausio 7 d., https://www.dwarkesh.com/p/andrej-karpathy Problemos po paviršiumi su „Tesla FSD“ prieš „Waymo Driver“ - „CleanTechnica“, prieinama 2026 m. sausio 7 d. https://cleantechnica.com/2025/12/16/issues-under-the-surface-with-tesla-fsd-vs-waymo-driver/ Naujasis Waymo robotaxi siūlo geresnį našumą mažesnėmis sąnaudomis - Roboto ataskaita, prieinama 2026 m. sausio 7 d. https://www.therobotreport.com/new-waymo-robotaxis-offers-better-performance-at-lower-cost/ Susipažinkite su 6-osios kartos „Waymo“ vairuotoju : r/singularity - Reddit, pasiekta 2026 m. sausio 7 d., https://www.reddit.com/r/singularity/comments/1ewdrd1/meet_the_6thgeneration_waymo_driver/ „Tesla’s Robotaxi Bet: Vision-Only vs. Multi-Sensor Reality Check - EYE2DRIVE“, prieinama 2026 m. sausio 7 d., https://www.eye2drive.com/2025/06/19/tesla-testing-vision-only-autonomy-in-robotaxi-fleet/ Tesla AI4 vs. NVIDIA Thor: žiauri realybė savarankiškai važiuojančių kompiuterių eBay Electrek, prieinama sausio 7, 2026, https://electrek.co/2025/11/25/tesla-ai4-vs-nvidia-thor-reality-savarankiškai važiuojančių kompiuterių / Įvadas NVIDIA Jetson Thor, galutinė platforma fizinio intelekto, prieinama 2026 m. sausio 7 d. https://developer.nvidia.com/blog/introducing-nvidia-jetson-thor-the-ultimate-platform-for-physical-ai/ Kinijos išmaniojo vairavimo pramonė: dramatiški skaičiavimo galios pokyčiai - 36 įmonės, prieinamos 2026 m. sausio 7 d., https://eu.36kr.com/en/p/3617790434980357 „Tesla vs. Waymo vs. Cruise: Who's Leading the Autonomous Vehicle Race?“ (Rinkos akcijų statistika) „PatentPC“, prieinamas 2026 m. sausio 7 d., https://patentpc.com/blog/tesla-vs-waymo-vs-cruise-whos-leading-the-autonomous-vehicle-race-market-share-stats „Tesla FSD“ pasiekė pirmąjį visiškai autonominį JAV pakrantės į pakrantę važiavimą : r/singularity - Reddit, prieinamas 2026 m. sausio 7 d., https://www.reddit.com/r/singularity/comments/1q0pvbr/tesla_fsd_achieves_first_fully_autonomous_us/ Elonas apie Waymo: "Niekada tikrai neturėjo galimybės prieš Tesla" Waymo Detalės AI saugos strategija : r/SelfDrivingCars - Reddit, pasiekta 2026 m. Sausio 7 d., https://www.reddit.com/r/SelfDrivingCars/comments/1pj4ufx/elon_on_waymo_never_really_had_a_chance_against/ Daugiarūšio didelių kalbų modelių distiliavimas autonominiam vairavimui - arXiv, prieinamas 2026 m. sausio 7 d., https://arxiv.org/html/2501.09757v1 Distiliavimo sistema 2 į sistemą 1 - arXiv, pasiekta 2026 m. sausio 7 d., https://arxiv.org/html/2407.06023v1 Ashok Elluswamy „Fondo modelis FSD“, ICCV 2025 pristatymas https://www.youtube.com/watch?v=IkW8hIGimfs https://www.uniladtech.com/vehicles/car-news/musk-responds-tesla-owner-first-autonomous-drive-867091-20260102 https://www.teslarati.com/tesla-fsd-successfully-completes-full-coast-to-coast-drive-with-zero-interventions/ https://www.youtube.com/shorts/gVbpwlNdUTg https://developer.nvidia.com/blog/building-autonomous-vehicles-that-reason-with-nvidia-alpamayo/ https://research.contrary.com/report/tesla-waymo-and-the-great-sensor-debate https://www.researchgate.net/publication/387997832_The_curious_long_tail_of_automated_driving_It_reads_minds_but_stops_too_far_from_the_ticket_machine https://www.veltyx.de/en/post/tesla-s-fsd-redefines-autonomous-driving https://www.reddit.com/r/SelfDrivingCars/comments/1mmxu53/whats_the_difference_in_approach_between_tesla/ https://www.reddit.com/r/SelfDrivingCars/comments/1lkcco0/kyle_talks_pros_and_cons_of_waymo_and_tesla/ https://waymo.com/blog/2025/12/demonstrably-safe-ai-for-autonomous-driving https://en.eeworld.com.cn/news/qcdz/eic715466.html https://nvidianews.nvidia.com/news/alpamayo-autonomous-vehicle-development https://www.theneuron.ai/explainer-articles/andrej-karpathy-told-dwarkesh-that-agi-is-still-a-decade-away https://dev.to/amananandrai/beyond-the-hype-5-counter-intuitive-truths-about-ai-from-andrej-karpathy-afk https://www.dwarkesh.com/p/andrej-karpathy https://cleantechnica.com/2025/12/16/issues-under-the-surface-with-tesla-fsd-vs-waymo-driver/ https://www.therobotreport.com/new-waymo-robotaxis-offers-better-performance-at-lower-cost/ https://www.reddit.com/r/singularity/comments/1ewdrd1/meet_the_6thgeneration_waymo_driver/ https://www.eye2drive.com/2025/06/19/tesla-testing-vision-only-autonomy-in-robotaxi-fleet/ https://electrek.co/2025/11/25/tesla-ai4-vs-nvidia-thor-reality-self-driving-computers/ https://developer.nvidia.com/blog/introducing-nvidia-jetson-thor-the-ultimate-platform-for-physical-ai/ https://eu.36kr.com/en/p/3617790434980357 https://patentpc.com/blog/tesla-vs-waymo-vs-cruise-whos-leading-the-autonomous-vehicle-race-market-share-stats https://www.reddit.com/r/singularity/comments/1q0pvbr/tesla_fsd_achieves_first_fully_autonomous_us/ https://www.reddit.com/r/SelfDrivingCars/comments/1pj4ufx/elon_on_waymo_never_really_had_a_chance_against/ https://arxiv.org/html/2501.09757v1 https://arxiv.org/html/2407.06023v1