Mwanzoni mwa 2026, Tesla Model 3 alisafiri kutoka Tesla Diner huko Los Angeles kwenda Myrtle Beach, South Carolina - umbali wa maili 2,732. Kwa siku mbili na masaa kumi, gari hilo lilifuatilia arteries ya kati ya nchi za bara moja, liliendesha mchanganyiko wa mafuriko ya miji, na kuingia kwenye Superchargers, yote yaliyochukuliwa na mkono usioonekana wa Full Self-Driving (FSD) v14.2.1 Ilikuwa "Kitty Hawk" wakati wa kuendesha gari la kujitegemea, ushahidi kwamba hisia ya mtandao wa neva ulimwenguni umefanikiwa hatimaye mtiririko wa barabara ya wazi. David Mwakyembe David Mwakyembe Hata hivyo, katika mitaani ya San Francisco, aina tofauti ya mapinduzi inafanyika. Hapa, Jaguar I-PACEs nyeupe wanaoendesha taji ya mzunguko wa Waymo ni kuendesha mazingira magumu ya mijini bila mtu yeyote katika kiti cha dereva kabisa. Makampuni haya hufanya kazi kwa kanuni tofauti kabisa. Hawawezi tu kujibu; wao ni mipango. Wao hutegemea njia iliyo na nia, iliyoelezwa, na kuthibitishwa - iliyoungwa mkono na mzunguko wa injini ambayo huona ulimwengu sio kama piksel tu, lakini kama gridi sahihi ya ukweli iliyopimwa na laser. Kwenye upande mmoja kuna Tesla, mshambuliaji wa maverick, anashindana nyumba kwa njia ya maono tu ambayo inachanganya biolojia ya binadamu: macho (camera) na ubongo (msingi wa neva). Kwenye upande mwingine ni Waymo, titan wa kimwili aliyezaliwa na Google, akiendesha meli ya robotaxis iliyojaa seti ya kisasa, gharama kubwa ya laser na radar, polepole lakini kwa uhakika kushinda jiji baada ya jiji. Na kuongezeka katika nyuma ni Nvidia, mfanyabiashara wa silaha wa mapinduzi ya AI, ambayo ufumbuzi wake mpya wa Alpamayo unaahidi kuhamisha uwezo wa "kufikiri" ambao unaweza tu kupiga nafasi ya kucheza kwa kila mtu. Ripoti hii ni mchanganyiko wa kina wa ushindani huu wa teknolojia kwa Gran Turismo ya Kuendesha Automotive. Tutafungua mitandao ya neva, uchambuzi wa fizikia ya sensor, uchunguzi wa usanifu wa silicon, na uchambuzi wa ufahamu wa wafuasi wa AI kama Andrej Karpathy. Tutaangalia zaidi ya uendeshaji wa masoko hadi changamoto za uhandisi zilizopo. Kutoka "Marekani ya Nine" kwa mjadala kati ya "haraka" intuition na "haraka" mawazo, hii ni ufumbuzi kamili katika teknolojia ya kuendesha automotive ya kesho. Sehemu ya I: Usanifu wa mawazo Mfumo wa 1 vs. Mfumo wa 2: injini ya utambulisho Ili kuelewa kwa nini gari lako linaweza siku moja kuendesha bora kuliko wewe, tunapaswa kwanza kuelewa jinsi Mshindi wa Tuzo ya Nobel Daniel Kahneman alielezea utambulisho wa binadamu kwa njia mbili: Mfumo wa 1 na Mfumo wa 2. wewe mwenyewe Mfumo wa 1 ni haraka, moja kwa moja, na intuitive. Ni sehemu ya ubongo wako ambayo inachukua chupa kuanguka kabla unajua kwa makini kwamba imeanguka, au sehemu ambayo huongoza gari yako chini ya barabara ya kawaida wakati akili yako huenda kwa kile unachotaka kufanya kwa chakula cha jioni. Mfumo wa 2 ni wa polepole, wa makusudi, na wa mantiki. Ni sehemu ya ubongo wako ambayo inashirikiana wakati unajaribu kutatua tatizo la kimantiki ngumu, au - muhimu sana - wakati unakutana na eneo la ujenzi la kuchanganyikiwa na ishara za mkono zinazoingilia kutoka kwa mfanyakazi na maafisa wa polisi. Inahitaji mawazo ya kazi, simulation ya matokeo ya baadaye, na uchaguzi wa ufahamu. Kwa miongo mitatu iliyopita, sekta ya magari ya kujitegemea (AV) imekuwa ikijenga kwa kiasi kikubwa mashine za mfumo wa 1. Wamechapisha data ya sensor na amri za udhibiti wa output katika miliseconds kulingana na mifano iliyojifunza. Lakini mafanikio ya hivi karibuni katika AI ya kuzalisha na mifano ya lugha kubwa (LLMs) imezindua uwezekano wa System 2 kufikiri kwa magari - uwezo wa "kufikiri" kupitia matukio ya rangi badala ya tu kujibu kwao.3 Mtandao wa Neural End-to-End wa Tesla: Mtafiti wa Intuitive FSD v14 ya Tesla inawakilisha kiwango cha juu cha mbinu ya "System 1", iliyoongozwa hadi kiwango chake kikamilifu kupitia kile kinachojulikana kama "End-to-End" (E2E) kujifunza. Katika robotics ya jadi, kuendesha gari lilijengwa katika kazi za modular: ufahamu (nini ninaona?), uwanja (nini mimi ni?), mipango (nini ninachopaswa kwenda?), na udhibiti (jinsi ya kurekebisha gari?). Tesla amefanya hivyo. FSD v12 na mfuasi wake v14 kuondoa zaidi ya mstari wa 300,000 wa msimbo wa heuristic C++, kuibadilisha mantiki ya "mstari wa sheria" na mitandao kubwa ya neva iliyofundishwa juu ya mamilioni ya video clips.5 Kamera zinatoa video nyekundu kwenye mfano, na mfano hutoa udhibiti wa mstari na pedal moja kwa moja. Ni "kadi nyeusi" ya hisia. Ni kujifunza kuendesha si kwa kuambiwa sheria za barabara, lakini kwa kuangalia watu kuendesha mabilioni ya maili. Mkakati wa kiufundi wa FSD v14 umejengwa juu ya msingi wa kuingiza data kubwa na rendering ya neural. Inatumia "Jamii ya Mitandao" ambayo inachukua vyanzo vya video vya 2D kutoka kamera nane na kurejesha muonekano wa 3D wa ulimwengu katika muda halisi.7 Hii sio orodha rahisi ya uchambuzi wa vitu; ni ufahamu wa nafasi ya "utumiaji wa nafasi" dhidi ya "kizuizi." Ujasiri wa mbinu hii ni uwezekano wake wa kupanua. Kwa sababu inajifunza kutoka kwa video nyekundu, hauhitaji ramani za HD. Haipaswi kujua utaratibu sahihi wa GPS wa mstari wa barabara ili kujua kwamba hauhitaji kupita. Inatazama barabara tu na "kutazama" barabara, kama vile dereva wa binadamu anafanya kwenye barabara isiyojulikana ya nchi. Hii inaruhusu Tesla kutumia FSD mahali popote, kutoka mitaani mbaya ya Mumbai hadi njia za baridi za Norway, bila timu ya mapishi ya awali.8 Hata hivyo, asili ya "System 1" ya kujifunza end-to-end pia ni miguu yake ya Achilles. Ni uwezekano, sio deterministic. Inafuata tabia za binadamu - ikiwa ni pamoja, wakati mwingine, makosa ya binadamu. Na kwa sababu haina kiwango cha ishara cha "ukweli", inaweza kupambana kuelezea ilichukua uamuzi, na kufanya udhibiti wa udhibiti na uhalali wa usalama kuwa mbaya wa uwezekano wa takwimu badala ya mantiki inayoweza kuthibitishwa.9 Ni mfumo wa uhusiano, sio lazima ya sababu. Kwa nini Ashok Elluswamy, Makamu wa Rais wa Tesla wa Autopilot Software, alitoa "Mfano wa msingi wa Robotics katika Tesla," kwenye Mkutano wa Kimataifa juu ya Maono ya Kompyuta (ICCV) mnamo Oktoba 2025. mazungumzo haya ya teknolojia, iliwapa mtazamo wa kuboresha "System 2" ya Tesla FSD ili kusaidia katika ufafanuzi na usalama kwa njia ya "msingi wa mawazo na utambulisho wa mchakato," mfano wa msingi unatarajia matokeo mengi ya kutafsiri. 3D kazi na mtiririko Vifaa kama magari, wahamiaji, baiskeli, nk Usimamizi wa trafiki mipaka ya barabara, barabara na semantics Kiwango cha kasi na vipengele vingine vya barabara Maamuzi yaliyotolewa kama lugha rahisi Mfumo wa Hybrid wa Waymo: Profesa wa Ushauri Waymo imechukua njia tofauti kabisa ya usanifu. Wakati wanatumia ujuzi wa kina sana kwa ufahamu na utabiri, ngazi zao za kupanga na kudhibiti zimekuwa zikiundwa zaidi, kwa kutegemea pipa la modular ambayo inaruhusu dhamana kali za usalama. Hata hivyo, Waymo haifai mapinduzi ya AI. Katika Driver yao ya mwisho ya 6th Generation, wameunganisha kipengele cha "System 2" kwa uwazi. Wanatumia mfano wa Vision-Language-Action (VLA) - aina ya AI ya multimodal ambayo inaweza kusindika data ya kisasa na "ukweli" kuhusu hilo kwa kutumia uwezo wa lugha. Mipango ya Waymo inaelezea tofauti: Mfumo wa haraka (System 1): Encoder ya fusion ya sensor ambayo inajibu katika milliseconds kwa magari yanayoweka ndani au wageni wanaotoka nje ya barabara. Hii inashughulikia 99% ya kuendesha gari ambayo ni ya kawaida. Tiba hii inashughulikia kamera, LiDAR, na ufumbuzi wa radar katika vektor ya hali ya ulimwengu inayofuata.10 Mfumo wa Slow (System 2): VLM ya Kuendesha (Visual Language Model) iliyofundishwa juu ya uwezo wa Gemini. Mfumo huu unashiriki kwa sababu ya ngumu, ya semantic. Kwa mfano, ikiwa gari la Waymo linawasiliana na gari lenye moto juu ya barabara, mfumo wa "haraka" unaweza tu kuona vikwazo. VLM ya "haraka" anajua "mvua", "hatari," na "watu wa dharura," na anaweza kuzingatia kwamba haipaswi tu kusimama, lakini pengine kuendesha U-turn au kufuata ishara zisizo za kawaida za mkono wa maafisa wa polisi.10 Hii "kufikiri haraka, kufikiri polepole" usanifu inaruhusu Waymo kuwa na uaminifu wa robots na adaptability ya akili ya binadamu. ni kuthibitishwa - wahandisi wanaweza kusimamia "kufikiri trace" ya VLM ili kuona kwa nini aliamua kuchukua mwanga wa kijani (kwani labda kwa sababu maafisa wa polisi alikuwa wavuta yake kuzuia).11 "kuelezea" hii ni mahitaji muhimu kwa watendaji wa udhibiti na wasimamizi wa usalama ambao ni wasiwasi na "kadi nyeusi" asili ya mtandao mzima wa mwisho. Tofauti na mbinu kubwa ya Tesla, utegemezi wa Waymo juu ya ramani ya kituo, uaminifu wa juu na uunganisho ulionyesha kuwa udhaifu wakati wa upungufu mkubwa wa umeme huko San Francisco mwishoni mwa 2025. Wakati sehemu kubwa ya jiji ilipoteza umeme, magari kadhaa ya Waymo yalikoma ghafla, kuzuia mstari na kuunda gridlock ya ndani. Ajali hiyo ilionyesha udhaifu wa mfumo unaotegemea mawasiliano ya mara kwa mara na maeneo ya uendeshaji yaliyopangwa mapema. Wakati magari yalikamatwa hatimaye bila ajali, tukio hilo liliwakumbusha wazi kwamba hata usanifu zaidi wa "System 2" utaratibu ni uwezekano wa kushindwa katika miundombinu ya kimwili ya msingi, changamoto ndogo sana kwa mifano Nvidia Alpamayo: Kuimarisha ubongo Hadi hivi karibuni, Waymo na Tesla tu walikuwa na rasilimali za kujenga mifano hii kubwa ya dunia. Ingiza Nvidia. Mwanzoni mwa 2026, Nvidia ilizindua Alpamayo, mfano wa msingi wa chanzo cha wazi "System 2" kwa magari ya kujitegemea.4 Alpamayo hutoa mawazo ya "Chain-of-Thought" (CoT) kwa soko la zaidi la magari. Katika AI ya jadi, mfano huona picha na huondoa "Ujenzi wa eneo." .3 “Mimi ninaona cones ya orange kuzuia mstari wa kulia. Kuna mfanyakazi anayeweka alama. alama inasema ‘Haraka’. mfanyakazi anafanya mstari wa kushoto. Kwa hiyo, ninahitaji kuunganisha upande wa kushoto na kupunguza kasi.” Monologue hii ya ndani inaruhusu mfumo kukabiliana na "Long Tail" ya matukio ya kuendesha gari - matukio ya nadra na ya ajabu ambayo hutokea mara moja kila milioni ya maili. Kwa kuvunja tatizo katika hatua za kimwili, Alpamayo inapunguza uwezekano wa maumivu ya ajabu. Inatumia kwa ufanisi uwezo wa "kufikiri" ambao zamani ulikuwa uwanja wa kibinafsi wa mashirika ya teknolojia, kutoa "moyo katika sanduku" kwa makampuni ya zamani ya magari kama Mercedes-Benz, Jaguar Land Rover, na Lucid.12 Mtazamo kutoka kwa Andrej Karpathy: "Marekani ya Nine" Mkurugenzi wa zamani wa AI katika Tesla na mwanachama wa mwanzilishi wa OpenAI, hutoa mfumo muhimu wa akili wa kuelewa vita hivi. Andrei Karpathy wa Uingereza, Andrei Karpathy wa Uingereza, Kupata demo ya kuendesha gari ya kufanya kazi 90% ya wakati ni rahisi. Inachukua wiki ya coding. Kupata kwa 99% inachukua mwaka. Kupata kwa 99.9% inachukua miaka mitano. Ili kuondoa mwendeshaji, unahitaji takriban "sisemi tisa" ya kuaminika (99.9999%), ambayo inamaanisha mfumo unashindwa mara moja kila maili kadhaa. Karpathy anasema kuwa mifano ya sasa ya "System 1" (kama toleo la awali la FSD) ni kimsingi "kuvutia ufuatiliaji kwa njia ya shaba".14 Wanategemea Reinforcement Learning (RL) ambapo maoni pekee ni kuondoka. Anasema kuwa uhuru wa kweli unahitaji kutatua "matatizo ya utambulisho" ya AI ya sasa. mifano ya leo ni kama injini za "maonyesho ya moja kwa moja" - wanapendekeza token ijayo (au kioo) kulingana na uwezekano wa takwimu. lakini hawana "Mfano wa Dunia" - ufahamu wa kweli wa kimwili, causality, na kudumu wa vitu. mpira unaotembea mitaani ni hatari; inajua tu kwamba katika data yake ya mafunzo, "mpira" mara nyingi ni sawa na "kuzuia." Kwa nini Sehemu ya Pili: Macho kwenye Barabara - Vita ya Sensor Maelezo ya picha: Vision vs. Fusion Ikiwa usanifu ni ubongo, sensori ni macho.Na hapa tofauti kati ya Tesla na Waymo ni ya kuonekana zaidi—katika kifupi. Mstari wa 1: Usambazaji wa Sensor Suite Feature Tesla (Vision-Only) Waymo (Sensor Fusion - Gen 6) Primary Sensors 8 External Cameras 13 Cameras, 4 LiDAR, 6 Radar, Audio Receivers Depth Perception Inferred (AI estimation via Occupancy Nets) Direct (LiDAR Time-of-Flight) Map Reliance Low (Standard Nav Maps) High (HD Centimeter-Level Maps) Cost (Est.) < $500 per vehicle > $10,000+ (Significant reduction from Gen 5) Aesthetics Invisible (Integrated into body) Visible (Roof "Dome" + Peripherals) Theory "Humans drive with eyes; cars should too." "Superhuman safety requires superhuman senses." Sensors ya msingi 8 Kamera ya nje 13 Kamera, 4 LiDAR, 6 Radar, kupokea sauti Uelewa wa kina Inferred (utambulisho wa AI kupitia mtandao wa kazi) Wakati wa Ndege (LiDAR Time of Flight) Ramani ya Uaminifu Ramani ya chini (Standard Nav Maps) Ramani ya kiwango cha juu (HD Centimeter Level Maps) Gharama ya juu (Est.) $ 500 kwa gari > $10,000+ (Kupunguza kwa kiasi kikubwa kutoka Gen 5) Mazoezi ya Invisible (kuunganishwa katika mwili) Kuonekana (Kambaa ya "Dome" + Peripherals) nadharia ya “Mwanadamu anaongoza kwa macho; magari pia yanapaswa kufanya hivyo.” “Usalama wa kibinadamu unahitaji hisia za kibinadamu.” Tesla: Kamera ya Purist Falsafa ya Tesla, iliyoongozwa na Elon Musk, ina mizizi katika kanuni za kwanza: Mfumo wote wa barabara ulifanywa kwa ajili ya mitandao ya kisaikolojia ya neurons (moyo) na sensors ya kisayansi (macho). Tesla aliondoka radar (6) na sensori za ultrasonic (2) kutoka magari yake, kwa kutegemea kikamilifu Tesla Vision (1,3,4,5). Faida: Ni ya bei nafuu sana na inaweza kupanuliwa. Kila Tesla Model 3 na Y kuondoka kwenye mstari ni chombo cha kukusanya data na robotaxi. Hakuna vifaa vya kurekebisha vidogo kwenye paa. Gharama ya kitabu cha sensor ni kidogo ikilinganishwa na battery. Mapungufu: Kamera ni sensors pasive. hawawezi "kuona" umbali; wanapaswa kuhesabu, kama vile binadamu anafanya kwa macho moja kufungwa (kiwango cha kina cha monocular). Wao pia ni kipofu na mambo sawa na binadamu wa kipofu: mwanga wa jua moja kwa moja, mvua kali, uchungu mkali, na giza.8 Ili kurekebisha, Tesla hutumia "Networks za Wastani" kubwa katika programu yake. Mitandao hizi huchukua vyanzo vya video na kujenga mfano wa 3D wa ulimwengu wa muda halisi, kwa ufanisi kuunda "virtual LiDAR" point cloud kutoka kwa video.7 Ni kazi ya kushangaza ya uhandisi wa programu, lakini bado ni makadirio. Ikiwa AI inafanya makosa ya gari la nyeupe dhidi ya hewa safi (kama ilivyotokea katika ajali za awali za Autopilot), inapaswa "kuona" nafasi tupu. Waymo: Mchanganyiko wa kila kitu Waymo anadhani kwamba ili kuepuka usalama wa binadamu, unahitaji ufahamu wa juu wa binadamu. binadamu anapumzika, anafikiri, na ana mtazamo mdogo wa usiku. Waymo ya 6th Generation Driver stack ni ajabu ya ushirikiano wa sensor.17 LiDAR (Light Detection and Ranging): Inapiga picha ulimwengu katika mamilioni ya pointi za laser, hutoa kupima umbali wa usahihi kwa sentimita, bila kujali hali ya mwanga. Inatumia mashambulizi ya laser (katika urefu wa wimbi wa 905nm au 1550nm) kupima Muda wa Kusafiri. Inafanya kazi katika giza nyeusi. Inapiga kwa njia ya giza. Haiwezekani kuwadanganya na picha ya kituo kilichopigwa juu ya ukuta. Radar: Waymo inatumia radar ya juu ya picha ambayo inaonekana kupitia mvua, mvua, na theluji. muhimu, radar inathiri kasi mara moja kwa kutumia athari ya Doppler. Kamera inahitaji ramani kadhaa ili kuhesabu kwamba gari mbele ni kizuizi kali; radar anajua wakati vektor ya kasi inabadilika. Kamera: Waymo hutumia kamera 13 (kutoka 29 katika Mwanzo wa 5) kusoma mwanga wa trafiki, ishara, na mwanga wa kizuizi (rangi na semantics).17 Vifaa vya sauti: Mipangilio maalum ya microphones inaruhusu gari "kusikia" sirens, mikono, na hata mwelekeo wa karibu magari ya dharura.17 Suite ya kizazi cha 6 imekuwa bora kwa gharama, kupunguza idadi ya sensori wakati kuongeza umbali na ufafanuzi. "sensor fusion" hii inajenga mtandao wa usalama wa kutosha. Ikiwa kamera imefichwa na jua, LiDAR bado inaona gari mbele. Ikiwa LiDAR ni kuchanganyikiwa na mvua kali (ambayo inaweza kuharibu taa za laser), radar inaona kupitia.19 Fasihi ya mjadala: ishara kwa sauti Mazungumzo mara nyingi hupungua hadi kiwango cha "signal-to-Noise". LiDAR hutoa ishara ya juu, maonyesho ya sauti ndogo ya geometry. Inakuambia mahali ambapo ardhi ni na mahali ambapo shida ni. "priors" (matatizo) yanahitajika kusindika ni ndogo. Kamera hutoa kiasi kikubwa cha data (rangi, texture, maandishi) lakini ni "mbaya" kuhusiana na geometry. AI inahitaji kufanya uzito mkubwa ili kujua kwamba muundo mfupi juu ya nyuma ya gari si kitu cha 3D, au kwamba puddle si shingo. Tesla inapanga kwamba kompyuta (AI) hatimaye itakuwa nzuri ya kutatua ghasia ya kamera kikamilifu. Waymo inapanga kuwa kuwa na data ya "haki ya ardhi" kutoka kwa LiDAR ni njia ya haraka ya usalama ambayo haiwezi kuepukwa na programu peke yake. Sehemu ya Tatu: Moyo (Silicon) - Bottleneck ya kuhesabu Programu ni nzuri tu kama chip inafanya kazi juu ya. kubadilika kwa "System 2" sababu na End-to-End mitandao neural inahitaji nguvu kubwa ya kompyuta ya ndani. Hii ni ambapo mkakati wa vifaa wa Tesla na Nvidia (kuwezesha kila mtu mwingine) tofauti sana. Kwa kuwa hakuna habari inayopatikana kwa umma kuhusu vifaa vya kompyuta vya Waymo, tafadhali usisahau kuongeza katika maoni au ping mimi moja kwa moja. Tesla AI4: mchezo wa ufanisi Tesla inajenga silicon yake mwenyewe. vifaa vya sasa, HW4 (AI4), ni kompyuta ya ufuatiliaji iliyojengwa juu ya mchakato wa Samsung wa 7nm.20 Specs: Inakadiriwa 100-150 TOPS (Tera Operations Per Second) kwa usahihi wa INT8. Architecture: Optimized kwa ajili ya usindikaji wa video stream kutoka kamera 8. ina maalum Neural Processing Units (NPUs) na kubuni redundant dual-SoC. The Bottleneck: Utafiti unaonyesha kuwa vikwazo vya Tesla sio tu kasi ya juu, lakini bandwidth ya kumbukumbu. Utaratibu wa video ya upya na uendeshaji wa Transformers kubwa (kama mfano wa V14) unahitaji kuhamisha kiasi kikubwa cha data ndani na nje ya kumbukumbu ya chip. AI4 hutumia kumbukumbu ya GDDR6 (kama PC ya michezo ya kubahatisha) ili kufikia ~384 GB / s bandwidth.20 Hii kikomo cha bandwidth ni muhimu. Aina kubwa za "System 2" (VLMs) zinahitaji upatikanaji mkubwa wa kumbukumbu ili kudumisha "mfano wao wa mazingira" (mfano wa kile kilichotokea hivi karibuni). Njia ya Tesla tu ya maono inachukua kiasi kikubwa cha data ya video ya nyekundu, ambayo huchukua bus ya kumbukumbu. Elon Musk amesema kwamba chip ya kizazi kipya, AI5, itakuwa na bandwidth ya 5x ya kumbukumbu na 10x ya kompyuta. Hata hivyo, AI5 haipaswi mpaka mwisho wa 2026 au 2027. Hii huweka Tesla katika hali ya kutisha: FSD v14 inachukua mipaka ya vifaa vya sasa vya HW4. Je, wanaweza kuingiza agensi ya "kuelewa" (System 2) kwenye magari ya sasa? Jinsi ya kucheza Thor: The Sledgehammer Wakati Tesla inajenga chips za kibinafsi, Nvidia inajenga jukwaa la "Thor" kwa sekta nyingine. Ufafanuzi: Zaidi ya TFLOPS 2,000 (kutumia usahihi wa FP4).20 Architecture: Kujengwa juu ya mchakato wa TSMC 4N (node maalum ya darasa la 5nm). Inaunganisha CPU, GPU, na mifumo ya udhibiti katika SoC moja (System on Chip) kulingana na usanifu wa Blackwell. Faida: Thor ni iliyoundwa wazi kwa ajili ya mifano ya Transformer na Big Language Models (LLMs) ambayo ina nguvu "System 2" sababu. Ina msingi wa kucheza mifano kama Alpamayo pamoja na programu nyingine ya gari. Inasaidia native FP4 (4-bit floating point) quantization, ambayo inaruhusu kuendesha mifano kubwa na athari ndogo ya kumbukumbu.21 Mchezo wa 2: Silicon Showdown Spec Tesla AI4 (Current) Nvidia Thor (Next-Gen) Compute ~150 TOPS (INT8) ~2,000 TFLOPS (FP4) Process Node Samsung 7nm TSMC 4N (5nm class) Memory Type GDDR6 LPDDR5X Memory Bandwidth ~384 GB/s ~273 GB/s (per chip) Primary Use Vision Inference VLM/LLM Reasoning + Vision Adopters Tesla Mercedes, Zeekr, Lucid, BYD Maelezo ya ~150 ya juu (INT8) ~ 2,000 TFLOPS (FP4) kwa wakati mmoja Mchakato wa Node Simu ya Samsung 7nm TSMC 4N (Kazi ya 5nm) Aina ya kumbukumbu Tumia GDDR6 Mpango wa LPDDR5X Bandwidth ya kumbukumbu Urefu wa 384 GB/s ~273 GB / s (kwa kila chip) Matumizi ya msingi Mtazamo wa Inference VLM / LLM Maoni + Maono Watoto wa Tesla ya Maelezo ya Mercedes, Zeekr, Lucid, BYD Uelewa: Ushirikiano wa mstari wa Tesla uliwawezesha kuongoza mapema, lakini kiwango kikubwa cha Nvidia cha R & D katika kituo cha data kinashuka hadi magari. Thor ni chip ya monster ambayo inaweza kuruhusu washindani "kucheza" silicon ya HW4 iliyopita ya Tesla kwa masharti ya uwezo wa akili, ikiwa wanaweza kuandika programu ya kutumia. Sehemu ya IV: mafuta ya data - ubora vs. kiasi Na katika mashindano ya uhuru, makampuni mawili yanatumia mlo tofauti sana. Tesla: Bahari ya Data Tesla ina meli ya magari zaidi ya milioni 5 kwenye barabara. Sehemu kubwa ya hizi zinaendesha FSD (Ufuatiliaji) au hufanya kazi katika "Modes ya Shadow". Modu ya Shadow: Hata wakati mwanadamu anafanya kazi, kompyuta ya Tesla inaendesha nyuma, kufanya utabiri. Ikiwa kompyuta inatabiri "kwenda kushoto" na mwanadamu anaendesha moja kwa moja, mfumo unaonyesha tofauti hii na kupakia data kwenye seva za Tesla.5 Kiwango: Tesla inakusanya maelfu ya maili ya data kila mwaka. Hii inakuwezesha kurekebisha "chupa ndefu" ya matukio ya ajabu - madirisha kwenye barabara ya barabara, farasi na buggies, mafuriko katika Dakota ya Kaskazini - ambayo meli ndogo inaweza kamwe kuona. V14 Leap: Na FSD v14, Tesla imeboresha vigezo vyake vya mafunzo kwa 10x.22 Wao ni mafunzo juu ya makundi makubwa ya Nvidia H200s (na hivi karibuni supercomputer yao mwenyewe Dojo), kujaribu "mwenye nguvu" ufumbuzi kwa njia ya kiasi kikubwa cha uzoefu. Waymo: Maktaba ya Kuhifadhiwa Mfumo wa Waymo ni mdogo kwa kulinganisha - maelfu ya magari, sio mamilioni. Wamehifadhiwa karibu milioni 100 ya maili ya kujitegemea.10 Hata hivyo, Waymo anadai kuwa data zao ni ya ubora wa kutosha. High-Fidelity Labels: Kwa sababu magari ya Waymo kutumia LiDAR, data yao ya mafunzo inakuja na kina kamili ya "ukweli wa ardhi". Simulation: Waymo inategemea sana simulation (Carcraft). Wao kuchukua mahojiano ya ulimwengu halisi na kuunganisha katika mamilioni ya tofauti katika ulimwengu wa virtual, mafunzo mfumo wao juu ya mabilioni ya maili simulated ambayo ni sahihi kimwili.10 Ufafanuzi wa Mzunguko Mwisho: Mfumo wa Waymo unajifunza kutoka kwa kuendesha gari lake mwenyewe. Inatumia mfano wa "Mchakato" wa kutathmini utendaji wake mwenyewe na ishara ya tabia suboptimal kwa ajili ya mafunzo. Hii inajenga "flywheel" ambapo gari hufundisha mwenyewe.10 The Insight: Tesla inacheza mchezo wa upana; wameona kila kitu isipokuwa na data ya maono ya "kupiga kelele". Waymo inacheza mchezo wa kina; wameona kidogo, lakini na usahihi wa sensor "mema" na wanasimuliza wengine. Tesla anaamini kwamba "kiwango kina ubora wake mwenyewe." Waymo anaamini kwamba "kupiga kelele ndani, kupiga kelele nje" inatumika kwa mafunzo ya AI, na kwamba data ya kamera tu ni "kupiga kelele" ikilinganishwa na data ya LiDAR. Sehemu ya V: Maendeleo ya hivi karibuni na ukaguzi wa ukweli The Coast-to-Coast Drive: Benchmark Mpya Mwanzoni mwa 2026, mjadala ulibadilika kutoka kwa nadharia hadi kwa vitendo. mmiliki wa Tesla, David Moss, alifichua safari ya kuingilia kati ya Los Angeles na Myrtle Beach kwa kutumia FSD v14.2. Safari hiyo ilichukua siku 2 na masaa 20. Ufanisi huu ni muhimu kwa sababu kadhaa: Ufafanuzi: Inathibitisha mfano wa "mwisho-mwisho" unazozingatia mstari wa hali, alama za barabara tofauti, na hali ya hewa tofauti. Uaminifu: Ingawa diski moja ni isiyo na umuhimu wa takwimu (maziwa ya sampuli ya moja), ukweli kwamba inawezekana inaonyesha MTBF (Miji ya Muda kati ya Kushindwa) ya FSD imeboreshwa kwa utaratibu wa ukubwa tangu v12. Uhakiki wa jumuiya: Drive ilifuatiliwa kupitia database ya Whole Mars FSD, kuongeza kiwango cha uhakiki ambacho mara nyingi kinakosa kutoka kwa madai ya mtengenezaji.24 Zaidi ya hayo, mimi binafsi nimesikia hadithi kadhaa za mafanikio ya Tesla FSD v14 kutoka mtandao wangu mwenyewe wakati wa msimu wa likizo ya 2025-2026. Marafiki zangu wamekamilisha safari za mwisho za mwisho kutoka San Francisco hadi LA na eneo la bahari hadi Lake Tahoe (mji wa ski) bila kuingilia kati na mwanadamu yeyote. Hata hivyo, wapiganaji wanaendelea kuwa na wasiwasi. Wanasisitiza "Udhaifu wa Kamari." Ikiwa mfumo una kiwango cha kushindwa cha 1 katika maili 10,000, unaweza kwa urahisi kuendesha maili 3,000 bila tatizo. Lakini kuwa robotaxi (hakuna dereva), unahitaji kiwango cha kushindwa cha 1 katika maili 10,000,000. dereva wa binadamu bado ni salama zaidi kuliko FSD v14 juu ya jumla ya maili yote yaliyoendeshwa.25 Ukweli wa Waymo Wakati Tesla inasherehekea gari moja la nchi, Waymo inafanya kazi huduma ya kibiashara Katika miji kama vile Phoenix, San Francisco, na Los Angeles, magari ya Waymo yanaendesha tupu, kukusanya abiria wa kulipa, na kukabiliana na magari ya dharura, mvua, na ujenzi kila siku.8 Leo ya Leo ya The Stat: Waymo ina kiwango cha ajali cha chini sana kuliko dereva wa binadamu katika maeneo ambayo inafanya kazi (0.7 ajali kwa maili milioni vs 4.85 kwa binadamu).25 Waymo ni geofenced. Siwezi tu kuendesha gari kwa Myrtle Beach kesho. Inahitaji ramani na uthibitisho. Sehemu ya VI: Utabiri wa baadaye na Njia ya mbele Nani anashinda Gran Turismo? Jibu linategemea muda na ufafanuzi wa ushindi. The Short Term (2026-2028): Waymo inaongoza Robotaxi, Tesla inaongoza ADAS Waymo: Will continue to scale city by city. Their unit costs are dropping (Gen 6), and their safety case is proven. They will own the "Uber-without-a-driver" market in major dense metros. The addition of VLM (System 2) will help them handle the rare edge cases that previously stalled them. Tesla: FSD v14 itakuwa mfumo wa kushangaza wa "Ufuatiliaji". Itakupeleka kutoka pwani hadi pwani, lakini bado unahitaji kuzingatia. Kuanguka kwa "Ufuatiliaji Usiofuatiwa" (kuondoa mstari) ni vigumu sana kuliko kushuka kwa v14. Masharti ya vifaa ya HW4 inaweza kuzuia uhuru kamili wa L5, kusababisha kusubiri kwa AI5. Kiwango cha muda mrefu (2029+): Ushirikiano Siku ya "Android": jukwaa la Nvidia la Alpamayo na Thor itawawezesha wazalishaji wengine wa magari kukamata.Tutaona "uhuru wa bidhaa" ambapo Mercedes au Hyundai ina uwezo wa "kufikiri" sawa na Waymo, inayoendeshwa na Nvidia. Ushindi wa Data wa Tesla: Ikiwa - na ni kubwa ikiwa - Tesla inaweza kutatua tatizo la "ukweli" kwa kutumia meli yao kubwa ya video na mafunzo ya mwisho hadi mwisho, wanashinda mchezo wa kimataifa.Wame na uwezo wa uzalishaji (mamilioni ya magari) na muundo wa gharama (sensori za bei nafuu) kutumia uhuru popote, kutoka Mumbai hadi Montana, maeneo ambayo ramani za HD za Waymo hazitafikia. Pivot ya Waymo: hii ni ya uwezekano kabisa, lakini kulingana na nguvu kubwa ya ubongo ya utafiti wa Google AI na maendeleo yake ya haraka katika toleo la Gemini la mifano ya multi-modal, kuna uwezekano kwamba Google inaweza kuendesha siri programu ya parallel na usanifu tofauti wa mfumo. Karatasi ya Wild: Mfumo wa 2 Distillation Hatua ya juu ya utafiti (kutaja katika 26) inahusisha "kusafisha" dhaifu, polepole mfumo wa 2 mawazo ya mifano kubwa katika haraka, ufanisi mfumo wa 1 mitandao. Fikiria mwanafunzi (System 1) anajifunza kutoka kwa profesa (System 2). Mwalimu anadhani polepole na anaelezea kwa nini. Tesla na Waymo wote wanashindana kufanya hivyo. Waymo hutumia VLM yake kufundisha sera yake ya kuendesha gari. Tesla hutumia vipande vyake vya video vya kuratibu (ambazo vinajulikana na auto-labelers) kufundisha mtandao wake wa mwisho hadi mwisho. Utabiri: Mshindi utakuwa kampuni ambayo inasaidia zaidi "mwalimu-mwalimu" mkondo huu. Tesla ina "walimu" zaidi (moto) na data. Waymo ina "mwalimu" bora (kuyaonyeshwa, data ya kweli ya msingi). Maelezo ya mwisho ya The Infinite Mile Safari kutoka Los Angeles hadi Myrtle Beach ilikuwa ushindi wa uhandisi, ushahidi wa umbali ambao mitandao ya neural imefikia.Lakini umbali kati ya "inafanya kazi 99% ya wakati" na "inafanya kazi vizuri kutosha kwa kulala kwenye kiti cha nyuma" haijatathminiwa katika maili; inatathminiwa katika tisa. Tesla inazindua barabara hii na maono ya uhuru wa kiwango cha juu, unaopatikana, iliyoongozwa na ukubwa wa meli yake na ujasiri wa mkakati wake wa "mtazamo tu". Waymo inajenga barabara kama inavyoendesha, kuweka msingi wa sensors na ramani ambazo zinahakikisha usalama kwa gharama ya kasi na kiwango. Kama Nvidia democratizes "moyo" ya gari na zana kama Alpamayo, tofauti kati ya mbili inaweza kupunguzwa. magari kujifunza kufikiri. Watajifunza kuelezea wenyewe. Na mahali fulani katika mkono usioonekana kati ya kamera, laser, na chip silicon, genius katika mashine hatimaye kuchukua mzunguko kwa ajili nzuri. Na ni ushindi wa kiwango kikubwa kwa usafiri. Maelezo ya Elon Musk anajibu baada ya mmiliki wa Tesla kumaliza gari la kwanza kabisa la kujitegemea nchini Marekani - UNILAD Tech, iliyopatikana Januari 7, 2026, https://www.uniladtech.com/vehicles/car-news/musk-responds-tesla-owner-first-autonomous-drive-867091-20260102 Tesla FSD imekamilisha uendeshaji kamili wa pwani hadi pwani kwa uingiliaji wa zero - Teslarati, upatikanaji wa Januari 7, 2026, https://www.teslarati.com/tesla-fsd-kufanikiwa-kuhusu-kuhusu pwani-kuhusu pwani-kuhusu-kuhusu-kuhusu-kuhusu-kuhusu/ Auto Driving Has Been Solved na NVIDIA?, iliyopatikana Januari 7, 2026, https://www.youtube.com/shorts/gVbpwlNdUTg Kujenga magari ya kujitegemea ambayo Ni Sababu na NVIDIA Alpamayo ..., iliyopatikana Januari 7, 2026, https://developer.nvidia.com/blog/building-autonomous-vehicles-that-reason-with-nvidia-alpamayo/ Deep Dive: Tesla, Waymo, na Majadiliano makubwa ya Sensor na utafiti wa kinyume, upatikanaji wa Januari 7, 2026, https://research.contrary.com/report/tesla-waymo-and-the-great-sensor-debate Chupa ya muda mrefu ya kuendesha gari la automatiska: Inasoma akili lakini huacha mbali sana kutoka kwa mashine ya tiketi - ResearchGate, iliyopatikana Januari 7, 2026, https://www.researchgate.net/publication/387997832_The_curious_long_tail_of_automated_driving_It_reads_minds_but_stops_too_far_from_the_ticket_machine FSD ya Tesla inafafanua upya gari la kujitegemea - Veltyx, kupatikana Januari 7, 2026, https://www.veltyx.de/en/post/tesla-s-fsd-redefines-autonomous-driving Ni tofauti gani katika mbinu kati ya Tesla FSD na Waymo na ambayo ni bora?, upatikanaji wa Januari 7, 2026, https://www.reddit.com/r/SelfDrivingCars/comments/1mmxu53/whats_the_difference_in_approach_between_tesla/ Kyle anazungumzia faida na hasara za mbinu za Waymo na Tesla : r/SelfDrivingCars - Reddit, kupatikana Januari 7, 2026, https://www.reddit.com/r/SelfDrivingCars/comments/1lkcco0/kyle_talks_pros_and_cons_of_waymo_and_tesla/ Maonyesho ya Usalama wa AI Kwa Kuendesha Automotive - Waymo, iliyopatikana Januari 7, 2026, https://waymo.com/blog/2025/12/demonstrably-safe-ai-for-autonomous-driving Waymo: "Uhakika na salama" AI ya kuendesha uhuru - EEWorld, upatikanaji Januari 7, 2026, https://en.eeworld.com.cn/news/qcdz/eic715466.html NVIDIA Inatangaza Familia ya Alpamayo ya Models na Zana za AI Open-Source Ili Kuharakisha Uendelezaji wa Gari ya Usalama, Kulingana na Maoni, inapatikana Januari 7, 2026, https://nvidianews.nvidia.com/news/alpamayo-autonomous-vehicle-development Andrej Karpathy alisema Dwarkesh kwamba AGI bado ni miongo kadhaa mbali. - The Neuron, upatikanaji Januari 7, 2026, https://www.theneuron.ai/explainer-articles/andrej-karpathy-told-dwarkesh-that-agi-is-still-a-decade-away Zaidi ya Hype: 5 Counter-Intuitive Ukweli kuhusu AI kutoka Andrej Karpathy, kupatikana Januari 7, 2026, https://dev.to/amananandrai/beyond-the-hype-5-counter-intuitive-truths-about-ai-from-andrej-karpathy-afk Andrej Karpathy — AGI bado ni miaka kumi mbali - Podcast ya Dwarkesh, iliyopatikana Januari 7, 2026, https://www.dwarkesh.com/p/andrej-karpathy Mambo chini ya uso na Tesla FSD vs Waymo Driver - CleanTechnica, kupatikana Januari 7, 2026, https://cleantechnica.com/2025/12/16/issues-under-the-surface-with-tesla-fsd-vs-waymo-driver/ New Waymo robotaxi inatoa utendaji bora kwa gharama nafuu - Ripoti ya Robot, iliyopatikana Januari 7, 2026, https://www.therobotreport.com/new-waymo-robotaxis-offers-better-performance-at-lower-cost/ Kukutana na Waymo Driver ya kizazi cha 6 : r/singularity - Reddit, kupatikana Januari 7, 2026, https://www.reddit.com/r/singularity/comments/1ewdrd1/meet_the_6thgeneration_waymo_driver/ Tesla's Robotaxi Bet: Maoni tu vs Multi-Sensor Reality Check - EYE2DRIVE, kupatikana Januari 7, 2026, https://www.eye2drive.com/2025/06/19/tesla-testing-vision-only-autonomy-in-robotaxi-fleet/ Tesla AI4 vs. NVIDIA Thor: ukweli wa kikatili wa kompyuta za kujitegemea, na Electrek, kupatikana Januari 7, 2026, https://electrek.co/2025/11/25/tesla-ai4-vs-nvidia-thor-reality-self-driving-computers/ Kuwasilisha NVIDIA Jetson Thor, jukwaa la mwisho kwa AI ya kimwili, ilipatikana Januari 7, 2026, https://developer.nvidia.com/blog/introducing-nvidia-jetson-thor-the-ultimate-platform-for-physical-ai/ China Intelligent Driving Industry: Mabadiliko makubwa katika nguvu ya kompyuta - 36 makampuni, kupatikana Januari 7, 2026, https://eu.36kr.com/en/p/3617790434980357 Tesla vs. Waymo vs. Cruise: Nani anaongoza mashindano ya magari ya kujitegemea? (Tazama Idadi ya Masoko) Ebay PatentPC, kupatikana Januari 7, 2026, https://patentpc.com/blog/tesla-vs-waymo-vs-cruise-whos-leading-the-autonomous-vehicle-race-market-share-stats Tesla FSD Inapatikana Kwanza Kwenye Usafiri wa Pamoja wa Marekani Coast-to-Coast : r/singularity - Reddit, iliyopatikana Januari 7, 2026, https://www.reddit.com/r/singularity/comments/1q0pvbr/tesla_fsd_achieves_first_fully_autonomous_us/ Elon juu ya Waymo: "Sikuwahi kweli kuwa na nafasi dhidi ya Tesla" Waymo Details AI Safety Strategy : r/SelfDrivingCars - Reddit, kupatikana Januari 7, 2026, https://www.reddit.com/r/SelfDrivingCars/comments/1pj4ufx/elon_on_waymo_never_really_had_a_chance_against/ Distilling Multi-modal lugha kubwa mifano kwa ajili ya kuendesha gari la kujitegemea - arXiv, kupatikana Januari 7, 2026, https://arxiv.org/html/2501.09757v1 Distilling System 2 katika System 1 - arXiv, kupatikana Januari 7, 2026, https://arxiv.org/html/2407.06023v1 Ashok Elluswamy “mfano wa msingi wa FSD”, ICCV 2025 maonyesho https://www.youtube.com/watch?v=IkW8hIGimfs https://www.uniladtech.com/vehicles/car-news/musk-responds-tesla-owner-first-autonomous-drive-867091-20260102 https://www.teslarati.com/tesla-fsd-successfully-completes-full-coast-to-coast-drive-with-zero-interventions/ https://www.youtube.com/shorts/gVbpwlNdUTg https://developer.nvidia.com/blog/building-autonomous-vehicles-that-reason-with-nvidia-alpamayo/ https://research.contrary.com/report/tesla-waymo-and-the-great-sensor-debate https://www.researchgate.net/publication/387997832_The_curious_long_tail_of_automated_driving_It_reads_minds_but_stops_too_far_from_the_ticket_machine https://www.veltyx.de/en/post/tesla-s-fsd-redefines-autonomous-driving https://www.reddit.com/r/SelfDrivingCars/comments/1mmxu53/whats_the_difference_in_approach_between_tesla/ https://www.reddit.com/r/SelfDrivingCars/comments/1lkcco0/kyle_talks_pros_and_cons_of_waymo_and_tesla/ https://waymo.com/blog/2025/12/demonstrably-safe-ai-for-autonomous-driving https://en.eeworld.com.cn/news/qcdz/eic715466.html https://nvidianews.nvidia.com/news/alpamayo-autonomous-vehicle-development https://www.theneuron.ai/explainer-articles/andrej-karpathy-told-dwarkesh-that-agi-is-still-a-decade-away https://dev.to/amananandrai/beyond-the-hype-5-counter-intuitive-truths-about-ai-from-andrej-karpathy-afk https://www.dwarkesh.com/p/andrej-karpathy https://cleantechnica.com/2025/12/16/issues-under-the-surface-with-tesla-fsd-vs-waymo-driver/ https://www.therobotreport.com/new-waymo-robotaxis-offers-better-performance-at-lower-cost/ https://www.reddit.com/r/singularity/comments/1ewdrd1/meet_the_6thgeneration_waymo_driver/ https://www.eye2drive.com/2025/06/19/tesla-testing-vision-only-autonomy-in-robotaxi-fleet/ https://electrek.co/2025/11/25/tesla-ai4-vs-nvidia-thor-reality-self-driving-computers/ https://developer.nvidia.com/blog/introducing-nvidia-jetson-thor-the-ultimate-platform-for-physical-ai/ https://eu.36kr.com/en/p/3617790434980357 https://patentpc.com/blog/tesla-vs-waymo-vs-cruise-whos-leading-the-autonomous-vehicle-race-market-share-stats https://www.reddit.com/r/singularity/comments/1q0pvbr/tesla_fsd_achieves_first_fully_autonomous_us/ https://www.reddit.com/r/SelfDrivingCars/comments/1pj4ufx/elon_on_waymo_never_really_had_a_chance_against/ https://arxiv.org/html/2501.09757v1 https://arxiv.org/html/2407.06023v1