Biznesa gadījums par paredzamu mašīnu, Gemini ģenerēta atbilde Pirmais blog post. Domāšanas mašīnas laboratorijas Domāšanas mašīnas laboratorijas LLM risina kritisku, bet bieži aizmirstu, izaicinājumu lielo fiksēto valodu modeļu (LLM) mērogojumā: nespēja ražot identiskus izejas rezultātus par identiskiem ieejas datiem, pat tad, ja tie ir acīmredzami konfigurēti determinismam. Kaut arī daudzi lietotāji to var uztvert kā nelielu kļūdu, bet bieži vien aizmirst par "radošo" modeli, šī analīze parāda, ka tas faktiski ir nozīmīgs šķērslis AI nozares nogatavināšanai. Problēma nav tikai tehniska, bet fundamentāls šķērslis uzņēmējdarbības modelim, kas sola automatizēt augstas likmes, augstas vērtības darba plūsmas. Kā detalizēts pētījumā, LLM secinājums ir fundamentāli varbūtīgs, un pat tad, ja tiek mēģ "Lai uzvarētu nenoteiktību LLM secībā," Nosaukums oriģinālvalodā: A Synopsis of the "Defeating Nondeterminism" Post Blog post no Tāpēc, ka pat tad, kad modelis ir iestatīts uz augstu temperatūru 0, tas nozīmē, ka teorētiski nevajadzētu saistīt ar jaunu arhitektūru, kas ierosina jaunu, deterģisku rezultātu, rezultātā tiek veikta zinātniskā izpēte, kas ir saistīta ar greizsirdīgu dekodēšanu.1 Šie modeļi joprojām ir saistīti ar LLM iedzimto "radītību", bet gan ar dziļākām problēmām mūsdienu datoru un modeļu arhitektūrās, kas prasa augstu uzticamību un auditu, piemēram, paredzēto darba plūsmu, ekspertu darbību un regulatīvās atbilstības pārbaudes.Rezolūcija, kas ierosināta pēc tam, kad šāds risinājums nav saistīts ar pieejamajiem mehānismiem, liecina, ka šāda domāšanas mašīnas.ai Kāpēc tas varētu būt AI pārsteigums The ability to defeat non-determinism in LLMs represents a significant leap forward, moving the technology beyond a mere creative tool to a foundational technology enabler. This is a transformation that could be considered a breakthrough for several key reasons. First, a truly deterministic LLM would unlock high-stakes applications in a wide array of regulated industries. The current variability of LLM output renders it unusable for applications in finance, law, medicine, and government, where auditability and consistency are non-negotiable requirements.6 Imagine a legal firm using an LLM to review thousands of contracts; they must be confident that the system will flag the same clauses with the same reasoning every time to meet compliance and liability standards. The shift to reproducibility would fundamentally change the LLM's utility from a creative tool to a reliable, auditable component of critical business systems. Second, this would enable the creation of truly enterprise-grade products. The research highlights that the "instability of the format of the outputs can result in downstream parser failures" and that "low stability might also increase the potential for inexplicable errors".2 A predictable output allows for the creation of robust, end-to-end applications where an LLM's output can be trusted to serve as a reliable input for the next stage of a workflow. This reliability is the foundation of any large-scale software system and would significantly reduce the need for expensive, manual human-in-the-loop checks that currently act as a workaround for unpredictable outputs.10 Finally, achieving determinism would restore scientific rigor to a field where it is desperately needed. The provided research points out that "nearly 70% of AI researchers admitted they had struggled to reproduce someone else's results, even within the same subfield".12 A standardized, deterministic LLM would transform the "black box" of generative AI into a reliable, verifiable tool, allowing researchers to build upon each other's work with confidence. This elevates the field from a series of impressive demonstrations to a true science, where findings can be independently verified and validated. This transformation is not a marginal improvement but a paradigm shift that expands the LLM's utility into a completely new, and highly lucrative, market segment. The provided research consistently contrasts deterministic AI with generative AI, describing the former as "rule-based," "transparent," and "ideal for tasks that require consistency" and the latter as suited for "creative," "complex," and "innovative" tasks.6 The breakthrough of "defeating nondeterminism" for generative LLMs means that the creative, large-scale model can now be used for deterministic-style tasks. This fusion of capabilities allows for a generative model to be used as a tool for logic, which is a fundamentally new application. Kāpēc tas var nebūt pārsteigums: inženierzinātņu jautājums, nevis atklājums Tas nozīmē, ka, lai gan šāda veida kaprīzums tiek izmantots, lai apmierinātu uzņēmuma mērķus, tas nozīmē, ka šis uzņēmums ir diezgan atvērts labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdarības labdar Kā determinisms ir saistīts ar AI Lab Fundraising I.I.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P.P. Lielāko AI laboratoriju stratēģiskie mērķi un finansējums Lab Latest Funding Round Latest Valuation Key Strategic Focus Relation to Determinism OpenAI 8.3 billion dollars 300 billion dollars Stargate Initiative: 500 billion dollars AI infrastructure investment 14 Required to justify massive infrastructure investment with high-value enterprise products. Anthropic 13 billion dollars 183 billion dollars "Steerable AI" & "Safety research" 4 A core component of "reliable" and "interpretable" systems. Cohere 500 million dollars 6.8 billion dollars Enterprise B2B / "Sovereign AI" 5 A prerequisite for security, compliance, and on-premise solutions for high-stakes industries. OpenAI 8.3 billion dollars 300 billion dollars Stargate Initiative: 500 billion dollars AI infrastructure investment 14 Required to justify massive infrastructure investment with high-value enterprise products. Anthropic 13 billion dollars 183 billion dollars "Steerable AI" & "Safety research" 4 A core component of "reliable" and "interpretable" systems. Cohere 500 million dollars 6.8 billion dollars Enterprise B2B / "Sovereign AI" 5 A prerequisite for security, compliance, and on-premise solutions for high-stakes industries. Lai pilnībā izprastu šī darba nozīmi, ir nepieciešams izpētīt LLM secinājuma tehniskos pamatus un precīzus nedeterminisma avotus. LLM secinājuma process ir automātiski regresīvs, kas nozīmē, ka tas rada teksta zīmi pēc zīmes. Katrā posmā modelis veic priekšpusi, lai aprēķinātu "logītu" vektoru - neapstrādātas skaitļu izejas - par katru vārdu tās vārdnīcā. Softmax funkcija pēc tam pārveido šos logītus par varbūtības sadalījumu visā vārdnīcā, kur visas varbūtības ir vienādas.1 Visvienkāršākā un visizplatītākā "deterministiskā" dekodēšanas stratēģija ir alkatīga dekodēšana. Šajā metodē katrā posmā modelis vienkārši izvēlas zīmi ar vislielāko varbūtību. Tas ir matemātiski varbūtības sadalījuma argmax. Temperatūras parametrs, kad iestatīts uz 0, teorētiski piespieda šo uzvedību, un procesam jābūt pilnīgi deterministiskam un reproducējamam.2 Tomēr, kā liecina pētījumi, šī teorētiskā pilnība praktiski sabrūk. Blog post un saistītie pētniecības materiāli atklāj divus primāros nepilnības avotus. Pirmais ir plūdmaiņas punkta nedeterminisms. LLM progresīvajā pagriezienā iesaistītie fundamentālie aprēķini paļaujas uz plūdmaiņas punkta aritmētiku, kas nav garantēta, ka būs identiska dažādās aparatūrās vai pat tajā pašā aparatūrā ar dažādām paralelizācijas shēmām.3 Darbību secība var izraisīt nelielas, nenozīmīgas atšķirības galīgajās varbūtības vērtībās. Kad diviem vai vairākiem žetoniem ir gandrīz identiskas augšējās varbūtības, piemēram, kad P(a)=0.9999999 un P(b)=0.9999998, šīs minūšu atšķirības var izraisīt argmax "lauzt saiti" atšķirīgi, izraisot atšķirīgu nākamo token izvēli. Otrais, un sarežģītākais, ne-determinisma avots ir Ekspertu sajaukšanas (MoE) maršruts. MoE modeļos žetonu maršruts uz dažādiem ekspertiem ir svarīga aprēķina daļa. Tomēr šis maršruts nav balstīts tikai uz pašu žetonu, bet uz visu tajā brīdī apstrādāto žetonu partiju. Pieejamie pētījumi skaidri norāda, ka, ja žetonu grupās ir ieejas no dažādām secībām, "tie konkurē par ekspertu bufera punktiem, kas noved pie mainīgām ekspertu piešķīrumiem pa riteņiem".1 Tas nozīmē, ka viens, atkārtots vaicājums katru reizi tiks sadalīts ar dažādiem lietotāja pieprasījumiem, kas noved pie tā, ka tas seko cit Spekulācijas par nākotni nāk no Gemini Flash 2.5 Šī sadaļa padziļina sarežģīto mijiedarbību starp prognozēšanu, tehnoloģiju attīstību un cilvēka elementu, jo īpaši saistībā ar redzētājiem, kas veido mūsu digitālo pasauli. Šīs nākotnes veidošanas pamatā ir drosmīgas iztēles un pragmatiska izpildījuma sajaukums.Tā ietver ne tikai jaunu tehnoloģiju koncepciju, bet arī to sociālo ietekmi, ētiskās sekas un paradigmas maiņas potenciālu.Šī nākotnes perspektīva bieži tiek stimulēta ar gatavību spekulēt – hipotētizēt par iespējām, kas pašlaik var šķist neiespējamas, bet ar pietiekamu izgudrojumu un resursiem varētu kļūt par realitāti. Jēdziens "attīstītās paradigmas" kalpo kā izšķiroša lēca, caur kuru analizēt šo procesu. Ambiciozs ilgtermiņa redzējums: skaidrs, bieži vien drosmīgs, ilgtermiņa mērķis, kas pārsniedz tūlītējās tirgus tendences un koncentrējas uz fundamentālām pārmaiņām cilvēka mijiedarbībā un pieredzē. Iteratīva attīstība un riska uzņemšana: apņemšanās nepārtraukti iterēt, ātri prototipēt un vēlme uzņemties nozīmīgus riskus, pat ja tas nozīmē saskarties ar neveiksmēm vai skepsi. Ekosistēmu veidošana: uzmanība pievērsta visaptverošu platformu un ekosistēmu izveidei, kas veicina plašu pieņemšanu un ļauj trešo pušu attīstību, tādējādi palielinot tehnoloģiju klāstu un lietderību. Uzsvars uz savienojumu un pieredzi: Galvenais uzskats par tehnoloģiju spēku savienot cilvēkus un uzlabot viņu pieredzi, vai nu ar saziņas, izklaides vai jaunu klātbūtnes veidu palīdzību. Adaptīvā stratēģija: spēja pārvērst un pielāgot stratēģijas, reaģējot uz tehnoloģiju attīstību, lietotāju atsauksmēm un tirgus pārmaiņām, vienlaikus saglabājot vispārējo redzējumu. Tāpēc nākotnes veidošanas “attīstītā paradigma” ne tikai izklāstītu tehnoloģisko sasniegumu sēriju, bet tā vietā iekapsulētu stratēģisko domāšanu, kas nepieciešama, lai iedomātu, izveidotu un popularizētu pilnīgi jaunas digitālās sfēras. Šī pieeja atzīst, ka nākotne nav vienkārši atklāta, bet aktīvi veidota, izmantojot apzinātas izvēles, masveida ieguldījumus un drosmi sekot idejām, kas sākotnēji varētu šķist dīvainas. Tā ir par abstraktu jēdzienu, piemēram, "pastāvības" vai "savstarpējas savienojamības", tulkošanu par konkrētiem, mērogojamiem tehnoloģiskiem risinājumiem. Tā kā determinisms tagad ir atrisināta problēma, AI laboratorijas var sākt veidot jaunu produktu klases. vistiešākais pielietojums būtu "auditējamie aģenti", kas ne tikai automatizē uzdevumus, bet arī nodrošina pārbaudāmu, soli pa solim izsekojamu to "domāšanu", tāpat kā deterministiskā AI skaidra loģika.6 Tas ļautu LLM darbināmajām sistēmām izmantot automatizētu juridisko līgumu pārskatīšanu, medicīniskās diagnostikas atbalstu un finanšu atbilstības pārbaudes.7 Šīs sistēmas apvienotu LLM plašās zināšanas un ģeneratīvās spējas ar tradicionālās, uz noteikumiem balstītas sistēmas uzticamību un revidējamību. Šī evolūcija, visticamāk, radīs "hibrīdās sistēmas", kas apvienos deterministiskas un ģeneratīvas pieejas.6 Šādā sistēmā radoša, probabilistiska LLM varētu radīt plašu ideju klāstu, kuras pēc tam izsmalcina un īsteno deterministiska LLM, kas nodrošina galīgo rezultātu konsekvenci, uzticamību un atbilstību iepriekš definētu noteikumu vai shēmu kopumam. Cilvēki runā par metaversi, viņi runā par sociālo, viņi runā par visām šīm lietām, bet fundamentālā realitāte ir tāda, ka mēs veidojam infrastruktūru nākamās paaudzes cilvēku un mašīnu mijiedarbībai. Pārāk ilgi, ģeneratīvais AI ir bijis šis pārsteidzošais radošais spēks, bet tas ir bijis nejauši. Tas ir bijis kā cilvēks, un jūs nevarat veidot uzticamu biznesu uz kaut ko, kas ir tikai... nejauši. Mēs esam redzējuši, kā mūsu draugi OpenAI palielina milzīgu "8,3 miljardu dolāru apmērā, lai piesaistītu 40 miljardu dolāru finansējumu" 14 un mūsu draugi Anthropic palielina "13 miljardu dolāru F sērijas" 4 , jo viņi to iegūst. Tas, uz ko mēs koncentrējamies, ir ne tikai veidot lielākus modeļus; mēs veidojam jaunu pamatu. fonds, kurā, ņemot vērā to pašu ieguldījumu, jūs saņemsiet to pašu izeju. Tas ir tik vienkārši. Tas ir tik dziļi. Tas ir tas, kas atver nākamo izaugsmes fāzi un pierāda, ka bezprecedenta kapitāls, ko mēs visi izmantojam - tāda veida kapitāls, kas finansēs lietas, piemēram, OpenAI $ 500B Stargate iniciatīva 14 - ir likme uz kaut ko reālu un kaut ko paredzamu. Mēs ne tikai veidojam burvju kasti; mēs veidojam domāšanas mašīnu. avotiem Panākt konsekvenci un reproducējamību lielajos valodu modeļos (LLM) eBay AI Mind, piekļuves datums ir 2025. gada 10. septembris, https://pub.aimind.so/creating-deterministic-consistent-and-reproducible-text-in-llms-e589ba230d44 "Deterministisko" LLM iestatījumu nenoteiktība - arXiv, piekļuves datums 2025. gada 10. septembris, https://arxiv.org/html/2408.04667v4 Vai temperatūra 0 garantē deterministisku LLM iznākumu? - Vincent Schmalbach, piekļuves datums 2025. gada 10. septembris, https://www.vincentschmalbach.com/does-temperature-0-guarantee-deterministic-llm-outputs/ Anthropic palielina $ 13B sērija F par $ 183B pēc naudas novērtējumu, piekļuves 2025. gada 10. septembrī, https://www.anthropic.com/news/anthropic-raises-series-f-at-usd183b-post-money-valuation Cohere palielina 500 miljonus dolāru par 6,8 miljardiem dolāru, lai paātrinātu uzņēmumu efektivitāti ar aģentu AI, piekļuve 2025. gada 10. septembrī https://www.investpsp.com/en/news/fresh-funding-enables-cohere-to-accelerate-its-global-expansion-and-build-the-next-generation-of-secure-enterprise-and-sovereign-ai-solutions/ Deterministic vs. Generative AI: Galvenās atšķirības - Sombra, piekļuves datums 2025. gada 10. septembris, https://sombrainc.com/blog/deterministic-vs-generative-ai Saprotot trīs AI sejas: Deterministisks, probabilistisks un ģeneratīvs, mākslīgais intelekts, MyMobileLyfe, AI konsultācijas un digitālais mārketings, pieejams 2025. gada 10. septembrī, https://www.mymobilelyfe.com/artificial-intelligence/understanding-the-three-faces-of-ai-deterministic-probabilistic-and-generative/ Dzimšanas stratēģijas - Hugging Face, pieejams 2025. gada 10. septembrī, https://huggingface.co/docs/transformers/generation_strategies Dekodēšanas stratēģijas valodu modeļos: kā LLM izvēlas nākamo vārdu?, pieejams 2025. gada 10. septembrī, https://www.metriccoders.com/post/decoding-strategies-in-language-models-how-do-llms-pick-the-next-word Izpratne par to, kāpēc deterministisks iznākums no LLM ir gandrīz neiespējams - Neskarts, piekļuves datums 2025. gada 10. septembris, https://unstract.com/blog/understanding-why-deterministic-output-from-llms-is-nearly-impossible/ Par LLM reproducējamību, Aritra Biswas, piekļuves datums 2024. gada 10. septembris, https://www.aritro.in/post/on-llm-reproducability/ Atjaunojams AI: kāpēc tas ir svarīgi un kā to uzlabot - pētījums AIMultiple, piekļuves datums 2025. gada 10. septembris, https://research.aimultiple.com/reproducible-ai/ Cohere Paaugstina $500M, Iegūst $6.8B Valuation Átha Raison Early Investor, piekļuves datums ir 2025. gada 10. septembris, https://raison.app/news/portfolio-companies/cohere-raises-500m-at-6-8b-valuation-enterprise-ai-becomes-the-next-battleground OpenAI paaugstina $ 8.3B pret savu $ 40B fondu - Maginative, piekļuves datums ir 2025. gada 10. septembris, https://www.maginative.com/article/openai-raises-8-3b-toward-its-40b-fundraise/ OpenAI iegūst 8,3 miljardus dolāru ar 300 miljardu dolāru vērtējumu - Cosmico, piekļuve 2025. gada 10. septembrī, https://www.cosmico.org/openai-raises-8-3-billion-at-a-300-billion-valuation/ Anthropic - Pievienojieties Prospect, pieejams 2025. gada 10. septembrī, https://www.joinprospect.com/company/anthropic https://pub.aimind.so/creating-deterministic-consistent-and-reproducible-text-in-llms-e589ba230d44 https://arxiv.org/html/2408.04667v4 https://www.vincentschmalbach.com/does-temperature-0-guarantee-deterministic-llm-outputs/ https://www.anthropic.com/news/anthropic-raises-series-f-at-usd183b-post-money-valuation https://www.investpsp.com/en/news/fresh-funding-enables-cohere-to-accelerate-its-global-expansion-and-build-the-next-generation-of-secure-enterprise-and-sovereign-ai-solutions/ https://sombrainc.com/blog/deterministic-vs-generative-ai https://www.mymobilelyfe.com/artificial-intelligence/understanding-the-three-faces-of-ai-deterministic-probabilistic-and-generative/ https://huggingface.co/docs/transformers/generation_strategies https://www.metriccoders.com/post/decoding-strategies-in-language-models-how-do-llms-pick-the-next-word https://unstract.com/blog/understanding-why-deterministic-output-from-llms-is-nearly-impossible/ https://www.aritro.in/post/on-llm-reproducibility/ https://research.aimultiple.com/reproducible-ai/ https://raison.app/news/portfolio-companies/cohere-raises-500m-at-6-8b-valuation-enterprise-ai-becomes-the-next-battleground https://www.maginative.com/article/openai-raises-8-3b-toward-its-40b-fundraise/ https://www.cosmico.org/openai-raises-8-3-billion-at-a-300-billion-valuation/ https://www.joinprospect.com/company/anthropic