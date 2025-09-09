Böyük dil modelləri yalnız şeyləri yanlış qəbul etmir – onlar yanlışları faktlar kimi təqdim edirlər. GPT-5-nin yerləşdirilmiş hataların həcmi 1.4% - GPT-4-in 1.8% -dən aşağı və yalnız 0.09% GPT-4-in 1.49% -dən yaxşıdır. LLM hallucinasiya liderboard Bir az yaxşılaşdı, amma problem qalır. Xatırladaq ki, 2024-ci ilin ortalarında Google'ın AI İncilləri insanlara minerallıq üçün daş yeməyi söylədi - Google daha sonra problemini qəbul etdi.2023-ci ilin başında, Google'ın Bard demo James Webb Space Telescope faktını yanlışlaşdırdı. Bu, gülünc başlıqlar kimi görünür, lakin insanlar bu alətlərə həqiqətən təvəkkül edərlər.Küçük hatalar ancaq pisdir, lakin sağlıq, hukuk və ya terapiya kimi sektorlarda onlar təhlükəlidirlər. What causes hallucinations in LLMs LLM-də halüsinasiyaların səbəbləri LLM-lər, ChatGPT-yə daxil olmaqla, bir sıraya bir sonraki sözünü öngörmək üçün, həqiqətləri doğrulamak üçün öyrənilirlər. Onlar garantiyalı həqiqətlərin yerləşdirilmiş bazasına malik deyillər; bunun yerine, eğitim verilərindən şablonları sintez edərək metni yaradırlar. Bu gün internetin çoxu AI- yazılmışdır, belə ki, modellər öz outputlarından öyrənməyə başlayır. No more free data Artıq heç bir data 2023-ci ilin ortasına qədər, istifadəçi yaradılan içkilərin (UGC) platformaları quraşdırmağa başladı.Reddit öz ücretsiz API-ni kəskinleştirdi; subreddits qaranlıqlaşdı. Twitter/X öz öz API-ni quraşdırdı.LinkedIn bulk scraping-i məhv etdi.Stack Overflow Q&A-ya quraşdırma quraşdırması üçün xərcləyəcəyini deyib.Quora Poe app-una daha çox içkilər yerləşdirdi.Meta Facebook və Instagram-da qiymət limitləri və yasal xəbərdarlıqları sürətləndirdi. “Big AI” şirkətləri ödəyilən lisenziyalara keçdi və public modelləri daha yaşlı, qarışıq web veriləriyle qoyuldu – bu da onların öz AI-ya yazılmış texti ilə öyrənəcəklərini daha çox göstərdi. Paying for access Qasırğalar üçün xərclər OpenAI ilk olaraq 2023-ci ildə Associated Press ilə anlaşma imzaladı, Axel Springer və News Corp. ilə uzun müddətli anlaşmaların ardınca 2025-ci ilə qədər, The Guardian və The Washington Post daxildir. 2024-ci ildə AI eğitim-data bazarının qiyməti 3,2 milyard dollar təşkil edir və 2034-ci ilə qədər 16,3 milyard dollar təşkil edəcək. Where the clean data lives Sağlam məlumatların yaşadığı yerlər Lisenziyalı və təmizləşdirilmiş data sektor-specifik rezervuarlar yaratır: \n \n \n \n \n \n News & Publishing (2023–25): AP, Axel Springer, News Corp, Dotdash Meredith; plus The Guardian, The Washington Post, Vox Media, və The Atlantic (arxiv quraşdırma və in-product linking/attribution) kombinasiyası. Akademik və kultural (2024–25): Harvardun public-domain kitabları; MIT-in verilişindəki iş; arXiv və Semantic Scholar kimi açıq repositorylar. Medical & reliability (2025): Research repositories such as ScaleMAI (curated medical imaging) and DR-AIR (AI reliability datasets); PubMed abstraktları açılıb, lakin bir çox tam texnologiya kəşf edilir. Commercial & Enterprise (2023–25): BloombergGPT-nin patentli finans vergiləri ilə məşğul olması; Thomson Reuters-in bütünlükləri ilə istifadə edilə bilər; böyük data / anotasiya sağlayıcıları (Appen, Scale AI); plus şirkətlər içində istifadə edilən sensor / endüstri telemetri. Specialized (2025): Licenseed training data and infrastructure (e.g., Meta-Scale AI) və “Fairly Trained” sertifikasiyası. “New York Times” 2023-ci ildə “OpenAI” və “Microsoft”ı cəzalandırıb. “Financial Times” “OpenAI” ilə 2024-ci ildə anlaşma imzaladı. “Elsevier” və “Wiley” “Bloomberg” şirkəti “Bloomberg” şirkəti “Bloomberg” şirkəti “Bloomberg” şirkəti “Bloomberg” şirkəti “Bloomberg” şirkəti “Bloomberg” şirkəti “Bloomberg” şirkəti “Bloomberg” şirkəti “Bloomberg” şirkəti “Bloomberg” şirkəti “Bloomberg” şirkəti “Bloomberg” şirkəti “Bloomberg” şirkəti “Bloomberg” şirkəti “Bloomberg” şirkəti “Bloomberg” şirkəti “Blo Paid, specialised data is next Sonrakı xəbərPayed, Specialized Data Biz həqiqətən bir bölünməyə yönələcəyik: açıq web, sürətli baxışlar, tekst yazmaq və ya gündəlik sorğuya cavab vermək kimi asan işlər üçün xeyirlidir; ciddi araşdırmalar, analizlər və AI inşaatları - test edilmiş, filtrləşdirilmiş, verifikasiya edilmiş - məlumatların təmiz tanklarına çevrilir. böyük şirkətlər bunu sürətləndirir, çünki pis məlumatlar onları yavaşlatır. Bu set-up rol bazlı qələbəyə ehtiyacı var - HR HR görür, finans finansa görür, yasal yeganə görür. rol bazlı qələbə anlamına gelir ki, model yalnız kişi görünmək üçün quraşdırılmış olan şeylərdən çəkir. Xatırladaq ki, əgər bu yanaşma davam edərsə, rol-bilinçli arama və qapalı bilgi bazaları quran komandalar təvəkkül alacaq - və kontratlar. What to do with only public AI access Yalnız public AI access ilə nə etmək olar? VVD - Hollandiyada futbolçu bu adla tanımır, orada VVD daha çox mərkəz-sağı təmsilən edən siyasi partiyanın adının qısaltması kimi bilinir - artıq sorğu-suala ehtiyacı olmayan ulduzdu. Ən yaxşı praktikalar: \n \n \n \n \n \n \n \n \n \n \n \n Əsas səhifə » Əsas səhifə » Əsas səhifə » Əsas səhifə » Əsas səhifə » Əsas səhifə » Əsas səhifə » Əsas səhifə » Əsas səhifə Xüsusilə, özünüzü seçin və özünüzü seçin (təkcə, <data>...</data>), sonra modelə yalnız o tekstdən cavab verməyi əmr edin. The bottom line Aşağı hattı 2025-ci ilə qədər bölünmə açıqdır: \n \n \n Xatırladaq ki, ABŞ-ın İŞİD-ə qarşı həddi aşan silahlı saldırıları, terrorçuların həlak olması, terrorçuların həlak olması, terrorçuların həlak olması, terrorçuların həlak olması, terrorçuların həlak olması, terrorçuların həlak olması, terrorçuların həlak olması, terrorçuların həlak olması, terrorçuların həlak olması, terrorçuların həlak olması, terrorçuların həlak olması, terrorçuların həlak olması ilə bağlıdır. VVD - Hollandiyada futbolçu bu adla tanımır, orada VVD daha çox mərkəz-sağı təmsilən edən siyasi partiyanın adının qısaltması kimi bilinir - artıq sorğu-suala ehtiyacı olmayan ulduzdu. İkisi də davam edəcək.Fark elədir ki, biri hündürlüyü, diğeri isə sorğu-sual etməkdir. 