Isaky ny volana vitsivitsy, misy olona milaza fa "ny AI dia hanolo antsika rehetra." Satria miasa akaiky amin'izany aho, dia mahazo izany fanontaniana izany mandrakariva. Fa jereo akaiky kokoa: AI dia tsy manolo-tena Izany dia manolo Ary misy ny fahasamihafana goavana. people tasks Ny LLM dia parrot miaraka amin'ny motera jet Ny modely fiteny lehibe toy ny ChatGPT, Claude, ary DeepSeek dia natao hanambara ny token manaraka amin'ny fomba mahatalanjona izay mahatsapa fa olona iray no nanoratra azy, ary mahatalanjona izy ireo amin'izany. Na dia tsara aza ny Tsy mitovy amin'ny . sounding right being right Ireo modely ireo dia mianatra avy amin'ny fampifangaroana boky, lahatsoratra, code repos, Wikipedia, lahatsoratra ao amin'ny sehatra, ary tranonkala voafafa. Ny sasany amin'izy ireo dia voamarina amin'ny mpivady. Ny ankamaroany dia tsy. Tsy misy tafika mpamoaka manamarina ny fahamarinana amin'ny andininy tsirairay. Ny angon-drakitra dia voafafafa amin'ny fifanarahana, fahasamihafana, zava-misy efa lasa, ary famoronana mivantana. Mieritreritra izany toy ny fianarana zava-mahadomelina avy amin'ny boky ara-pahasalamana rehetra voasoratra... ary ny sehatra tsirairay, bilaogy horoscope tsirairay, ary tranonkala vitsivitsy ho an'ny fepetra tsara ” izay endriky ny zava-misy. Izy io dia tena tsara amin'ny fanamafisana ny fitenin'ny fifanarahana. know Efa nahita avy amin'ny voalohany aho hoe nahoana izany no zava-dehibe. Quality Over Quantity Ny kalitao mihoatra noho ny habetsaky ny Tamin'ny 2016, niasa tamin'ny tetikasa fianarana milina aho mba hamantatra rindrambaiko malware. Microsoft dia nanana dataset Kaggle (Microsoft Malware Classification Challenge) ho an'ity olana ity. Ny mpitarika ahy dia nanoro hevitra ahy mba hampiasa izany na hiteraka angon-drakitra synthesized. Nandritra ny volana vitsivitsy, nametraka rindrambaiko malware isan'andro aho, nandeha ny sampana tao amin'ny sandbox, namorona binary, ary nanamarika azy ireo aho. Amin'ny farany, nanana dataset ny malware 120.000 sy ny sampana tsara tarehy, izay kely kokoa noho ny Microsoft, fa naorina amin'ny tanana. Ny vokatra dia niteny mafy: Training Dataset Accuracy Microsoft Kaggle dataset 53% My own hand-built dataset 80% My dataset + synthetic data 64% Ny angon-drakitra amin'ny Microsoft Kaggle Ny 53% Ny angon-drakitra voajanahary Ny 80 isan-jato Ny dataset + ny angon-drakitra sintetika 64 isan-jato Ny algorithm dia mitovy, ny taratasy ihany no miova. Ny lanjany: ny vokatra tsara indrindra dia avy amin'ny angon-drakitra manam-pahaizana. Ny angon-drakitra manam-pahaizana dia ahitana fahadisoana; ny angon-drakitra sintetika dia nampidirina ny fahadisoany manokana. Ny hany fomba hahazoana famantarana avo lenta dia ny fampiasam-bola fotoana, fahaiza-manao ary vola amin'ny fanasitranana. Izany no mifanohitra amin'ny fomba fampiofanana ny LLM: manapaka ny zava-drehetra izy ireo ary miezaka hianatra avy amin'izany, ny anomaly ary ny zava-drehetra. ary Salmona niteraka an'i Boaza tamin-dRahaba ; ary Boaza niteraka an'i Obeda tamin-dRota ; ary Obeda niteraka an'i Jese ; . digital inbreeding Ny aterineto dia efa feno votoaty ambany kalitao alohan'ny ho tonga ny LLMs: fake vaovao, fikasana "how-tos", fako code, spam texts. Iza no manara-maso? Amin'izao fotoana izao, ny ankamaroan'ny filalaovam-pitsaboana, ny sasany amin'ireo olona, ary ny rafitra fisainana anatiny. Tsy misy mifanaraka amin'ny fanadihadiana amin'ny ankapobeny, tsy misy fankatoavana, tsy misy fitarainana amin'ny angon-drakitra ratsy. Aiza no mahazo ny angon-drakitra vaovao? Izany dia miteraka ny fanontaniana mazava: Rehefa ny aterineto amin'ny ankapobeny dia efa voafehy, voavonjy, ary mitombo amin'ny synthesis? where do we find fresh, high-quality training data Ny hevitra voalohany dia ny ankamaroan'ny olona manana “Hahazo fampiofanana fotsiny izahay amin'ny angon-drakitra mpampiasa.” Tamin'ny taona 2023 dia nanandrana izany tamin'ny fanombohan'ny gamedev aho. - fitaovana AI hanampy ny mpamorona hanorina tontolo RPG. Nieritreritra izahay fa ny beta-test logs dia ny fitaovana fampiofanana tsara: ny endrika marina, ny fifandraisana tena izy, mifandray mivantana amin'ny sehatry ny sehatra. Fortune Folly Ny fanafihana ? Ny mpamatsy tsirairay dia niteraka angon-drakitra bebe kokoa noho ny mpampiasa mahazatra dimy ambin'ny folo miaraka, fa tsy noho ny fanorenana tontolo manan-karena kokoa izy ireo.Nandritra izany fotoana izany dia miezaka tsy mitsahatra ny hitarika ny rafitra amin'ny votoatin'ny firaisana ara-nofo, ny fangatahana baomba, ary ny valin'ny fanavakavahana ara-tsosialy. Tsy voafehy, izay angon-drakitra Ny fitondran-tenan'ny modely dia efa nianatra ny hanara-maso ny mpanafika, fa tsy ny fiaraha-monina izay miezaka manompo. Ny fanafody Izany dia marina ny Raha tsy misy fanadihadiana sy fanaraha-maso ara-toekarena amin'ny olombelona, dia afaka manoratra ny ratsy indrindra, fa tsy ny tsara indrindra, ny angon-drakitra momba ny olombelona ny "mampiasa tena" ary ny modely dia hamerina izany amin'ny finoana. data-poisoning problem Ny Takeaway dia Ny ChatGPT dia dingana voalohany eo amin'ny lalana mankany amin'ny "fanovàna". Toy ny manam-pahaizana amin'ny zavatra rehetra, fa amin'ny tena izy, dia manam-pahaizana amin'ny fiteny voajanahary. Ny hoavin'izy ireo dia toy ny ho an'ny fifanakalozan-kevitra eo aminareo sy ireo modely manokana amin'ny sehatry ny sehatry ny sehatra izay nianatra amin'ny angon-drakitra voatahiry tsara. Na izany aza, ireo modely ireo dia mbola mila fanavaozana tsy tapaka, fanamarinana ary fahaiza-manaon'ny olombelona ao ambadiky ny sehatra. interface Ny tena “fandrahonana fanovàna” dia ho tonga raha mahomby isika hanorina iray manontolo. : scrapers izay manangona angon-drakitra amin'ny fotoana tena izy ireo, modely mpitsara izay manamarina sy manamarina ny zava-misy, ary modely manam-pahaizana izay mandray ity fahalalana mazava ity. fabric of machine learning systems Saingy tsy mino aho fa any akaikin'izany isika. Amin'izao fotoana izao, efa mandoa angovo be dia be isika mba hiteraka fehezan-teny mitovy amin'ny olombelona fotsiny. Ny fampitomboana ho amin'ny ambaratonga ilaina amin'ny fotoana tena izy, ny fahalalana manamarina tanteraka dia mitaky hery sy hery bebe kokoa noho izay azontsika azo antoka. Efa nahita fanandramana mahatalanjona tao amin'ny fitsaboana aho, fa ny tsirairay amin'izy ireo dia miankina amin'ny ekipan'ny manam-pahaizana miasa ora maromaro amin'ny famolavolana, fanadiovana ary fanamarinana ny angon-drakitra. Raha ny marina: AI may replace tasks, but it’s nowhere close to replacing people.