ប្រភពបើកចំហ៖ ជំហានបន្ទាប់ក្នុងបដិវត្តន៍ AI

ស្រមៃមើលអនាគតដែល AI មិនត្រូវបានចាក់សោរនៅក្នុងតុដេកសាជីវកម្ម ប៉ុន្តែត្រូវបានសាងសង់ឡើងដោយឥដ្ឋដោយសហគមន៍អ្នកច្នៃប្រឌិតសកល។ ដែលជាកន្លែងដែលការសហការគ្នា មិនមែនជាការប្រកួតប្រជែង ជំរុញឱ្យមានការរីកចម្រើន និងការពិចារណាប្រកបដោយក្រមសីលធម៌ មានទម្ងន់ស្មើគ្នាជាមួយនឹងការអនុវត្តជាក់ស្តែង។ នេះមិនមែនជារឿងប្រឌិតបែបវិទ្យាសាស្ត្រទេ វាគឺជាការបង្កាត់ភ្លើង នៅក្នុងបេះដូងនៃការអភិវឌ្ឍន៍ AI ។ ប៉ុន្តែ Big Tech មានរបៀបវារៈផ្ទាល់ខ្លួន ដោយបិទបាំងគំរូដែលបានដាក់កម្រិតជាប្រភពបើកចំហ ខណៈពេលដែលព្យាយាមទាញយកអត្ថប្រយោជន៍នៃសហគមន៍បើកចំហពិតប្រាកដ។ ប្រភពបើកចំហ សូមបកស្រទាប់នៃកូដត្រឡប់មកវិញ ហើយលាតត្រដាងការពិតនៅពីក្រោយកិច្ចខិតខំប្រឹងប្រែងទាំងនេះ។ ការរុករកអនាគតនៃប្រភពបើកចំហ AI នេះនឹងបំបែក "អ្នកក្លែងបន្លំ" និងជើងឯក "មនុស្សពិត" នៅក្នុងការអភិវឌ្ឍន៍ AI ដើម្បីបង្ហាញម៉ាស៊ីនច្នៃប្រឌិតដែលជាកម្មវិធីប្រភពបើកចំហដែលបន្លឺឡើងនៅក្រោមវាទាំងអស់។ ចំណុចសំខាន់គឺថា AI ប្រភពបើកចំហនឹងបង្កើតជង់ទិន្នន័យប្រភពបើកចំហ។ តម្រូវការ អត្ថបទថ្មីៗដោយ Matteo Wong នៅ The Atlantic ' ' ពិពណ៌នាអំពីនិន្នាការកើនឡើងនៅក្នុងវិស័យអប់រំ និងសហគមន៍កម្មវិធីសម្រាប់ប្រភពបើកចំហរពិតប្រាកដ AI ។ "គំនិតនេះគឺដើម្បីបង្កើតគំរូដែលមានតម្លាភាព ដែលសាធារណជនអាចប្រើប្រាស់ សិក្សា និងផលិតឡើងវិញបានយ៉ាងងាយស្រួល និងថោក ដោយព្យាយាមធ្វើប្រជាធិបតេយ្យនូវបច្ចេកវិទ្យាប្រមូលផ្តុំខ្ពស់ ដែលអាចមានសក្តានុពលក្នុងការបំប្លែងការងារ ប៉ូលីស ការកម្សាន្ត និងសូម្បីតែសាសនា។" អាត្លង់ទិកដដែលនេះណែនាំថាក្រុមហ៊ុនបច្ចេកវិទ្យាធំដូចជា Meta កំពុងព្យាយាមបំពេញតម្រូវការនេះនៅក្នុងទីផ្សារដោយ 'ការលាងបើកចំហ' ផលិតផលរបស់ពួកគេ។ ពួកគេកំពុងសន្មត់ថាគុណភាព និងកេរ្តិ៍ឈ្មោះវិជ្ជមាននៃសហគមន៍ប្រភពបើកចំហរដោយមិនមានប្រភពបើកចំហពិតប្រាកដពីផលិតផលរបស់ពួកគេ។ ប៉ុន្តែគ្មានអ្វីមកជំនួសវត្ថុពិតនោះទេ។ នេះគឺដោយសារតែកម្មវិធីប្រភពបើកចំហពិតជំរុញការច្នៃប្រឌិត និងការសហការ៖ គុណភាពពីរដែលត្រូវការយ៉ាងខ្លាំងដើម្បីឆ្ពោះទៅមុខជាមួយនឹង AI ប្រកបដោយទំនួលខុសត្រូវ។ មិនដែលមានរឿងបែបនេះដូចជា 'បើក' AI អ្នកធ្វើពុត 2 គឺជាគំរូភាសាដ៏ធំមួយដែលបង្កើតឡើងដោយ ដែលអាចប្រើបានដោយឥតគិតថ្លៃសម្រាប់ទាំងការស្រាវជ្រាវ និងការប្រើប្រាស់ពាណិជ្ជកម្ម។ អ្នកដឹកនាំមួយចំនួនដើម្បីណែនាំ LLaMA 2 គឺជាប្រភពបើកចំហ។ ទោះជាយ៉ាងណាក៏ដោយ Meta បានអនុវត្តការរឹតបន្តឹងធ្ងន់ធ្ងរមួយចំនួនលើការប្រើប្រាស់គំរូរបស់ពួកគេ។ ឧទាហរណ៍ LLaMA 2 មិនអាចត្រូវបានប្រើដើម្បីកែលម្អគំរូភាសាធំផ្សេងទៀតទេ។ មុខតំណែងដែលផ្ទុយនឹងប្រពៃណី នៃកម្មវិធីបើកចំហដែលលើកកម្ពស់ការបើកបង្ហាញដោយឥតគិតថ្លៃ និងបើកចំហនៃការច្នៃប្រឌិតសម្រាប់ជាប្រយោជន៍ដល់មនុស្សគ្រប់គ្នានៅក្នុងសហគមន៍កម្មវិធី។ LLaMA Meta គំរូច្នៃប្រឌិតរួមឯកជន Meta បានធ្វើឱ្យខូចដល់ការប្រើប្រាស់គំរូរបស់ពួកគេ ដោយមិនអនុញ្ញាតឱ្យមានការរួមបញ្ចូល LLaMA 2 ជាមួយនឹងផលិតផលដែលមានអ្នកប្រើប្រាស់ 700 លាននាក់ប្រចាំខែ ហើយដោយមិនបង្ហាញពីទិន្នន័យអ្វីដែលគំរូរបស់ពួកគេត្រូវបានបណ្តុះបណ្តាល ឬកូដដែលពួកគេបានប្រើដើម្បីបង្កើតវា។ ដោយមិនបញ្ចេញឈ្មោះ មេតាកំពុងបើកខ្លួនឯងចំពោះសំណួរនៃការលម្អៀងដែលកើតចេញពីកំណើត និងការរើសអើងដោយចៃដន្យ។ គំរូដែលត្រូវបានបណ្តុះបណ្តាលលើទិន្នន័យរើសអើងនឹង . ប្រសិនបើមិនមានសហគមន៍កម្មវិធីធំអាចមើលកូដដែលប្រើសម្រាប់បង្កើតគំរូ ដើម្បីមើលថាតើមានការការពារសុវត្ថិភាពណាមួយត្រូវបានបង្កើតឡើងនៅក្នុង ឬទិន្នន័យដែលប្រើដើម្បីបណ្តុះបណ្តាលវាទេ នោះយើងនៅតែស្ថិតក្នុងភាពងងឹតនៃសំណួរសីលធម៌ទាំងនេះ។ នៅក្នុងពេលវេលាមួយ។ មានការព្រួយបារម្ភខ្លាំងជាងចំពោះការអនុវត្តជាជាងយុត្តិធម៌ ហើយការគោរពការភាន់ច្រលំនេះមានការរំខានជាពិសេស។ ឆ្លើយតបដោយរើសអើង បោះពុម្ពផ្សាយការស្រាវជ្រាវលើ AI អ្នកពិត បានទទួលការទទួលស្គាល់សម្រាប់ម៉ូដែលភាសាធំៗដែលមានប្រភពបើកចំហ ជាពិសេស Mistral 7B និង Mixtral 8x7B។ ក្រុមហ៊ុនខិតខំធានានូវលទ្ធភាពប្រើប្រាស់យ៉ាងទូលំទូលាយចំពោះម៉ូដែល AI របស់ខ្លួន លើកទឹកចិត្តឱ្យមានការពិនិត្យឡើងវិញ កែប្រែ និងប្រើប្រាស់ឡើងវិញដោយសហគមន៍កម្មវិធីបើកចំហ។ Mistral AI តំណាងឱ្យ "ការបម្រើគំរូ latency ទាប វ៉ិចទ័រ" និងជាបណ្ណាល័យប្រភពបើកចំហដែលត្រូវបានរចនាឡើងជាពិសេសដើម្បីបង្កើនល្បឿន និងបង្កើនប្រសិទ្ធភាពគំរូភាសាធំ (LLMs) ។ វាគឺជាឧបករណ៍ដ៏មានអានុភាពដែលអាចធ្វើឱ្យប្រសើរឡើងយ៉ាងខ្លាំងនូវការអនុវត្ត និងការប្រើប្រាស់របស់ LLMs ។ នេះធ្វើឱ្យវាក្លាយជាទ្រព្យសម្បត្តិដ៏មានតម្លៃសម្រាប់អ្នកអភិវឌ្ឍន៍ដែលធ្វើការលើកម្មវិធី AI ជាច្រើនចាប់ពី chatbots និងជំនួយការនិម្មិតរហូតដល់ការបង្កើតមាតិកា និងការបង្កើតកូដ។ ដូច្នេះហើយ Mistral ណែនាំឱ្យប្រើ vLLM ជាម៉ាស៊ីនមេសន្និដ្ឋានសម្រាប់ម៉ូដែល 7B និង 8x7B ។ vLLM គឺជាមន្ទីរពិសោធន៍ស្រាវជ្រាវ AI ដែលមិនស្វែងរកប្រាក់ចំណេញ ដែលបានកើនឡើងពីម៉ាស៊ីនមេ Discord សម្រាប់ពិភាក្សាអំពី GPT-3 ទៅកាន់ស្ថាប័នស្រាវជ្រាវមិនស្វែងរកប្រាក់ចំណេញឈានមុខគេ។ ក្រុមនេះត្រូវបានគេស្គាល់ថាសម្រាប់ការងាររបស់ខ្លួនក្នុងការបណ្តុះបណ្តាលនិងការលើកកម្ពស់បទដ្ឋានវិទ្យាសាស្ត្របើកចំហក្នុងការដំណើរការភាសាធម្មជាតិ។ ពួកគេបានបញ្ចេញនូវគំរូភាសាធំៗជាច្រើនដែលបើកចំហរ ហើយត្រូវបានចូលរួមនៅក្នុងគម្រោងស្រាវជ្រាវទាក់ទងនឹងការតម្រឹម AI និងការបកស្រាយ។ របស់ពួកគេ។ គម្រោងគឺប្រហែលជាឧបករណ៍វាយតម្លៃប្រភពបើកចំហនាំមុខគេសម្រាប់គំរូភាសា។ EleutherAI LM-Harness គឺជា LLM របស់ Microsoft ដែលដាល់លើសពីទម្ងន់របស់វា។ បានទទួលការបណ្តុះបណ្តាលលើការបញ្ចូលគ្នានៃអត្ថបទសំយោគ និងគេហទំព័រដែលបានត្រង គំរូដ៏តូច ប៉ុន្តែមានថាមពលនេះពូកែខាងកិច្ចការដូចជា ការសួរចម្លើយ ការសង្ខេប និងការបកប្រែជាដើម។ អ្វីដែលពិតជាធ្វើឱ្យ Phi-2 ដាច់ពីគ្នាគឺការផ្តោតទៅលើការវែកញែក និងការយល់ដឹងអំពីភាសា ដែលនាំឱ្យដំណើរការគួរឱ្យចាប់អារម្មណ៍ ទោះបីជាមិនមានបច្ចេកទេសតម្រឹមកម្រិតខ្ពស់ក៏ដោយ។ ភី-២ គំរូបង្កប់ប្រភពបើកចំហដែលមានសមត្ថកិច្ចជាច្រើនកំពុងពង្រឹងទំហំ AI បង្កើតប្រភពបើកចំហទាំងមូល។ ទាំងនេះគឺជាទំនើបកម្មបច្ចុប្បន្នសម្រាប់ប្រភពបើកចំហ និងរួមបញ្ចូល និង . UAE-Large-V1 ពហុភាសា-e5-ធំ មានច្រើនទៀតនៅក្នុងវិស័យដែលកំពុងរីកចម្រើននេះ។ បញ្ជីមានកំណត់នេះគ្រាន់តែជាការចាប់ផ្តើមប៉ុណ្ណោះ។ Open Source Drives Innovation ដោយប្រកាន់យកនូវទស្សនវិជ្ជានៃការច្នៃប្រឌិតបើកចំហខ្លាំង ក្រុមហ៊ុនដែលចូលរួមយ៉ាងពិតប្រាកដនៅក្នុងការអភិវឌ្ឍន៍កម្មវិធីប្រភពបើកចំហប្រឈមនឹងសញ្ញាណប្រពៃណីនៃអត្ថប្រយោជន៍ប្រកួតប្រជែងដោយទទួលស្គាល់ថា . ការផ្លាស់ប្តូរនេះគាំទ្រ ថាការច្នៃប្រឌិតរួមគ្នានៅក្នុងប្រព័ន្ធអេកូប្រភពបើកចំហនាំទៅរកកំណើនទីផ្សារកាន់តែលឿន ដោយផ្តល់ឱ្យក្រុមហ៊ុនសូហ្វវែរតូចជាងមុនជាមួយនឹងមូលនិធិ R&D ដែលមានកម្រិតកាន់តែច្រើន។ ពី R&D spillovers ដែលមានវត្តមាននៅក្នុងកម្មវិធីប្រភពបើកចំហ។ នេះគឺដោយសារតែការបង្កើតថ្មីដោយចំហផ្ទុយពីការរកស៊ីបែបបុរាណ ដោយប្រើប្រាស់ភាពវៃឆ្លាតសមូហភាពរបស់សហគមន៍ ដោយមិនបន្ថយកិច្ចខិតខំប្រឹងប្រែងស្រាវជ្រាវ និងអភិវឌ្ឍន៍ផ្ទៃក្នុង។ មានន័យថាក្រុមហ៊ុនកម្មវិធីប្រភពបើកចំហមិនចាំបាច់លះបង់ថវិការបស់ខ្លួនដើម្បីបន្តការដឹកនាំដោយគំនិតនិងកូដនៅក្រៅស្ថាប័នរបស់ពួកគេ។ មិនមែនកូដល្អ ឬគំនិតល្អៗទាំងអស់ស្ថិតនៅក្នុងស្ថាប័នរបស់ពួកគេនោះទេ។ អាគុយម៉ង់ ឱកាសទទួលបានអត្ថប្រយោជន៍ ពង្រឹងធនធានផ្ទៃក្នុង លើសពីនេះ ក្រុមហ៊ុនកម្មវិធីប្រភពបើកចំហរជាយុទ្ធសាស្ត្រជំរុញការច្នៃប្រឌិតដោយ ដោយទទួលស្គាល់នូវលក្ខណៈប្រមូលផ្តុំនៃដំណើរការបង្កើតថ្មីនៅក្នុងសហគមន៍កម្មវិធី។ ទាំងអស់ដែលត្រូវនិយាយអ្វីមួយដែលមនុស្សជាច្រើនបានទទួលស្គាល់រួចហើយ៖ កម្មវិធីប្រភពបើកចំហជំរុញការច្នៃប្រឌិត។ ការចេញផ្សាយកូដមុនកាលកំណត់ និងញឹកញាប់ កិច្ចសហប្រតិបត្តិការអ្នកបង្កើតប្រភពបើកចំហ តាមរយៈ នៅក្នុងសហគមន៍កម្មវិធីប្រភពបើកចំហ សហគ្រិនអាចសម្រេចបានទាំងគោលដៅរយៈពេលខ្លី និងរយៈពេលវែង។ គោលដៅប្រាក់ចំណេញរយៈពេលខ្លីបង្កើតក្រុមហ៊ុន ហើយគោលដៅប្រាក់ចំណេញរយៈពេលវែងជួយទ្រទ្រង់ពួកគេ។ ក្នុងពេលជាមួយគ្នានេះ កិច្ចខិតខំប្រឹងប្រែងបង្កើតបណ្តាញនេះ ធ្វើឱ្យបណ្តាញខ្លួនឯងបន្តដំណើរការ - រីកលូតលាស់វាសម្រាប់សហគ្រិនបន្ទាប់។ វាត្រូវបានគេស្គាល់យ៉ាងច្បាស់ថាវេទិកាប្រភពបើកចំហផ្តល់នូវការចូលប្រើកូដប្រភព អនុញ្ញាតឱ្យអ្នកអភិវឌ្ឍន៍បង្កើតការអាប់ដេត កម្មវិធីជំនួយ និងផ្នែកផ្សេងទៀតនៃកម្មវិធី ហើយប្រើប្រាស់វាតាមតម្រូវការរបស់ពួកគេ។ ប្រភេទនៃការសហការពិសេសនេះបានជួបប្រទះការរីកចំរើនជាមួយនឹងការទទួលយក Kubernetes យ៉ាងទូលំទូលាយដោយសហគមន៍កម្មវិធីធំទូលាយ។ ឥឡូវនេះច្រើនជាងពេលណាៗទាំងអស់ បច្ចេកវិទ្យាទំនើបធ្វើការរួមគ្នាជាមួយនឹងការកកិតតិចតួចបំផុត ហើយអាចនៅជាមួយគ្នាស្ទើរតែគ្រប់ទីកន្លែង។ បណ្តាញ ក្រុមហ៊ុនបច្ចេកវិទ្យាធំៗទទួលស្គាល់ការសហការយ៉ាងស៊ីជម្រៅនេះដែលមាននៅក្នុងសហគមន៍ប្រភពបើកចំហ នៅពេលដែលពួកគេបញ្ចេញនូវក្របខ័ណ្ឌ បណ្ណាល័យ និងភាសាដែលពួកគេបានបង្កើតដោយសេរី ដើម្បីរក្សា និងអភិវឌ្ឍឧបករណ៍ខាងក្នុង។ ការធ្វើដូច្នេះកាន់តែស៊ីជម្រៅដល់ក្រុមអ្នកអភិវឌ្ឍន៍ដែលមានសមត្ថភាពធ្វើការលើផលិតផលរបស់ពួកគេ ហើយចាប់ផ្តើមកំណត់ស្តង់ដារសម្រាប់របៀបដែលបច្ចេកវិទ្យាស្រដៀងគ្នាគួរដំណើរការ។ អត្ថបទនៅអាត្លង់ទិកដដែលនោះបានដកស្រង់សំដីស្ថាបនិក Meta លោក Mark Zuckerberg ថាវាមានតម្លៃណាស់សម្រាប់ពួកយើងក្នុងការផ្តល់វា ពីព្រោះឥឡូវនេះអ្នកអភិវឌ្ឍន៍ល្អបំផុតទាំងអស់នៅទូទាំងឧស្សាហកម្មនេះកំពុងប្រើប្រាស់ឧបករណ៍ដែលយើងកំពុងប្រើប្រាស់ខាងក្នុងផងដែរ”។ Open Source Begets Open Source ទាំងនេះគឺជាកត្តាដែលនាំឱ្យយើងឃើញការសហការគ្នារវាងក្រុមហ៊ុនប្រភពបើកចំហរ។ ក្រុមហ៊ុន Open-source AI និង ML នឹងបង្កើតដំណោះស្រាយជាលក្ខណៈធម្មជាតិជាមួយនឹងផលិតផលប្រភពបើកចំហផ្សេងទៀតពីផលិតផលមូលដ្ឋានដូចជាការផ្ទុកវត្ថុរហូតដល់ជង់រហូតដល់ឧបករណ៍មើលឃើញ។ នៅពេលដែលក្រុមហ៊ុនប្រភពបើកចំហមួយបោះជំហានទៅមុខ យើងទាំងអស់គ្នាធ្វើ។ វិធីសាស្រ្តដ៏ស្អិតរមួត និងរួមបញ្ចូលគ្នានេះគឺប្រហែលជាការភ្នាល់ដ៏ល្អបំផុតរបស់យើងសម្រាប់ការអភិវឌ្ឍន៍ AI ដែលប្រើវិធីសាស្រ្តផ្តោតលើមនុស្ស។ កម្លាំងធម្មជាតិទាំងនេះដែលមាននៅក្នុងតម្រូវការទីផ្សារសម្រាប់ប្រភពបើកចំហ AI រួមបញ្ចូលគ្នាជាមួយនឹងគុណភាពនៃកម្មវិធីប្រភពបើកចំហនៃការច្នៃប្រឌិត និងការសហការនឹងជំរុញឱ្យប្រភពបើកចំហជង់ទិន្នន័យ AI ។ សូមចូលរួម និងរួមចំណែកក្នុងការសន្ទនានេះ និងសហគមន៍របស់យើងដោយផ្ញើអ៊ីមែលមកយើង ឬផ្ញើសារមកយើងនៅលើ របស់យើង។ សួស្តី@min.io ឆានែល Slack បោះពុម្ភ ផងដែរ។ នៅទីនេះ