Келечекти элестетип көргүлө, AI корпоративдик сейфтерде эмес, ачык жерге, кирпичтен кирпичтен, инноваторлордун дүйнөлүк коомчулугу тарабынан курулган. Атаандаштык эмес, кызматташуу алдыга жылууга өбөлгө түзөт жана этикалык ой жүгүртүүлөр чийки аткаруу менен бирдей салмакка ээ. Бул илимий фантастика эмес, бул AI өнүктүрүүнүн жүрөгүндө пайда болгон ачык булак революциясы. Бирок Big Tech өзүнүн күн тартибине ээ, чектелген моделдерди ачык булак катары жаап, чындап ачык коомчулуктун пайдасын көрүүгө аракет кылат.
Келгиле, коддун катмарларын тазалап, бул аракеттердин артында турган чындыкты ачалы. Ачык булактуу AIнын келечегин изилдөө "подборщиктерди" бөлүп-жарып, AI өнүктүрүүдөгү "чыныгыларды" жеңип, анын астында ачык булактуу программалык камсыздоонун инновациялык кыймылдаткычын ачып берет. Жыйынтык - ачык булактуу AI ачык булактуу маалымат стекин пайда кылат.
The Need
Жакында Маттео Вонгдун The Atlantic журналындагы макаласы, ' "Ачык" AI сыяктуу нерсе эч качан болгон эмес ' чындап ачык булактуу AI үчүн академияда жана программалык камсыздоо коомчулугунда өсүп жаткан тенденцияны сүрөттөйт. "Идея - жумушту, полицияны, эс алууну жана ал тургай динди өзгөртүү мүмкүнчүлүгүнө ээ болушу мүмкүн болгон жогорку концентрацияланган технологияны демократиялаштырууга аракет кылып, коомчулук оңой жана арзаныраак колдоно ала турган салыштырмалуу ачык моделдерди түзүү." Ошол эле Атлантика Мета сыяктуу Big Tech компаниялары базардагы бул муктаждыкты өз өнүмдөрүн “ачык жууп” толтурууга аракет кылып жатканын болжолдойт. Алар ачык булактуу коомчулуктун сапаттарын жана оң репутациясын өз өнүмдөрүн чындап ачык-айрымсыз эле алып жатышат. Бирок, чыныгы нерсени эч кандай алмаштыра албайт. Себеби, чыныгы ачык булактуу программа инновацияларды жана кызматташууну шарттайт: AI менен алдыга жылуу үчүн өтө зарыл болгон эки сапат.
The Pretenders
LLaMA 2, Meta тарабынан түзүлгөн чоң тил модели, аны изилдөө жана коммерциялык максаттарда колдонууга акысыз. Кээ бирөөлөр LLaMA 2 ачык булак экенин сунушташат. Бирок, Meta алардын моделин колдонуу боюнча кээ бир катуу чектөөлөрдү ишке ашырган. Мисалы, LLaMA 2 башка чоң тил моделин жакшыртуу үчүн колдонулушу мүмкүн эмес. салтка карама-каршы келген позиция жеке жамааттык инновация модели программалык камсыздоо коомчулугунун ар биринин кызыкчылыгы үчүн инновациялардын эркин жана ачык ачылышына өбөлгө түзгөн ачык программалык камсыздоонун.
Meta LLaMA 2ди ай сайын 700 миллион колдонуучулары бар өнүмдөр менен интеграциялоого жол бербөө жана алардын модели кандай маалыматтарга үйрөтүлгөнүн же аны куруу үчүн колдонгон кодду ачыкка чыгарбай, алардын моделин колдонууну андан ары кыйратты. Ачыкка чыгарбоо менен, Мета өзүнө мүнөздүү бир жактуулук жана кокустук басмырлоо маселелерин ачып жатат. Дискриминациялык маалыматтар боюнча үйрөтүлгөн модель болот дискриминациялоочу жоопторду берет . Жалпысынан программалык камсыздоо коомчулугу моделди түзүү үчүн колдонулган кодду же кандайдыр бир коопсуздук чаралары орнотулганын же аны үйрөтүү үчүн колдонулган маалыматтарды көрө албаса, биз бул моралдык суроолор боюнча караңгылыкта калабыз. Качанкы убакта AI боюнча изилдөө жарыяланган адилеттүүлүккө караганда аткарууга көбүрөөк көңүл бурат жана бул башаламандык өзгөчө тынчсыздандырат.
Чыныгылар
Mistral AI өзүнүн ачык булактуу чоң тил моделдери, атап айтканда Mistral 7B жана Mixtral 8x7B үчүн таанылды. Компания өзүнүн AI моделдерине кеңири жеткиликтүүлүктү камсыз кылууга умтулуп, ачык программалык камсыздоо коомчулугу тарабынан карап чыгууга, өзгөртүүгө жана кайра колдонууга үндөйт.
vLLM "векторлоштурулган аз кечигүү моделин тейлөө" дегенди билдирет жана чоң тил моделдерин (LLM) тездетүү жана оптималдаштыруу үчүн атайын иштелип чыккан ачык булактуу китепкана. Бул LLMлердин иштешин жана колдонууга жарамдуулугун олуттуу түрдө жакшыртуучу күчтүү курал. Бул аны чатботтордон жана виртуалдык жардамчылардан тартып контентти түзүүгө жана кодду жаратууга чейин ар кандай AI тиркемелеринде иштеген иштеп чыгуучулар үчүн баалуу активге айлантат. Ошентип, Mistral vLLMди 7B жана 8x7B моделдери үчүн корутунду сервери катары колдонууну сунуштайт.
EleutherAI GPT-3 талкуулоо үчүн Discord серверинен алдыңкы коммерциялык эмес изилдөө уюмуна чейин өскөн коммерциялык эмес AI изилдөө лабораториясы. Бул топ Табигый тилди иштетүүдө ачык илим нормаларын окутуу жана жайылтуудагы иши менен белгилүү. Алар ар кандай ачык булактуу чоң тил моделдерин чыгарышты жана AI тегиздөө жана интерпретациялоо менен байланышкан изилдөө долбоорлоруна катышат. Алардын LM-Harness долбоор, балким, тил моделдерин баалоонун алдыңкы инструменти болуп саналат.
Phi-2 Майкрософттун LLM компаниясы, ал өзүнүн салмагынан жогору турат. Синтетикалык тексттердин жана чыпкаланган веб-сайттардын аралашмасы боюнча машыккан бул кичинекей, бирок күчтүү модель суроого жооп берүү, жыйынтыктоо жана которуу сыяктуу тапшырмаларды аткарууда мыкты. Phi-2ди чындап айырмалап турган нерсе - анын ой жүгүртүүгө жана тилди түшүнүүгө багытталгандыгы, ал тургай алдыңкы тегиздөө ыкмалары жок эле таасирдүү аткарууга алып келет.
Көптөгөн компетенттүү ачык булактуу кыстаруу моделдери жалпы ачык булактуу генеративдик AI мейкиндигин күчөтүүдө. Булар ачык булак үчүн учурдагы заманбап жана камтыйт БАЭ-Ларге-V1 жана көп тилдүү-e5-largel .
Барган сайын өсүп жаткан бул тармакта дагы көптөгөн нерселер бар. Бул чектелген тизме башталышы гана.
Ачык булак инновацияларды жетектейт
Өтө ачык инновация философиясын кабыл алып, ачык булактуу программалык камсыздоону иштеп чыгууга чындап катышкан компаниялар атаандаштык артыкчылыктын салттуу түшүнүктөрүнө каршы чыгышат. Бардык жакшы коддор же сонун идеялар алардын уюмунун ичинде жашай бербейт . Бул өзгөрүү колдойт аргумент ачык булактуу экосистеманын ичиндеги инновациялар рыноктун тез өсүшүнө алып келет, ал тургай кичинекей программалык камсыздоо фирмаларын дагы чектелген R&D фондулары менен камсыз кылат. пайда алуу мүмкүнчүлүгү ачык булактуу программалык камсыздоодо болгон R&D жайылмаларынан. Себеби, салттуу аутсорсингден айырмаланып, ачык инновация ички ресурстарды күчөтөт ички илимий-изилдөө иш-аракеттерин азайтпастан, коомчулуктун жамааттык акылын колдонуу менен. Ачык булактуу программалык камсыздоо компаниялары өздөрүнүн уюмунан тышкары ой лидерлигин жана коддорун издөө үчүн бюджеттерин курмандыкка чалуунун кереги жок дегенди билдирет.
Кошумчалай кетсек, ачык булактуу программалык камсыздоо компаниялары инновацияларды стратегиялык жактан жетектейт эрте жана тез-тез кодду чыгаруу , программалык камсыздоо коомчулугунда инновациялык процесстин кумулятивдик мүнөзүн таануу. Мунун бардыгын көптөр тааныган нерсе деп айтууга болот: Open Source Software инновацияга түрткү берет.
Ачык булак кызматташууга өбөлгө түзөт
аркылуу тармактык ачык булактуу программалык камсыздоо коомчулугунда ишкерлер кыска мөөнөттүү жана узак мөөнөттүү максаттарды аткара алышат. Кыска мөөнөттүү пайда максаттары компанияларды куруп, узак мөөнөттүү пайда максаттары аларды бекемдейт. Ошол эле учурда, бул тармактык аракет тармактын өзүн өзү улантат - аны кийинки ишкер үчүн өстүрөт. Белгилүү болгондой, ачык булак платформалары баштапкы кодго кирүү мүмкүнчүлүгүн берип, иштеп чыгуучуларга жаңыртууларды, плагиндерди жана башка программалык камсыздоо бөлүктөрүн түзүүгө жана аларды өздөрүнүн талаптарына ылайык колдонууга мүмкүндүк берет. Кызматташтыктын бул өзгөчө түрү кеңири программалык камсыздоо коомчулугу тарабынан Kubernetesтин кеңири кабыл алынышы менен өнүктү. Азыр болуп көрбөгөндөй заманбап технологиялар абдан аз сүрүлүү менен бирге иштешет жана дээрлик бардык жерде бир нече мүнөттүн ичинде бирге боло алышат.
Big Tech компаниялары ачык булак коомчулугуна мүнөздүү болгон бул терең кызматташтыкты, алар ички куралдарды колдоо жана өнүктүрүү үчүн түзүлгөн алкактарды, китепканаларды жана тилдерди эркин чыгарганда моюнга алышат. Муну менен өз өнүмдөрүнүн үстүндө иштөөгө жөндөмдүү иштеп чыгуучулардын бассейни тереңдейт жана окшош технологиялар кандай иштеши керектиги боюнча стандартты белгилей баштайт. Ошол эле Atlantic макаласында Meta компаниясынын негиздөөчүсү Марк Цукерберг “бул биз үчүн абдан баалуу болду, анткени азыр бардык тармактагы эң мыкты иштеп чыгуучулар биз өзүбүз да колдонуп жаткан куралдарды колдонуп жатышат” деп айткан.
Ачык булак ачык булакты жаратат
Бул ачык булактуу компаниялардын ортосундагы синергетиканы биз көп көргөн факторлор. Ачык булактуу AI жана ML компаниялары табигый түрдө башка ачык булактуу өнүмдөр менен чечимдерди иштеп чыгышат, мисалы, объекттерди сактоо сыяктуу фундаменталдык өнүмдөрдөн баштап, стектен визуализация куралдарына чейин. Бир ачык булактуу компания алдыга кадам таштаганда, баарыбыз жасайбыз. Бул бирдиктүү жана аралаш мамиле, балким, адамга багытталган мамилени талап кылган AIди өнүктүрүү үчүн биздин эң жакшы коюмубуз. Рынокто мүнөздүү болгон бул табигый күчтөр ачык булактуу AIга болгон муктаждык жана инновациялардын жана кызматташуунун ачык булактуу программалык камсыздоосунун сапаттары менен айкалыштырылган AI маалыматтар стекинин ачык булагы болуп саналат.
Сураныч, бизге электрондук почта аркылуу бул баарлашууга жана биздин коомго салым кошуңуз hello@min.io же Slack каналыбызга билдирүү жөнөтүңүз.