Èske mwen se sèlman moun ki pa te konnen ke AI pa ka aprann tan? Mwen vle di, chak jou, nou tande tout sou generative AI "revolyasyon" tout bagay ak ranplase tout moun. Prèske geni bagay ti kras. Se konsa, imajine chok mwen lè mwen aprann ke modèl AI multimodal pa ka di tan. Ki jan mwen te konnen, ou mande? Pou kòmanse ak, dènyèman te jwenn ke modèl multimodal lang gwo (MLLMs) tankou ChatGPT-4o, GPT-o1, Gemini-2.0, ak Claude 3.5-Sonnet te rive nan pwoblèm ak presizyon pandan li yon figi montre. Rechèchè nan University of Edinburgh Tout bagay te pi mal lè yo te tès ak relijyon ki fèt ak nimewo Roman, yon plato koulè, oswa yon orè orè dekoratif. Gen kèk nan relijyon yo tou te gen yon men ki trace segonn anplis de minit ak èdtan. Nan figi a nan sa yo touche konsepsyon, modèl yo AI te rapòte te rive nan erè plis. Deskripsyon sa a te fè pandan yon tès nan yon line-up nan MLLMs top jodi a, epi yo panse ke Gemini-2.0 te fè "pi bon" ak sèlman 22.8% akizite sanble amizman. GPT-4.o ak GPT-o1 a egzak akizisyon te nan 8.6% ak 4.84% respektivman. Dapre rechèchè yo, modèl sa yo te batay ak tout bagay. Ki madan se madanm la nan èdtan la? Ki direksyon li ap dirije? Ki angle koresponn ak ki èdtan la? Ki nimewo se sa a? Dapre yo, plis varyasyon te gen nan figi a nan èdtan la, pi plis chatbot la ki te tès te pwobableman malle èdtan la. Isit la se literalman konpetans baz pou moun. Pifò timoun ki gen 6 oswa 7 ane deja ka di tan. Men, pou modèl sa yo, li kapab tou astrophysics ki pi konplike. Apre fiasko a nan montre a, rechèchè yo te tès bot yo sou kalandriye ane. Ou konnen, moun ki gen tout twazyèm mwa yo sou yon paj. GPT-o1 te fè "pi bon" isit la, rive nan presizyon 80 pousan. Men, sa toujou vle di ke youn nan chak senk repons yo te erè, ki gen ladan kesyon senp tankou "Ki jou nan semèn an se Anyèl la? Si timoun mwen pa t 'kapab jwenn sa a byen sou yon kwiz, mwen ta dwe onètman trè anyen. Mwen pa janm te panse ke modèl AI ta ka janm vin konfòte pa yon layout kalandriye komen. Men, Lè sa a, li pa trè choche yo aprann. Tout sa a toujou boule nan yon kouch long nan devlopman AI. MLLMs sèlman rekonèt modèl yo ki yo te deja wè, ak èdtan, kalandriye, oswa nenpòt ki bagay ki mande pou rezonans espesyalis pa mete nan sa. Humans ka gade nan yon orè Dali twou san danje ak toujou aprann apeprè ki èdtan li se fèt yo montre. Men, modèl AI wè yon ti kras pi gruyant èdtan ak yon kalite kout-kout. Poukisa sa a enpòtan Li fasil (prèske satisfaksyon) yo jwi nan ChatGPT, Gemini, ak modèl sa yo pou manke yon travay ou aprann lè ou te ti. Yon travay ou fè ak anpil fasilite. Kòm yon moun ki te jilted pa kliyan pou travay gratis bagay sa yo ofri, menm si sous-standard, mwen admet ke mwen jwenn li reyèlman satisfè. Men, osi byen ke mwen vle jis jwi li, gen yon angle pi seri nan sa a. Sa yo menm MLLM yo ap pouse nan perception kondwi otonòm, imajizasyon medikal, robotik, ak zouti aksesibilite. Yo ap itilize pou planifikasyon ak otomatik kòm byen ke sistèm desizyon tan reyèl. Koulye a, erè nan lekti lè yo amizman. Men, erè medikal? Erè navigasyon? Menm erè planifikasyon? Pa tèlman amizman. Si yon modèl pa ka reliablite li yon èdtan, konfyans li blennman nan anviwònman segondè-apwòch se yon parayj tèlman riskant pou m '. Li jis montre ki jan lwen sistèm sa yo toujou soti nan reyèl, tèkstur entelijans. Ak ki jan anpil sante moun ak nuans toujou enpòtan. Mwen ap eseye konsa difisil yo sove soti nan pran chans sa a fè yon moun vs. AI ka. Mwen asire mwen pa pral sèvi ak li pou pwovoke "Pou poukisa Mwen Hate AI ak ou ta dwe tou." Men, gen yon pwoblèm ki ta dwe gade nan. Kòm otè a ki mennen nan etid la, Rohit Saxena, , sa yo mank "mwen rezoud si sistèm AI yo dwe siksè entegre nan aplikasyon reyèl tan sensitif." mete nan