Mbinu ya maafikiano ina jukumu muhimu katika ufafanuzi wa data inapohitajika ili kuhakikisha usahihi wa hali ya juu na kupunguza umakinifu katika uwekaji lebo. Kulingana na uzoefu wa Keymakr, kutekeleza mbinu ya maafikiano na wataalamu wengi katika hali mahususi kunaweza kupunguza makosa ya maelezo kwa 30–50%. Makubaliano hupunguza makosa, huweka udhibiti wa ubora kiotomatiki, na husaidia kuunda seti za data zilizolinganishwa - muhimu sana katika maeneo yenye uwajibikaji wa juu kama vile dawa na kuendesha gari kwa uhuru.
Tatiana Verbitskaya, mbunifu wa ufumbuzi wa kiufundi katika Keymakr , anazungumzia jinsi njia hii inavyofanya kazi na miradi ambayo imetumiwa kwa ufanisi.
Makubaliano yanapatikana kwa kukusanya maoni ya wataalam wengi. Wakati wa kufafanua data ya "ukweli wa msingi", ni muhimu kuweka kiwango kilichokubaliwa cha usahihi. Makubaliano ni muhimu wakati wa kufunza kielelezo kuhusu data ya kibinafsi, kama vile rangi na umbo, au wakati usahihi wa juu unahitajika. Njia hii hutumiwa kikamilifu katika hatua za mwanzo wakati mtindo bado haujafunzwa juu ya data ya kutosha au wakati mafunzo ya ziada yanahitajika, hasa kwa kesi maalum (kwa mfano, hukumu za kibinafsi). Zaidi ya hayo, maafikiano ni muhimu katika miradi mikubwa, kama vile data ya maelezo ya magari yanayojiendesha yenyewe au ufuatiliaji wa usafiri, kwani huongeza usahihi huku ikipunguza makosa.
Viongozi wa teknolojia ya kimataifa kama vile Google, Tesla, Amazon, na Meta hutumia kikamilifu ufafanuzi unaotegemea makubaliano ili kuboresha utendakazi wa muundo wa AI. Google Health, kwa mfano, hutumia vidokezo vingi vya radiolojia kwa X-ray ili kuboresha usahihi wa uchunguzi. Tesla hutumia makubaliano kuweka lebo data kutoka kwa kamera za otomatiki, kupunguza makosa ya mafunzo katika kuendesha gari kwa uhuru. Amazon SageMaker Ground Truth hujumuisha ufafanuzi wa makubaliano katika NLP, maono ya kompyuta, na uchanganuzi wa picha za setilaiti, huku Meta inaitumia kwa miradi ya utambuzi wa uso na kitu.
Mojawapo ya matumizi muhimu zaidi ya makubaliano ni katika maelezo ya picha ya matibabu kwa utambuzi wa ugonjwa. Wataalamu wanasema uchunguzi wa wataalamu wa radiolojia unaweza kutofautiana kwa asilimia 20-30, na kuathiri moja kwa moja matokeo ya mgonjwa. Wakati mbinu ya msingi ya maelewano inapotumika - ambapo wataalamu wengi wa radiolojia hufafanua picha kwa uhuru na michango yao inajumlishwa kulingana na alama za uzani wa utaalamu - usahihi wa maelezo unaweza kuboreshwa kwa hadi 40%.
Keymakr anatumia mbinu hii kikamilifu katika miradi changamano ya matibabu. Kwa hivyo, hii husaidia kuhakikisha uwekaji lebo sahihi wa picha kwa miundo ya AI iliyofunzwa kugundua magonjwa changamano. Hapa, mchakato uliundwa kwa kutumia jukwaa la Keylabs - ambapo unaweza kulinganisha maoni ya wataalamu kadhaa, kutambua hitilafu, na kuunda hifadhidata za usahihi wa juu. Mbinu hii huongeza kwa kiasi kikubwa uaminifu wa algorithms kutumika katika uchunguzi wa kiotomatiki, kupunguza hatari ya utambuzi mbaya.
Kwa sasa, Keymakr inashirikiana na SoundAware , kampuni inayotumia teknolojia ya kiotomatiki ya utambuzi wa muziki ili kutambua matumizi ya muziki yenye hakimiliki. Timu hukagua URL 10,000 ili kutathmini uwepo wa nyenzo zilizo na hakimiliki.
Majukwaa ya video yanajazwa na maudhui ambayo yanaweza kuwa na nyenzo za mwandishi, kama vile muziki, matukio kutoka kwa filamu, au vipande vya vipindi vya televisheni. Kwa sababu ya idadi kubwa ya data na hali ya kibinafsi ya tafsiri ya hakimiliki, kuchanganua kila video mwenyewe haiwezekani.
Hata hivyo, Keymakr hubainisha hali ambapo maudhui yaliyo na hakimiliki yanatumiwa au kurekebishwa kwa njia ambazo mifumo ya kiotomatiki haiwezi kutambua kwa uhakika bado. Hizi ni pamoja na parodies, sanaa ya mashabiki, na heshima.
Ili kuondoa utii, Keymakr hutumia mbinu inayotegemea makubaliano: kila video inatathminiwa na wataalamu wengi wa kujitegemea ambao hujibu maswali yafuatayo:
Kulingana na majibu ya wataalamu, uamuzi wa mwisho hufanywa kuhusu masuala ya hakimiliki yanayoweza kutokea.
Miradi kama hii ni muhimu kwa kutekeleza hakimiliki na kuhakikisha wenye haki wanapata fidia ya haki. Zaidi ya hayo, mchakato huu husaidia makampuni maalumu katika ufuatiliaji wa maudhui kuboresha algoriti zao na kuharakisha ugunduzi wa nyenzo zilizo na hakimiliki.
Makubaliano pia hutumiwa sana katika mafunzo ya AI kwa magari yanayojiendesha, haswa katika utambuzi wa vitu barabarani (kwa mfano, magari mengine, watembea kwa miguu, alama za trafiki). Kwa mfano, kamera inaweza kunasa mtembea kwa miguu akiendelea, na wafafanuzi wa kibinadamu wanaweza kutokubaliana kuhusu ikiwa kifaa ni mtu au kivuli. Makubaliano huhakikisha uwekaji lebo sahihi katika hali kama hizi.
Timu ya Keymakr hivi majuzi ilifanya kazi na uchanganuzi wa video iliyorekodiwa kwenye kamera kufuatilia magari. Ilihitajika kufuatilia mwendo wa gari kupitia kamera kadhaa kwenye njia panda na kuhakikisha kuwa mfumo ulitambua kwa usahihi gari moja katika fremu tofauti.
Kamera zilirekodi kitu kimoja (gari) kwa pointi kadhaa. Wataalamu kadhaa walitazama video hiyo kutoka kwa kamera tofauti. Walikagua ikiwa kitu hiki ni gari moja kwa sababu kunaweza kuwa na tofauti katika mtazamo wa mwonekano (kwa mfano, kwa rangi au chapa). Maelezo hayo yalitumika kufunza kielelezo iwapo wachambuzi watano walithibitisha utambulisho wa kitu. Vinginevyo, data kama hiyo ingeondolewa kwenye mkusanyiko wa data. Hii imepunguza idadi ya kengele za uwongo na kuongeza usahihi wa mifumo ya utambuzi wa gari, ambayo ni muhimu kwa mifumo ya usalama ya mijini na mifumo ya udhibiti wa trafiki moja kwa moja.
Njia hiyo hiyo inaweza kutumika kutambua watu katika maduka makubwa au mitaani. Kamera hukamata harakati kwa kuchambua, kwa mfano, rangi ya nguo, urefu, au sifa zingine. Mbinu hii inatumika kwa:
Mustakabali wa ufafanuzi wa data kulingana na makubaliano unatia matumaini, haswa kadiri miundo ya AI inavyozidi kuwa changamano na kiasi cha data kukua. Soko la Ufafanuzi wa Data na Uwekaji Lebo ya kimataifa inakadiriwa kufikia $3.6 bilioni ifikapo 2027, na makampuni mengi yanapitisha uthibitishaji wa maelezo ya tabaka nyingi ili kuongeza ubora wa data. Uchunguzi unaonyesha kuwa miundo iliyofunzwa kwenye seti za data zilizo na ufafanuzi wa makubaliano huonyesha usahihi wa juu zaidi kuliko miundo iliyofunzwa kwenye uwekaji lebo kwenye chanzo kimoja.
Licha ya maendeleo ya ufafanuzi wa kiotomatiki na AI ya uzalishaji, sababu ya kibinadamu inabakia kuwa muhimu: kutokubaliana na kutokubaliana kwa maelezo kunahitaji uthibitisho wa hatua nyingi. Kwa hivyo, mbinu ya maafikiano itaendelea kutumika, kuhakikisha utegemezi wa data na kupunguza makosa katika maeneo muhimu kama vile mifumo ya uhuru, dawa na uchanganuzi wa kifedha.