Tecnología de reconocimiento de cara (FR) ukax aka qhipa maranakanx wali nayrar sartawayi, ukax seguridad ukat juk’amp aplicaciones ukanakan industrias ukanakan jilxatatapatw irpata, kunjamakitix dispositivos de consumo de baja gama, avión ukar embarque, control fronterizo ukat qullqituqit yanapt’awinaka. Sistemas FR efectivos ukanakan chuymapanx mä componente crucial ukaw utji —datos. Jach’a yatxatatanakaxa wali wakiskiriwa aka modelos ukanakaru yatichañataki, ukhamata chiqapa uñt’añataki ukhamaraki chiqapa uñjañataki uñnaqanaka kunaymana condiciones ukanakana. FR ukax atiniskañapatakix modelos ukanakax kunayman yatiyawinakampiw uñt’ayatäñapa, ukax demográfico, qhana, pachamama, expresiones ukat oclusión ukanakan mayjt’awinakapawa. Ukax ch’amanchawi ukhamarak chiqapar uñjañapatakiw ch’amanchasi, ukhamat jan uñt’at jan walt’awinakamp jikisiñatakix jan walt’awinak parcialidad jan ukax jan walt’awinak jisk’achañataki. Sintéticos conjuntos de datos ukanakax técnicas genAI ukamp luratawa, ukax yanapt’aspawa, ukampis jichha estado ukanx janiw chiqpach pachan datos ukanakax taqpach lantintatäkaspati. Aka qillqatanx conjuntos de datos sintéticos FR ukan askinakapata ukhamarak jan walt’awinakapat yatxatatawa ukatx jichha estado de genAI ukanx uñnaqa uñt’ayañatakiw yatxatasi. Uñnaqa Datos Adquisición: Chiqpach Mundo vs Sintético , , , , ukatxa ukaxa yaqhipa yatxatatanakawa, ukaxa modelos FR ukanakana chiqapa lurawipa uñakipañataki apnaqatarakiwa. Tabla 1. uñacht’ayiwa chiqapa lurawi lurawi mä modelo ML yatichata pachpa algoritmo ukampiwa, chiqpacha pacha uñnaqani conjuntos de datos de diferentes tamaños ukanakana. LFW Cfp-fp Agedb-30 Ca-lfw Cp-lfw Uñakipt’asispawa kunjams tama conjunto de datos ukax modelo ukan lurawiparux jan walt’ayi ukatx escala ukanx datos adquisición ukax lurasiñapaw modelos FR ch’aman uñstayañataki. Verificación ukax modelo ukarux mä par de uñnaqa uñacht’ayañaw sañ muni, ukatx uka par de cara ukax pachpa jaqin jan ukax pä sapaqat jaqinakankiwa sasaw yatiyaraki. Uka verificación exactitud porcentaje ukaxa modelo predicciones ukanakatxa yatiyatawa. Datos ukanaka uñakipaña Chacha ML Murilu # Yatichawi Uñacht’awinaka LFW ukax mä juk’a pachanakanwa Cfp-fp ukax mä juk’a pachanakanwa Ukaxb-30 maraniwa Ca-LFW ukax mä juk’a pachanakanwa Cp-LFW ukat juk’ampinaka Casia ukax mä web ukan uñt’ayatawa resnet-50 ukat juk’ampinaka 500k ukhawa 99.55 ukhawa 95.31 94.55 ukhawa 93.78 ukhawa 89,95 ukhawa webface ukax 12m resnet-50 ukat juk’ampinaka 12 millones ukhaniw utji 99.80 ukhawa 99.20 98.10 -- . -- . glint360k ukat juk’ampinaka resnet-50 ukat juk’ampinaka 17 millones ukhaniw utji 99.83 ukhawa 99.33 98.55 ukhawa 96.21 94.78 ukhawa Chiqapa uñakipaña chiqapa (%) phisqa kunaymana FR uñakipañanakata. Mä chiqapa uñakipañatakixa, taqi yatxatawinakaxa pachpa modelo ML ukatxa algoritmo ukampiwa nayrïri uñt ata lurawinakata apsutaraki. Tabla 1. Ukhamaraki, mä jach’a yatichawi yatxatawi yatxatawi, ukhamaraki wali wakiskiriwa, yatxatawi yatxatawixa jisk’a sesgos ukanakampiwa. Nayraqatax kuntix sesgo ukax sañ munki uk amuyt’añax wali askiwa, contexto de FR ukanxa. Jilapachaxa, mä modelo de Aprendizaje Máquina ukatakixa, sesgo ukaxa modelo ukaxa janiwa mä kipka sarnaqkiti kunaymana kasta datos de entrada ukanakana. Mä modelo FR ukax kunayman tuqinakatw bias ukhamäspa. Uñacht’awix juk’amp uñt’atawa, sesgo etnia ukawa, kawkhantix mä modelo FR ukax mä etnia particular ukan ajanunakapamp uñacht’ayat ukhax jan wali lurawinak lurañ yati. Ukampirus janiw ukakipkarakiw sesgo ukakikiti, ukax modelos FR confiables ukanakar jikxatañatakix contrarrestar ukax wakisiwa. Sesgo de edad, sesgo de género, ukat parcialidad ambiental (ajan llawuntawi, ajanu ñik’uta, juk’ampinaka) ukax mä qawqha yaqha uñacht’awinakawa kunjams mä modelo FR ukax sesgo uñacht’ayaspa. Aka sesgos ukanakax jisk’achasispawa, muestras representativas ukanakamp apthapisin ukhamarak conjunto de datos ukanx modelo FR ukar yatichañatakix apnaqatarakiwa. Kunayman etnianakan jaqinakan fotonakap katuqañaxa, tunka tunka phisqhani marat jayarst’ata, jan ukax mä jaqin fotonakap kunayman uñnaqani, kunayman qhanan, kunayman ajanu uñacht’ayat fotonak apsuñax mä ch’amäspawa. Ukhamarus, chiqpach pachan yatiyawinak apthapiñax FR ukatakix walja yaqha jan walt’awinak uñacht’ayi. Uraqpachat ukham jach’a kunayman yatiyawinak jikxatañax wali jila qullqiwa. Costo ukat técnica ukan limitaciones ukanakat sipansa, datos ukanakax juk’amp ch’amawa, kunatix ética ukat privacidad ukanakat llakisiñaw utji. Datos biométricos ukax kamachinakaparjamaw apnaqasi, kunjamatix Europa markan GDPR ( ), California markan CCPA ( ), ukat Illlionis sat chachan BIPA ( ), mä qawqhanak uñt’ayañataki. Reglamento General de Protección de Datos uka tuqita California markan Privacidad de Consumidores ukan kamachipa Ley de Privacidad de Información Biométrica ukaxa mä kamachiwa Aka kamachinakaxa apnaqiwa katuqañataki ukhamaraki imañataki datos biométricos ukanaka sapa mayni markachirinakaru, ukaxa juk’ampi complejidad yapxati jach’a escala de datos biométricos ukanaka apsuñataki. FR ukan aplicacionanakapan mayiwipax jilxattaskiw, jichhax mä jach’a pachaw sintéticos ukan datos ukan viabilidad ukar uñakipañataki, ukax askinaka ukat jan walt’awinakapat uñakipañatakiw sistemas de reconocimiento de cara escalables, éticos ukat legalmente ukarjam phuqhañataki. Aka jan walt’awinakaxa, Generativo AI (genAI) ukan sartawipampi chikt’ata, ukax walja yatxatäwinakaruw ch’amanchawayi, sintéticos ukan yatiyawinak lurañataki, chiqpach pachan biométrico sensibles ukanakat lantintañataki. Janïra FR ukan jichha estado de datos sintéticos ukar ch’allt’kasaxa, kuntix genAI ukax sañ munki uk amuyañax wali askiwa. Sapuru arumpixa, genAI ukax mä kasta inteligencia artificial ukawa, ukax machaq contenido uñstayaspawa, qillqatanaka, uñacht’awinaka, jan ukax musica, ukax datos ukarjam yatichatawa, ukatx datos generados ukax ‘datos sintéticos’ satawa. GenAI ukax ajanu uñt’añatakix juk’amp ch’amanchatawa walja razonanakatwa. Jilpachax sintéticos conjuntos de datos ukax AI ukan luratawa, ukax sañ muniw yatxatirinakax, ingenieros ukat entusianos ukanakax conjuntos de datos ukanakax lurapxaspaw (ukatx yatichapxaspawa) jan chiqpach jaqinakat uñacht’awinak apsuñatakix manual proceso ukar purisa. Walja requisitos de cumplimiento ukax chiqpach uñacht’äwinak apthapiñan ukhamarak apnaqañanx janiw sintéticos datos ukatakix utjkiti, ukatx, teóricamente, sesgos ukax mä algoritmo chiqpach uñacht’äw datos ukar yatichat ukar puriyaspa, ukax sintéticos datos ukanakamp juk’amp sum qhanañchasispa. Ukampirus, sintético uñnaqan datos ukanakax janiw jichhakamax qullqit lurat bala ukhamäkiti. Aka qillqatanx aka t’aqanakax kawkhantix conjuntos de datos sintéticos ukanakax qhant’ki, kawkhantix jan walt’ayat uñjasi, ukatx jichha estado de genAI ukax ajanu uñt’ayañatakiw uñt’ayasi. Uñnaqa uñt’añanxa Datos Sintéticos ukan ventajas ukanakapa Datos sintéticos ukax walja ventajas ukanakaw utji, ukax mä herramienta valoraniw tecnología de reconocimiento de cara ukan uñstayañataki. Mä nayrïr askix conjuntos de datos sintéticos ukax janiw chiqpach jaqinakan uñacht’äwinakap apsuñax wakiskiti. Datos sintéticos ukax janiw chiqak chiqpach datos personales ukanak apnaqkiti, ukatwa, privacidad ukarjam phuqhañ mayiwinakax kunjamatix consentimiento de uso ukat derechos armt’asiñ ukanakax janiw uñstayatäkiti. Ukhamaraki, sintéticos ukanaka lurañaxa juk’ampi qullqinirakispawa, chiqapa pachana walja yatiyawinaka apthapiñat sipansa ukhamaraki anotación ukanakata, ukaxa, ukhamaraki pacha ukhamaraki yänaka apst’ata ukhama uka conjunto de datos ukaxa kamachina ukhamaraki ética ukarjama phuqhañapataki, ukaxa mä manual ukhamawa, pacha apt’atawa, ukatxa jila qullqini proceso. Datos sintéticos ukaxa permite la creación de medios controlados kawkhantixa variables específicas ukanakaxa manipuladas ukhamawa, ukaxa yanapt’iwa yant’awinaka ukhamaraki afinación de modelos de reconocimiento de cara. Ukhamaraki, sintéticos ukanakaxa jach’a yatxatatanaka lurañataki ukhamaraki apsuñatakixa juk’ampi jasakiwa, juk’ampirusa kawkhantixa chiqpacha pacha yatiyawixa juk’aki, ch’ama apthapiña, jan ukaxa kamachinakaru mayiwi ukhamaraki ética tuqita amuyt’awinakaxa uka apthapiwixa jani ch’amanchañataki. GenAI uka thakhinakax mä utjki uka chiqpach pachan yatxatatanakar yapxatañatakiw apnaqasirakispa, ch’amanchañataki ch’amanchañataki sesgos ukanakar jisk’achañataki; demográfico jan ukaxa yaqha tuqinakata. Mä uñacht’awi, walja jach’a uñnaqan yatiyawinakax jaqinakar uñt’ayat ukanakax jilpachax identidad caucásica ukanakat luratawa, ukax mä sesgo demográfico ukaw modelos ML ukan yatichat ukham datos ukanakan utjayaraki. Ukax mä conjunto de datos sintéticos ukamp jasakiw askichasispa. Jichha Limitaciones de Datos Sintéticos ukanakax Uñnaqa uñt’ayañanx utjiwa Dominio de imágenes ukatakix Redes Adversariales Generativas (GANs) ukax mä modelo ukaw wali uñt’ata, ukax datos uñstayañatakiw apnaqasi. Nvidia ukax mä jach’a uñacht’äwiwa , ukat muspharkañanak lurapxi sintético ajanu uñacht’awinak uñstayañataki ukax chiqpach ajanunakatx janiw yaqhachañjamakiti. Microsoft ukan yatxatirinakax , Kim ukat yaqhanakampi , Tencents' ukat juk'ampinaka. , ukat Michigan Estatal Universidadan yatiqapxi yaqhanak taypinx wali nayrar sartawiw utjawayi, conjuntos de datos sintéticos ukanakax ajanu uñt’ayañatakiw lurasi ukatx chiqpach pachan yatiyawinakanx aski amuyunakaw uñacht’ayasi. Stylegan sat jilataw ukham luräna Estilogan2 Digiface-1m ukat juk’ampinaka DiscoGAN ukax mä juk’a pachanakanwa Synfasis ukax mä juk’a pachanakanwa DCFace ukax mä juk’a pachanakanwa Ukampirus taqi uka técnicas ukanakax limitaciones ukaniwa, kunatix qullqi, pacha, qawqha identidades únicas ukanakas lurasispa, ukatx rendimiento ukax sañ muniwa chiqpach uñnaqan datos ukan yatichat modelos ukanakampi. janiw par ukar puriñkamakiti Teóricamente, mä conjunto de datos sintéticos ukax “chiqpach uñtasit” uñnaqaniwa, ukatx controlado diversos atributos ukax etnia, género, pose, qhana, ukatx variación de fondo ukatakix chiqpach “en el salvaje” conjunto de datos ukat sipanx juk’amp askiwa. Ukatx kunats uka conjuntos de datos ukan yatichat modelos ukan lurawipax jan kawkhans jak’ankiti modelos ukanakax chiqpach pachan conjuntos de datos ukan yatichat pachpa jach’a uñt’atanakar uñtasita? Aka jiskt’awiru jaysawix chiqpach pachan yatiyawinakan jan apnaqat lurawinakapawa. Chiqpach yatiyawinakan mayjt’awinakapan jach’a jach’a tukutapax janiw jichhakamax kuna yatxatäwinak uñt’ayat ukanakamp taqpach katjatäkiti. Taqi identidad sintética ukanakatakix pachpa jisk’a jakhüwi mayjt’awinakax utjki ukax conjunto de datos ukanx modelo ukan lurawiparuw jan walt’ayi. Mä yant’awix mayjt’awinak jilxatayañatakix identidad de la cara ukax mayjt’ayatarakiwa, ukax datos ukanx ch’axwawinak uñt’ayi, wasitat modelo ukan lurawiparux jan walt’ayi. Jichha pacha Estado de Datos de Cara Sintética ukaxa Tabla 2. ukanxa pachpa arquitectura modelo FR (Resnet 50) ukana lurawipa uñacht ayatawa kunaymana conjuntos de datos sintéticos ukanakana yatichata. Mä modelo de base de rendimiento ukax mä auténtico conjunto de datos ukan yatichatawa, ukax niya pachpa tamaparjamaw uñacht’ayataraki. Ukhamaraki, tabla ukanx sapa sintéticos datos ukanakax kuna maras mistuni uk uñacht’ayatarakiwa. Datos conjunto Suti ML Modelo ukax mä juk’a pachanakanwa # Yatichawi uñacht’awinaka LFW ukax mä juk’a pachanakanwa Cfp-fp ukax mä juk’a pachanakanwa Ukaxb-30 maraniwa Ca-LFW ukax mä juk’a pachanakanwa Cp-LFW ukat juk’ampinaka (chiqpach pacha) . Casia-webface ukax mä juk’a pachanakanwa resnet-50 ukat juk’ampinaka 500k ukhawa 99.55 ukhawa 95.31 94.55 ukhawa 93.78 ukhawa 89,95 ukhawa (2021) ukat juk’ampinaka. Synface resnet-50 ukat juk’ampinaka 500k ukhawa 91.93 ukhawa 75.03 ukhawa 61.63 ukhawa 74.73 ukhawa 70.43 (2022) ukat juk’ampinaka. Digifaz-1m resnet-50 ukat juk’ampinaka 500k ukhawa 95.40 ukhawa 87.40 ukhawa 76,97 ukhawa 78.62 ukhawa 78,87 ukhawa (2023) ukat juk’ampinaka. DCFace resnet-50 ukat juk’ampinaka 500k ukhawa 98.55 ukhawa 85.33 89.70 ukhawa 91.60 ukhawa 82.62 Chiqapa chiqapa uñakipaña (%) FR uñakipaña yatxatatanakatxa, ukaxa modelos ukanakampi yatichatawa sintéticos ukanakampi. Nayrïr t’aqax lurawiw base ukanx modelo ukax chiqpach pachan uñtasit jach’a yatiyawinakan jikxatata. Taqi yatxatawixa pachpa modelo ML ukampi algoritmo ukampiwa original publicada lurawinakata apsutaraki. Tabla 2. Kunjamatix Tabla 2 ukan uñjaskixa, modelos entrenados en datos sintéticos ukanakax janiw modelos entrenados en datos reales ukanakax sum phuqhapkiti. Kunjamakitix lurawi ch’amanchawix “simple” ukhamarak jisk’a conjuntos de datos ukhamarak ‘LFW’ ukanx jisk’akiwa, ch’axwawix juk’amp qhanaw yaqha ch’ama conjuntos de datos ukanakanx CFP-FP ukhamarak Agedb-30, ukax muestras de vistas de perfil de uñnaqanakaniwa, ukatx pachpa ajanunakapas utjarakiwa jaqix walja maraninakaruw jaljtawayi. Qhanpachanx modelos entrenados en datos sintéticos ukanakan lurawipax aka qhipa maranakanx juk’amp sumaw jilxattawayi. Datos sintéticos ukan askinjam irnaqatapat chiqanchañax mä ch’amäkaspas ukhamaw qhiparaski. Datos sintéticos ukanakax chiqpach pachan uñstawinakap chiqapar uñacht’ayañax wali wakiskiriwa, sistemas de reconocimiento de cara confiables ukanakan lurañataki. Ukampirus, proceso de validación ukax complejo ukhamawa, ukatx metodologías robustas ukanakaw munasiraki, ukhamat datos ukan suma uñt’ayasiñapataki ukhamarak apnaqañapataki. Mä solución posible ukax mä modelo genAI uka lurañawa, ukax uka características ukanakax datos sintéticos ukanx imitar ukhamarakiw lurasispa. Mä modelo generativo ukax uka limitaciones ukanakar atipjañatakix yatichasispawa, chiqpach pachan datos ukan yatichasa, ukax atributos faciales, calidad de imagen ukat variación de fondo ukanakan walja variaciones ukaniwa. Uka yatiyäwinakajj kawkitsa jutaspa uk jisktʼasiñajj walikïskiwa. Ukham datos ukanakax taqi kunatix nayraqat arsuwayktan ukanakamp atipjayasiñapänwa, ukax ética, legal ukat costo ukanakan jark’awinakapawa. Ukampirus, ukax jisk’a tama conjunto de datos ukampiw jisk’achata, ukax modelos generativos de FR ukar yatichañatakiw wakisi. Nvidia ukax mä jach’a uñacht’äwiwa chiqpach ajanu uñacht’awinak uñstayaspa, ukakipkarakiw yatichatäna , ukatx janiw yatiyawinak uñt’ayañax utjkiti, ukax uñt’ayasiñ utan ajanunakax uñt’atawa. Aka uñacht’awinakax janiw FR amuyump apthapitakiti, ukatx janirakiw modelo ukax ukatakix yatichatäkiti, ukatwa modelos ukanakax conjuntos de datos sintéticos FR ukan yatichatanakax StyleGAN2 ukan lurat ukanakax janiw chiqpach pachan lurawinakapamp chikachaskiti. EstiloGAN2 70.000 uñacht’awinaka Tukuyawi Datos sintéticos ukax tecnología de reconocimiento de caras ukar nayrar sartayañatakiw arsu, ukampis jichha limitaciones ukanakap uñt’ayañax wali wakiskiriwa. Kunjamakitix genAI ukan askinakapax chiqpach uñacht’awinakan sintéticos ukanakan chiqapawa, ukatx jasakiw uñacht’awinak suma askichañatakix uñacht’awinak jach’anchayañataki jan ukax jan ch’amanchañataki, kunjamakitix ajanu uñacht’awinaka, p’iqin pose, ajanu ñik’uta, ukat juk’ampinaka, modelos entrenados en datos real versus sintéticos ukanakan rendimiento ukan ch’amanchawipax ukhamawa amuyaskiri. Datos sintéticos ukax janiw jichhakamax suma curado chiqpach datos conjuntos ukanakar lantintatäkiti. Ukhampachasa, sintético uñnaqan yatiyawinakapax chiqpach pachan yatiyawinakap askinjamaw katjaski kunatix técnicas de generación de datos ukax juk’amp sumaptaski, ukat ukhamatw, amuyt’araksnawa, niya jutïr pachanx sintéticos ukanakax chiqpach apnaqañax taqpach chhaqtayaspawa -uraqpachan uñnaqapat yatiyawinak FR yatichäwitaki. Uñacht’äwi Imagen ukax Steph Meade sat jilataw ukham luräna