“Propensidad puntuación tupachiyqa huk tupachisqa conjuntokuna hampisqa chaymanta mana hampisqa sujetokuna ruwaymi, paykunam huk rikchaq valorta qunku propensión puntuación kaqmanta. Huk kuti huk muestra tupachisqa ruwasqaña kaqtinqa, hampiypa efectontaqa chaninchakunmanmi, chaypaqqa chiqanmanta tupachispa imakunachus ruwakusqanmanta”, nispa.
Chay definicionqa ñawpaqtaqa Rosenbaum PR, Rubin DB nisqapa qusqanmi karqa “Evaluación de sensibilidad nisqa huk mana qawasqa covariado binario nisqaman huk estudio observacionalpi iskayniyuq ruwaywan” 1983 watapi qillqasqapi.
Pisi rimayllapi, kayqa huk yapasqa A/B pruebakuna técnica llamk'achisqa mayk'aq muestra aleatorización mana llamk'achkanchu . Puntuación de propensión (probabilidad prueba qutuman asignasqa kay) huk hampi qutumanta sapa llamk'aqpaq yupasqa chaymanta chaymanta llamk'achiq huk llamk'aqwan tupachisqa kachkan chaymanta datos históricos kaqpi producto llamk'achiyta huk control qututa ruwaspa. Chay qhepamanmi iskay huñukunaq ruwasqankuta tupachinku prueba estadística nisqawan, chaymantataqmi tupunku huk efecto experimental nisqawan.
Ichaqa, ¿imaraykutaq chay compleja técnica nisqawan huk grupo de control nisqa tarinapaq, sichus huk plataforma A/B nisqa chaypa rantinpi ruwayta atinman? Wakin kutikunapi mana atikunchu llamk'achiyta huk A/B plataformata huk ruwasqa rakina ruwaywan. Kaypiqa kanmanmi casokuna:
Tawa kaq casota ruwasqaypi karqani chaymanta huk e-commerce ruruwan llamk’achkaspa pasarqa. Huk equipo producto kaqmanta huk ruwayta pruebananpaq wakichisqa karqa, mayqinchus bonokuna quypaq usuariokunaman ñawpaq pedido ruwasqamanta. Sasachakuyqa karqan chay ruway llamk'achkasqa mana llapa ruwaqkuna ñawpaq kamachiyta churasqankupi. Wakin condicionkunatan hunt’anan karqan, ahinataq ordenpa valornin, hukkunapas. Kayhina kaqpi, huk A/B prueba plataformapa limitekunamanta hawapi kachkan prueba chaymanta control qutukunapura t'ikrayta rakinapaq. Kaypi imarayku Propensidad Puntuacion tupachiy akllana karqa.
Huk hunt’asqa marcoqa yaqa huk qillqasqapim “ Propensidad puntuación tupachiy Rwan: métodos convencionales y nuevas características ” nisqapi sayasqa, pichqa llamkaykunatam hapin (2 yupay).
Ñawpaq ruwayqa datos huñuymi maypichus huk propensión puntuación yupasqa chaymanta huk tupachisqa usuario tarikun.
Iskay kaq ruwayqa huk propensión puntuación nisqa yupaymi métodokuna llamk'achispa, ahinataq regresión logística nisqapi, chaymanta willay huñupi yachachiy, huk llamk'aq prueba huñuman churasqa kanqa icha manachu chayta willanapaq. Sapa llamk'aqpaq, yachachisqa modelo huk prueba qutupi kananpaq probabilidadta paqarichimun.
Kimsa kaq llamk'ayqa propensión puntuación nisqapi tupachiymanta riman, maypichus hukniray tupachiy ñankuna pruebasqa kanku, aswan qaylla vecino hina.
Tawa kaq llamkaypiqa, balance de covariables nisqa tratamientowan controlwan grupokunapurapim qawarikun, estadísticas de balance nisqa yupaspa, parcelas nisqakunata ruwaspa ima. Mana allin equilibrio nisqa qawarichinmi chay modelo estimador de propensión nisqa puntuación nisqa musuqmanta especificasqa kananta.
Pichqa kaq tukupay ruwaypiqa, huk pruebapa efectosninqa tupachisqa datos nisqawanmi yupasqa, chaymantam prueba estadística nisqa ruwakun.
Kay etapaqa variables, covariables, confundidores nisqakuna necesario nisqa huñuymantam. Covariado (X) nisqaqa huk independiente variable nisqa, chaymi huk experimento (Y) nisqapa ruwakuyninta influyenman, ichaqa manam directo interesniyuqchu. Confundidor nisqaqa huk factormi, mana chay estudiasqamantachu, chaymi hukllachasqa kachkan iskayninpi, huk prueba huñuman asignacionwan (W) chaynallataq huk experimentopa ruwakuyninwanpas (Y).
Uraypi grafico nisqapim qawarikun variables nisqapa relaciones nisqakuna. X huk covariado, W huk indicador tratamiento asignación kaqmanta, Ytaq huk resultado. Lloq’e ladopi kaq graficoqa rikuchinmi confundidorpa relacionninta hinallataq paña ladopi kaqmi qawachin covariatepa independiente conexión nisqa experimentopa ruwasqanman (Y) chaynallataq prueba de asignación de grupos nisqaman (W).
Kaypiqa ancha chaniyuqmi subrayanapaq mana allinchu kanman akllanapaq variablekunallata mayqinkunachus huk prueba qutuman (W) ruwaqkunap asignacionwan tinkisqa kachkanku imaraykuchus qutu chiqan kay chaninchaypi precisión kaqta pisiyachinman mana sesgo pisiyachispa ( https://www.ncbi .nlm.nih.gov/pmc/artículos/PMC1513192/ nisqamanta willakuy.
Tapukuwaqmi hayka variablekunatataq akllanay? Kutichiyqa sasan - aswan aswan, aswan allin chaywan hatun estimación ruwasqakuna tarinapaq chaymanta estudio sesgo pisiyachinapaq . Hinaspa kaypi rimachkani hatun yupaykunamanta 20-50 hina utaq aswanraq.
Qatiqnin ruwayman purispa, willayta huñunapaq chaymanta huk hampi qutuman pertenecesqanmanta bandera churanapaq mañakun. Llapan wak llamk'aqkuna atiyniyuq huk kamachiy qututa ruwanqaku. Chay qhipamanmi puntuación de propensión nisqa imaymana ruwaykunawan yupasqa, regresión logística nisqawan utaq bosques aleatorios nisqawan ima.
Yaqa llapan qillqasqakuna ñawinchasqaymi yuyaychanku regresión logística nisqaman hapipakuyta hinaspa huk aswan sasachakuyniyuq modelokunata mana llamkachiyta, hatun precisión nisqa mana crucial kasqanrayku . Chaywanpas, tupachiy técnica allin ruwayqa, chiqap ruwaypi astawan yuyaymanan.
Método akllasqamanta, huk modelo predictivo nisqa datos nisqapi yachachikun akllasqa covariables nisqawan, chaywanmi willakun sichus huk usuario prueba huñuman pertenecen icha manachu chayta. Tukuyninpiqa, modelo sapa usuariopaq willakuykunata ruwan, chaymanta propensión puntuación, prueba qutupi kaymanta probabilidad, yupasqa. Softwarekunamanta rimaspa, Python kaqpi mayqin pronóstico bibliotecatapas llamk'achiy atikunki básica scikit-yachaymanta qallarispa chaymanta Prophet kaqman astakuspa.
Kay qatiq ruwayqa huk tupachiy ruwayta ruwanapaq huk tupachisqa ruwaqman huk prueba huñumanta ruwaqman tarinapaq. Chayraykum huk grupo control nisqa rikurimun.
Imaymana tupachiy ñankuna kan akllanapaq, ahinataq chiqan tupachiy utaq Mahalanobis karu tupachiy. Kay qillqasqapiqa aswantaqa rimasaqmi técnica común nisqamanta aswan qaylla vecino tupachiymanta chaymanta variacionninkunamanta.
Aswan qaylla vecino tupachiy (NNM) iskay phasimanta ruwasqa. Ñawpaqta, algoritmo ruwaqkunata akllan, hukmanta huk hampi qutumanta, huk kamachisqa ordenpi. Chaymanta, sapa prueba qutumanta llamk'aqpaq, algoritmo huk llamk'aqta tarin control qutupi aswan qaylla propensión puntuación kaqwan. Kay llamkanakuna yapamanta ruwakunku mana ima ruwaqkuna prueba utaq control qutukunapi saqisqa kanankama. Python kaqpi, PSM kaqpaq sapanchasqa bibliotecakuna kanku PyTorch, Psmpy , causallib hina. Utaq sapa kuti mayqin clásico bibliotecamanpas tupaq algoritmokuna kaqwan k'askanakuy atikunki.
Pivotalmi subrayar kay casopi huk control qututa ruwanapaq huk clásico A/B pruebaman rikch'akuq, maypi huk qutupi ruwaqkuna sapalla kanku chaymanta muestra sayayninkuna kaqlla kanku, NNM mana sustitución método kaqwan ruwasqa kanan tiyan. Método nisqa tupachiymanta qhipaman, tupachisqa paris hurqusqa kananta, chayrayku huk llamk'achiq kamachiy qutupi huk kutilla llamk'achisqa kanqa.
Hinallataqmi kan huk akllana huk NNM modelota akllanapaq calibradorniyuq utaq mana calibradorniyuq. Huk calibrador nisqaqa huk tupachisqa parispi propensión puntuacionkunapa karu kayninpa hanaq limite nisqatam churan. Chayhina, sapa llamk'achiq huk propensión puntuación kaqwan llamk'aqkunawanlla tupachisqa kanman huk pisi rango ukhupi. Sichus allin ruwaqkuna mana tupachiyta atikunkuchu, llamk'achiq wikch'usqa kanqa.
¿Imanasqataq chay calibradorta llamkachisaq? Allinmi chayta churay mayk'aq huk tupachisqa parispi propensión puntuacionkunap karun hatun kanman. Huk calibradorpa sayayninmanta tanteaspaqa, kaykunata qawarina: tupachiy ruway mana allin kaptinqa, tupachiyqa aswan sinchi calibradorwanmi ruwakunman hinaspa tupachiy allin kaptinqa tupachisqa pariskuna pisilla kaptinqa, calibradorqa mastarikunmanmi ( https:/ /www.ncbi.nlm.nih.gov/pmc/artículos/PMC8246231/ nisqamanta ).
Kay etapa kaqpi qhawasqa sichus covariables pruebamanta chanta tupachisqa control qutukunamanta equilibrasqa kanku, chayhina, reclamakun sichus huk tupachiy chiqan kachkan.
Huk ancha chaniyuq llamk’aymi mana equilibrasqa covariables nisqakuna pantasqa A/B prueba ruwaykuna tupachiyman apakunqa.
Kimsa medios de diagnóstico de equilibrio nisqa kan:
- estadísticas descriptivas: diferencia media estandarizada (SMD) utaq ratio de varianza (VR) .
- pruebas estadísticas nisqakuna
- rikuchiy: qq-trama, histograma o amor trama
Artículo nisqapiqa astawanqa punta kaq, kimsa kaq akllanakunapim yuyaymanani.
Ñawpaqtaqa, diferencia media estandarizada nisqamanta rimasun, chaymanta ratio de varianza nisqamanta. ¿Ima chanikunam qawachin huk covariate equilibrasqa kasqanmanta? SMD chanin 0.1 urapi kananpaq yuyaychani VR kaqmanta rimaspaqa, 1.0 kaqman qaylla chanikuna huk balanzata rikuchin .
Iskay kaqpiqa, rikuchiy ruwaykunamanta rimaspaqa, sapa covariables nisqapaqmi huknin hawapi willakuq estadística nisqa yupasqa, chaymantam grafico nisqapi qawarisqa. Ñuqa kikiymantaqa munakuypa trama nisqatam aswan allinta munani, llapa covariables nisqakuna huk grafico nisqapi churasqa kaptin, covariables nisqakuna manaraq tupachiy kachkaptinpas, chaymanta qipamanpas mana sasachakuspalla tupachiy atikusqanrayku. Uraypi graficomanta huk ejemplota churani.
¿Imataq kanman sichus covariables nisqakuna mana equilibrasqaraq kaptinku tupachisqankumanta? Rikch’anapaqqa, diferencia media estandarizada (SMD) nisqa covariables frecuencia de compras nisqamanta chaymanta AOV nisqamantaqa 0,5 muyuriqpim kachkan, chaymi 0,1 nisqamanta aswan hatun. Implican chay covariables nisqakuna desequilibrado kasqankuta, chaymi necesitakun rematching nisqa.
Covariables desequilibradas nisqakunam señalanku modelo PSM nisqa mana allinchu chaymi musuqmanta ruwana. Chayrayku, huk iskay kimsa llamk'aykunata qhipaman kutispa tupachiyta yapamanta ruwana tiyan.
Tawa ruwaykunam kan tupachiyta musuqmanta ruwanapaq:
1. Musuq covariables nisqakunata yapay
2. Achka kasqanrayku tupachiy ruwayta tikraylla
3. Propensidad Puntuacion tupachiyta chiqan tupachiy ruwaywan hukllana
4. Huk muestrapa sayayninta yapay
Tukuyninpiqa, qhipa kaq etapamanmi asuykuchkanchik, chaypim experimentopa ruwayninqa yupasqa kachkan. Aswanta kimsa laya efecto estimación kanku: kay promedio tratamiento efectota (ATE), kay promedio tratamiento efectota kay tratado kaqpi (ATT), chanta kay promedio tratamiento efectota kay control kaqpi (ATC). Básicamente rimaspa, ATE huk yupasqa chiqan kay huk clave métrica kaqpi prueba chaymanta control qutukunapura (hinallataq huk hatun métrica tupuy huk prueba A/B kaqpi). Chayqa yupasqa kachkan huk promedio de efecto tratamiento hina, ATE = promedio (Y1 - Y1) kay urapi siq’ipi rikuchisqa hina.
Mientras kay ATT chanta ATC huk promedio tratamiento efectota huk pruebamanta chanta control qutumanta, respetuosamente. Llapallankum chiqan hinaspa entiendenapaq hina estimación nisqa ruwaykuna.
ATE aswan riqsisqa laya chanta llamk’achisqa mayk’aqchus control chanta prueba qutukunap hatun métrica kaqninta kikinchakun chanta pruebasqa efectota tupukun. Mientras ATT chaymanta ATC aswan allin kanku mayk'aq sapa qutupaq absoluta métricas mañasqa kanku. Tukuyninpiqa, juk prueba estadística apropiada nisqa ruwakun, chaywantaq chay ruwasqakunap significación estadística nisqa qhawanapaq.
Método de Puntuación de Propensidad nisqamanta sut’inchasqamanta qhipaman, llamk’ayniykipi ruwayta qallariypaq pacha kanman, ichaqa wakin limitacionkuna kan qhawanapaq.
1. Bootstrap mana allinchu Propensity Score Matching kaqwan llamk'anapaq imaraykuchus varianzata yapan. ( https://economics.mit.edu/sites/default/files/publications/BOOTSTRAP FOR.pdf ALLIN RUWAYMANTA )
2. Stable unit treatment value assumption (SUTVA) principle must be met. 3. Propensity Score Matching implies using two machine learning algorithms (one for propensity score calculations and the second one for matching), which can be a pricy method to use for a company. On that account, it's advisable to negotiate with your team on A/B test conduction. 4. Finally, as discussed above, a big number of covariates are suggested to be used in the models. Thus, it requires a high-powered machine(-s) to calculate the results of the models. Again, it's a costly method to implement.
¿Munawaqchu huk cuchillota hap’iyta wakin kay tapukuykunata kutichispa? Plantillapaq enlaceqa kaymi