paint-brush
Imaynatataq Propensidad Puntuacion tupachiyta ruwanapaq: Huk Paso a Paso Guíaby@ngl21
177 ñawinchasqakuna

Imaynatataq Propensidad Puntuacion tupachiyta ruwanapaq: Huk Paso a Paso Guía

by Angela Nedopekina9m2024/11/04
Read on Terminal Reader

Nishu unay; Ñawinchanapaq

Propensity Score Matching huk yapasqa A/B pruebakuna técnica llamk’achisqa mayk’aqchus muestra aleatorización mana llamk’anchu. Puntuación de propensión (probabilidad prueba qutuman asignasqa kay) huk hampi qutumanta sapa llamk'aqpaq yupasqa chaymanta chaymanta llamk'achiq huk llamk'aqwan tupachisqa kachkan chaymanta datos históricos kaqpi producto llamk'achiyta huk control qututa ruwaspa. Chay qhepamanmi iskay huñukunaq ruwasqankuta tupachinku prueba estadística nisqawan, chaymantataqmi tupunku huk efecto experimental nisqawan. Uraypiqa PSM nisqapa huk marconmi: 1) Huñuy mayqinkunapichus huk propensión puntuación yupasqa kachkan chaymanta huk tupachisqa usuario tarikun. 2) Huk propensión puntuación kaqmanta yupay métodokuna llamk'achispa, regresión logística hina, chaymanta willay huñupi yachachiy, huk llamk'aq prueba qutuman churasqa kananta willanapaq. Sapa llamk'aqpaq, yachachisqa modelo huk prueba qutupi kananpaq probabilidadta paqarichimun. 3) Puntuación de propensión nisqaman hina tupachiy, maypichus hukniray tupachiy ruwaykuna pruebasqa, aswan qaylla vecino hina.  4) Chay balance de covariables nisqa tratamientowan controlwan grupokuna ukhupiqa, estadísticas de equilibrio nisqa yupaspa, parcelas nisqakunata ruwaspa ima. Mana allin equilibrio nisqa qawarichinmi chay modelo estimador de propensión nisqa puntuación nisqa musuqmanta especificasqa kananta. 5) Huk pruebapa efectosninqa tupachisqa datoswanmi yupasqa, prueba estadística nisqapas ruwakun. PSM nisqa ruwakunanpaqqa kanmi wakin limitacionkuna.
featured image - Imaynatataq Propensidad Puntuacion tupachiyta ruwanapaq: Huk Paso a Paso Guía
Angela Nedopekina HackerNoon profile picture
0-item


Kunallanraqmi huk experimentopi llamkachkarqani Propensity Score Matching nisqapi hapipakuspay hinaspam willakuykunata maskachkaptiy chay temamanta materialkuna mana kasqanwan tuparqani. Yaqa llapan tarisqay qillqasqakunaqa métodopa efectividadninmantam kachkan hinaspapas manam allin detalladachu teoría nisqamanta. Chayrayku, qamkunawan huk tukuypaq kamachiyta Propensity Score Matching marcomanta chaymanta llamk'ayninkunamanta qunakunaypaq tantearqani

¿Imataq Propensidad Puntuacion tupachiy hinaspa imaraykutaq chayta churana?

“Propensidad puntuación tupachiyqa huk tupachisqa conjuntokuna hampisqa chaymanta mana hampisqa sujetokuna ruwaymi, paykunam huk rikchaq valorta qunku propensión puntuación kaqmanta. Huk kuti huk muestra tupachisqa ruwasqaña kaqtinqa, hampiypa efectontaqa chaninchakunmanmi, chaypaqqa chiqanmanta tupachispa imakunachus ruwakusqanmanta”, nispa.


Chay definicionqa ñawpaqtaqa Rosenbaum PR, Rubin DB nisqapa qusqanmi karqa “Evaluación de sensibilidad nisqa huk mana qawasqa covariado binario nisqaman huk estudio observacionalpi iskayniyuq ruwaywan” 1983 watapi qillqasqapi.


Pisi rimayllapi, kayqa huk yapasqa A/B pruebakuna técnica llamk'achisqa mayk'aq muestra aleatorización mana llamk'achkanchu . Puntuación de propensión (probabilidad prueba qutuman asignasqa kay) huk hampi qutumanta sapa llamk'aqpaq yupasqa chaymanta chaymanta llamk'achiq huk llamk'aqwan tupachisqa kachkan chaymanta datos históricos kaqpi producto llamk'achiyta huk control qututa ruwaspa. Chay qhepamanmi iskay huñukunaq ruwasqankuta tupachinku prueba estadística nisqawan, chaymantataqmi tupunku huk efecto experimental nisqawan.


Siqi 1. Propensidad Puntuacion tupachiy Siqi


Ichaqa, ¿imaraykutaq chay compleja técnica nisqawan huk grupo de control nisqa tarinapaq, sichus huk plataforma A/B nisqa chaypa rantinpi ruwayta atinman? Wakin kutikunapi mana atikunchu llamk'achiyta huk A/B plataformata huk ruwasqa rakina ruwaywan. Kaypiqa kanmanmi casokuna:


  1. Huk chaninniyuq chaymanta pacha hapiq negociopaq huk A/B prueba ruwanapaq imaymana chakasqa ruway llamkanakuna chaymanta willakuykunarayku (arí, chayhina kanman).
  2. Huk empresa mana gananciayuq kanman qullqichakuy utaq qhatuywan tupaq ruwanakuna/estrategias pruebachkaspa prueba clásico/control experimento ruwaypi.
  3. Sapa kuti mana atikunchu huk muestreo aleatorizado kaqniyuq kay mana tinkisqa experimentokunapi mayqinchus huk prueba A/B kaqpaq mañasqa.
  4. Hinallataq mana llamk'anapaqchu huk A/B prueba internetpi experimentokunapi churay mayk'aq huk pruebasqa objeto mana random rakisqachu.


Tawa kaq casota ruwasqaypi karqani chaymanta huk e-commerce ruruwan llamk’achkaspa pasarqa. Huk equipo producto kaqmanta huk ruwayta pruebananpaq wakichisqa karqa, mayqinchus bonokuna quypaq usuariokunaman ñawpaq pedido ruwasqamanta. Sasachakuyqa karqan chay ruway llamk'achkasqa mana llapa ruwaqkuna ñawpaq kamachiyta churasqankupi. Wakin condicionkunatan hunt’anan karqan, ahinataq ordenpa valornin, hukkunapas. Kayhina kaqpi, huk A/B prueba plataformapa limitekunamanta hawapi kachkan prueba chaymanta control qutukunapura t'ikrayta rakinapaq. Kaypi imarayku Propensidad Puntuacion tupachiy akllana karqa.

Marco de la Puntuación de Propensidad nisqa tupachiy

Huk hunt’asqa marcoqa yaqa huk qillqasqapim “ Propensidad puntuación tupachiy Rwan: métodos convencionales y nuevas características ” nisqapi sayasqa, pichqa llamkaykunatam hapin (2 yupay).


Ñawpaq ruwayqa datos huñuymi maypichus huk propensión puntuación yupasqa chaymanta huk tupachisqa usuario tarikun.


Iskay kaq ruwayqa huk propensión puntuación nisqa yupaymi métodokuna llamk'achispa, ahinataq regresión logística nisqapi, chaymanta willay huñupi yachachiy, huk llamk'aq prueba huñuman churasqa kanqa icha manachu chayta willanapaq. Sapa llamk'aqpaq, yachachisqa modelo huk prueba qutupi kananpaq probabilidadta paqarichimun.


Kimsa kaq llamk'ayqa propensión puntuación nisqapi tupachiymanta riman, maypichus hukniray tupachiy ñankuna pruebasqa kanku, aswan qaylla vecino hina.


Tawa kaq llamkaypiqa, balance de covariables nisqa tratamientowan controlwan grupokunapurapim qawarikun, estadísticas de balance nisqa yupaspa, parcelas nisqakunata ruwaspa ima. Mana allin equilibrio nisqa qawarichinmi chay modelo estimador de propensión nisqa puntuación nisqa musuqmanta especificasqa kananta.


Pichqa kaq tukupay ruwaypiqa, huk pruebapa efectosninqa tupachisqa datos nisqawanmi yupasqa, chaymantam prueba estadística nisqa ruwakun.


Siqi 2. Propensidad Puntuacion tupachiy Marco

Willayta Huñuy

Kay etapaqa variables, covariables, confundidores nisqakuna necesario nisqa huñuymantam. Covariado (X) nisqaqa huk independiente variable nisqa, chaymi huk experimento (Y) nisqapa ruwakuyninta influyenman, ichaqa manam directo interesniyuqchu. Confundidor nisqaqa huk factormi, mana chay estudiasqamantachu, chaymi hukllachasqa kachkan iskayninpi, huk prueba huñuman asignacionwan (W) chaynallataq huk experimentopa ruwakuyninwanpas (Y).


Uraypi grafico nisqapim qawarikun variables nisqapa relaciones nisqakuna. X huk covariado, W huk indicador tratamiento asignación kaqmanta, Ytaq huk resultado. Lloq’e ladopi kaq graficoqa rikuchinmi confundidorpa relacionninta hinallataq paña ladopi kaqmi qawachin covariatepa independiente conexión nisqa experimentopa ruwasqanman (Y) chaynallataq prueba de asignación de grupos nisqaman (W).


Siqi 3. Covariado, asignación de prueba hinaspa resultado nisqapa relacionninkuna. 


Kaypiqa ancha chaniyuqmi subrayanapaq mana allinchu kanman akllanapaq variablekunallata mayqinkunachus huk prueba qutuman (W) ruwaqkunap asignacionwan tinkisqa kachkanku imaraykuchus qutu chiqan kay chaninchaypi precisión kaqta pisiyachinman mana sesgo pisiyachispa ( https://www.ncbi .nlm.nih.gov/pmc/artículos/PMC1513192/ nisqamanta willakuy.


Tapukuwaqmi hayka variablekunatataq akllanay? Kutichiyqa sasan - aswan aswan, aswan allin chaywan hatun estimación ruwasqakuna tarinapaq chaymanta estudio sesgo pisiyachinapaq . Hinaspa kaypi rimachkani hatun yupaykunamanta 20-50 hina utaq aswanraq.

Propensidad nisqamanta Puntuacionmanta Estimación

Qatiqnin ruwayman purispa, willayta huñunapaq chaymanta huk hampi qutuman pertenecesqanmanta bandera churanapaq mañakun. Llapan wak llamk'aqkuna atiyniyuq huk kamachiy qututa ruwanqaku. Chay qhipamanmi puntuación de propensión nisqa imaymana ruwaykunawan yupasqa, regresión logística nisqawan utaq bosques aleatorios nisqawan ima.


Yaqa llapan qillqasqakuna ñawinchasqaymi yuyaychanku regresión logística nisqaman hapipakuyta hinaspa huk aswan sasachakuyniyuq modelokunata mana llamkachiyta, hatun precisión nisqa mana crucial kasqanrayku . Chaywanpas, tupachiy técnica allin ruwayqa, chiqap ruwaypi astawan yuyaymanan.


Método akllasqamanta, huk modelo predictivo nisqa datos nisqapi yachachikun akllasqa covariables nisqawan, chaywanmi willakun sichus huk usuario prueba huñuman pertenecen icha manachu chayta. Tukuyninpiqa, modelo sapa usuariopaq willakuykunata ruwan, chaymanta propensión puntuación, prueba qutupi kaymanta probabilidad, yupasqa. Softwarekunamanta rimaspa, Python kaqpi mayqin pronóstico bibliotecatapas llamk'achiy atikunki básica scikit-yachaymanta qallarispa chaymanta Prophet kaqman astakuspa.

Willakuykunata tupachiy

Kay qatiq ruwayqa huk tupachiy ruwayta ruwanapaq huk tupachisqa ruwaqman huk prueba huñumanta ruwaqman tarinapaq. Chayraykum huk grupo control nisqa rikurimun.


Imaymana tupachiy ñankuna kan akllanapaq, ahinataq chiqan tupachiy utaq Mahalanobis karu tupachiy. Kay qillqasqapiqa aswantaqa rimasaqmi técnica común nisqamanta aswan qaylla vecino tupachiymanta chaymanta variacionninkunamanta.


Aswan qaylla vecino tupachiy (NNM) iskay phasimanta ruwasqa. Ñawpaqta, algoritmo ruwaqkunata akllan, hukmanta huk hampi qutumanta, huk kamachisqa ordenpi. Chaymanta, sapa prueba qutumanta llamk'aqpaq, algoritmo huk llamk'aqta tarin control qutupi aswan qaylla propensión puntuación kaqwan. Kay llamkanakuna yapamanta ruwakunku mana ima ruwaqkuna prueba utaq control qutukunapi saqisqa kanankama. Python kaqpi, PSM kaqpaq sapanchasqa bibliotecakuna kanku PyTorch, Psmpy , causallib hina. Utaq sapa kuti mayqin clásico bibliotecamanpas tupaq algoritmokuna kaqwan k'askanakuy atikunki.


Pivotalmi subrayar kay casopi huk control qututa ruwanapaq huk clásico A/B pruebaman rikch'akuq, maypi huk qutupi ruwaqkuna sapalla kanku chaymanta muestra sayayninkuna kaqlla kanku, NNM mana sustitución método kaqwan ruwasqa kanan tiyan. Método nisqa tupachiymanta qhipaman, tupachisqa paris hurqusqa kananta, chayrayku huk llamk'achiq kamachiy qutupi huk kutilla llamk'achisqa kanqa.


Hinallataqmi kan huk akllana huk NNM modelota akllanapaq calibradorniyuq utaq mana calibradorniyuq. Huk calibrador nisqaqa huk tupachisqa parispi propensión puntuacionkunapa karu kayninpa hanaq limite nisqatam churan. Chayhina, sapa llamk'achiq huk propensión puntuación kaqwan llamk'aqkunawanlla tupachisqa kanman huk pisi rango ukhupi. Sichus allin ruwaqkuna mana tupachiyta atikunkuchu, llamk'achiq wikch'usqa kanqa.


¿Imanasqataq chay calibradorta llamkachisaq? Allinmi chayta churay mayk'aq huk tupachisqa parispi propensión puntuacionkunap karun hatun kanman. Huk calibradorpa sayayninmanta tanteaspaqa, kaykunata qawarina: tupachiy ruway mana allin kaptinqa, tupachiyqa aswan sinchi calibradorwanmi ruwakunman hinaspa tupachiy allin kaptinqa tupachisqa pariskuna pisilla kaptinqa, calibradorqa mastarikunmanmi ( https:/ /www.ncbi.nlm.nih.gov/pmc/artículos/PMC8246231/ nisqamanta ).

Diagnósticos de Equilibrio nisqa

Kay etapa kaqpi qhawasqa sichus covariables pruebamanta chanta tupachisqa control qutukunamanta equilibrasqa kanku, chayhina, reclamakun sichus huk tupachiy chiqan kachkan.

Huk ancha chaniyuq llamk’aymi mana equilibrasqa covariables nisqakuna pantasqa A/B prueba ruwaykuna tupachiyman apakunqa.

Kimsa medios de diagnóstico de equilibrio nisqa kan:


- estadísticas descriptivas: diferencia media estandarizada (SMD) utaq ratio de varianza (VR) .

- pruebas estadísticas nisqakuna

- rikuchiy: qq-trama, histograma o amor trama


Artículo nisqapiqa astawanqa punta kaq, kimsa kaq akllanakunapim yuyaymanani.


Ñawpaqtaqa, diferencia media estandarizada nisqamanta rimasun, chaymanta ratio de varianza nisqamanta. ¿Ima chanikunam qawachin huk covariate equilibrasqa kasqanmanta? SMD chanin 0.1 urapi kananpaq yuyaychani VR kaqmanta rimaspaqa, 1.0 kaqman qaylla chanikuna huk balanzata rikuchin .


Iskay kaqpiqa, rikuchiy ruwaykunamanta rimaspaqa, sapa covariables nisqapaqmi huknin hawapi willakuq estadística nisqa yupasqa, chaymantam grafico nisqapi qawarisqa. Ñuqa kikiymantaqa munakuypa trama nisqatam aswan allinta munani, llapa covariables nisqakuna huk grafico nisqapi churasqa kaptin, covariables nisqakuna manaraq tupachiy kachkaptinpas, chaymanta qipamanpas mana sasachakuspalla tupachiy atikusqanrayku. Uraypi graficomanta huk ejemplota churani.


Siqi 4. Munakuypa gráfico de covariables SMD manaraq allichasqa kachkaptin, chaymanta qipamanpas


¿Imataq kanman sichus covariables nisqakuna mana equilibrasqaraq kaptinku tupachisqankumanta? Rikch’anapaqqa, diferencia media estandarizada (SMD) nisqa covariables frecuencia de compras nisqamanta chaymanta AOV nisqamantaqa 0,5 muyuriqpim kachkan, chaymi 0,1 nisqamanta aswan hatun. Implican chay covariables nisqakuna desequilibrado kasqankuta, chaymi necesitakun rematching nisqa.

Covariables desequilibradas nisqakunam señalanku modelo PSM nisqa mana allinchu chaymi musuqmanta ruwana. Chayrayku, huk iskay kimsa llamk'aykunata qhipaman kutispa tupachiyta yapamanta ruwana tiyan.

Tawa ruwaykunam kan tupachiyta musuqmanta ruwanapaq:


1. Musuq covariables nisqakunata yapay

2. Achka kasqanrayku tupachiy ruwayta tikraylla

3. Propensidad Puntuacion tupachiyta chiqan tupachiy ruwaywan hukllana

4. Huk muestrapa sayayninta yapay

Hampikuypa Efectonkunamanta yupay

Tukuyninpiqa, qhipa kaq etapamanmi asuykuchkanchik, chaypim experimentopa ruwayninqa yupasqa kachkan. Aswanta kimsa laya efecto estimación kanku: kay promedio tratamiento efectota (ATE), kay promedio tratamiento efectota kay tratado kaqpi (ATT), chanta kay promedio tratamiento efectota kay control kaqpi (ATC). Básicamente rimaspa, ATE huk yupasqa chiqan kay huk clave métrica kaqpi prueba chaymanta control qutukunapura (hinallataq huk hatun métrica tupuy huk prueba A/B kaqpi). Chayqa yupasqa kachkan huk promedio de efecto tratamiento hina, ATE = promedio (Y1 - Y1) kay urapi siq’ipi rikuchisqa hina.


Siqi 5.Fórmulas hinaspa yupay ejemplokuna hampiypa efectosninmanta 


Mientras kay ATT chanta ATC huk promedio tratamiento efectota huk pruebamanta chanta control qutumanta, respetuosamente. Llapallankum chiqan hinaspa entiendenapaq hina estimación nisqa ruwaykuna.


ATE aswan riqsisqa laya chanta llamk’achisqa mayk’aqchus control chanta prueba qutukunap hatun métrica kaqninta kikinchakun chanta pruebasqa efectota tupukun. Mientras ATT chaymanta ATC aswan allin kanku mayk'aq sapa qutupaq absoluta métricas mañasqa kanku. Tukuyninpiqa, juk prueba estadística apropiada nisqa ruwakun, chaywantaq chay ruwasqakunap significación estadística nisqa qhawanapaq.

Limitaciones de Puntuación de Propensidad nisqa tupachiy

Método de Puntuación de Propensidad nisqamanta sut’inchasqamanta qhipaman, llamk’ayniykipi ruwayta qallariypaq pacha kanman, ichaqa wakin limitacionkuna kan qhawanapaq.


1. Bootstrap mana allinchu Propensity Score Matching kaqwan llamk'anapaq imaraykuchus varianzata yapan. ( https://economics.mit.edu/sites/default/files/publications/BOOTSTRAP FOR.pdf ALLIN RUWAYMANTA )

 2. Stable unit treatment value assumption (SUTVA) principle must be met. 3. Propensity Score Matching implies using two machine learning algorithms (one for propensity score calculations and the second one for matching), which can be a pricy method to use for a company. On that account, it's advisable to negotiate with your team on A/B test conduction. 4. Finally, as discussed above, a big number of covariates are suggested to be used in the models. Thus, it requires a high-powered machine(-s) to calculate the results of the models. Again, it's a costly method to implement.

Ichaqa, sichus atikun ruwayta Propensity Score Matching , ruway chaymanta ama iskayrayaychu experienciaykita chaymanta ruway yachayniykikunata aswan allinchayta. Allin suerte hamuq experimentoykikunawan hinaspa makina yachay tarisqaykikunawan



¿Munawaqchu huk cuchillota hap’iyta wakin kay tapukuykunata kutichispa? Plantillapaq enlaceqa kaymi KAYPI . ¿Munawaqchu llapa qillqayniykumanta willakuykunata ñawinchayta? Chayta ñit’iy KAYPI .