paint-brush
Ndlela yo Tirhisa Ku Fanisa Swikoweto swa Ntshikelelo: Nkongomiso wa Goza hi Gozahi@ngl21
438 ku hlayiwa
438 ku hlayiwa

Ndlela yo Tirhisa Ku Fanisa Swikoweto swa Ntshikelelo: Nkongomiso wa Goza hi Goza

hi Angela Nedopekina9m2024/11/04
Read on Terminal Reader

Ku leha ngopfu; Ku hlaya

Propensity Score Matching i thekiniki yo engetela ya swikambelo swa A/B leyi tirhisiwaka loko sample randomisation yi nga tirhi. Xikoro xa ku navela (ku koteka ka ku averiwa eka ntlawa wa xikambelo) xa ntlawa wa vutshunguri xi hlayiwa eka mutirhisi un’wana na un’wana ivi endzhaku mutirhisi a fambelanisiwa na mutirhisi un’wana hi ku ya hi datha ya matimu ya matirhiselo ya xiendliwa ku vumba ntlawa wa vulawuri. Endzhaku ka sweswo, mbuyelo wa mintlawa yimbirhi wu pimanisiwa hi ku tirhisa xikambelo xa tinhlayo naswona ku pimiwa mbuyelo wa xikambelo. Leswi nga laha hansi i rimba ra PSM: 1) Hlengeleta datha leyi eka yona ku ringanyetiwaka xikoro xa propensity naswona ku kumiwa mutirhisi loyi a ringanisiweke. 2) Xiringanyeto xa xibalo xa propensity hi ku tirhisa tindlela, to fana na logistic regression, na ku titoloveta eka dataset ku vhumbha loko mutirhisi a ta averiwa eka ntlawa wa swikambelo. Eka mutirhisi un’wana na un’wana, modele lowu leteriweke wu humesa ku koteka ka ku va eka ntlawa wa swikambelo. 3) Fanisa hi ku ya hi xikoro xa propensity, laha ku ringetiwa tindlela to hambana to fambelanisa, ku fana na muakelani wa le kusuhi.  4) Ku ringanisela ka ti-covariates exikarhi ka mintlawa ya vutshunguri na vulawuri ku kamberiwa hi ku hlayela tinhlayo ta ku ringanisela na ku tumbuluxa tiploto. Ku ringanisela loku nga riki kahle ku kombisa leswaku modele lowu ringanyetaka xikoro xa propensity wu lava ku boxiwa nakambe. 5) Vuyelo bya xikambelo byi ringanyetiwa hi ku tirhisa datha leyi ringanisiweke naswona ku endliwa xikambelo xa tinhlayo. Ku na swipimelo swo karhi eka ku tirhisa PSM.
featured image - Ndlela yo Tirhisa Ku Fanisa Swikoweto swa Ntshikelelo: Nkongomiso wa Goza hi Goza
Angela Nedopekina HackerNoon profile picture
0-item


Sweswinyana a ndzi tirha eka xikambelo lexi sekeriweke eka Propensity Score Matching naswona loko ndzi ri karhi ndzi lavisisa mahungu ndzi hlangane na ku pfumaleka ka switirhisiwa eka nhlokomhaka leyi. Vunyingi bya swihloko leswi ndzi swi kumeke swi vulavula hi ku humelela ka ndlela naswona a swi na vuxokoxoko lebyinene hi tlhelo ra thiyori. Hikwalaho, ndzi tekile xiboho xo avelana na n’wina nkongomiso lowu heleleke eka rimba ra Propensity Score Matching na magoza ya rona

Xana i yini Propensity Score Matching naswona hikokwalaho ka yini u yi tirhisa?

“Ku fambisana ka swikoweto swa ku navela ku katsa ku vumba tisethi leti ringanisiweke ta vanhu lava tshunguriweke ni lava nga tshunguriwangiki lava avelana nkoka lowu fanaka wa xikoro xa ku navela. Loko xikombiso lexi ringanaka xi vumbiwile, vuyelo bya vutshunguri byi nga ringanyetiwa hi ku pimanisa vuyelo hi ku kongoma.”


Nhlamuselo yi nyikiwile ro sungula hi Rosenbaum PR, Rubin DB eka atikili ya “Ku kambela ku twisisa eka covariate ya binary leyi nga xiyiwangiki eka dyondzo ya ku langutisisa leyi nga na mbuyelo wa binary” ya 1983.


Ku swi veka hi ku olova, leyi i thekiniki yo engetela ya swikambelo swa A/B leyi tirhisiwaka loko ku hlawuriwa ka swikombiso hi ku landzelelana ku nga tirhi . Xikoro xa ku navela (ku koteka ka ku averiwa eka ntlawa wa xikambelo) xa ntlawa wa vutshunguri xi hlayiwa eka mutirhisi un’wana na un’wana ivi endzhaku mutirhisi a fambelanisiwa na mutirhisi un’wana hi ku ya hi datha ya matimu ya matirhiselo ya xiendliwa ku vumba ntlawa wa vulawuri. Endzhaku ka sweswo, mbuyelo wa mintlawa yimbirhi wu pimanisiwa hi ku tirhisa xikambelo xa tinhlayo naswona ku pimiwa mbuyelo wa xikambelo.


Xifaniso 1. Xifaniso xa ku fambelanisa Xikoro xa Propensity


Kambe ha yini u tirhisa endlelo leri rharhanganeke ro kuma ntlawa wa vulawuri loko pulatifomo ya A/B yi nga swi endla ematshan’weni ya sweswo? Eka swiyimo swin’wana a swi koteki ku tirhisa pulatifomo ya A/B leyi nga na ntirho wo avanyisa lowu akiweke endzeni. Hi leti timhangu leti nga ha vaka kona:


  1. Swi durha naswona swi dya nkarhi eka bindzu ku tirhisa xikambelo xa A/B hikwalaho ka ntirho wo hambana wa ntirho wo tsemakanya na vuhlanganisi (ina, swi nga endleka).
  2. Khamphani yi nga ha pfumala vuyelo loko yi ri karhi yi kambela ku endla mali kumbe mintirho/maqhinga lama fambelanaka na vuxavisi eka xiyimo xo tirhisa xikambelo xa xikhale/xikambelo xa vulawuri.
  3. Hakanyingi aswi koteki kuva na randomized sampling eka swikambelo swale handle ka inthanete leswi lavekaka eka xikambelo xa A/B.
  4. Nakambe a swi tirhi ku tirhisa xikambelo xa A/B eka swikambelo swa inthanete loko nchumu lowu kamberiweke wu nga hangalasiwi hi ku landzelelana.


Ndzi vile na mhaka ya vumune eka ntirho wa mina naswona swi humelerile loko ndzi ri karhi ndzi tirha na xitirhisiwa xa e-commerce. Xipano xa swikumiwa a xi tilulamisela ku kambela ntirho wo nyika tibhonasi eka vatirhisi endzhaku ko endla oda yo sungula. Xiphiqo a ku ri leswaku ntirho lowu a wu tirha hayi eka vatirhisi hinkwavo lava vekaka oda yo sungula. Swiyimo swo karhi, swo tanihi nkoka wa oda, ni swin’wana, a swi fanele swi fikeleriwa. Eka xiyimo lexi, swi tlula swipimelo swa pulatifomo ya xikambelo xa A/B ku avanyisa thrafikhi exikarhi ka mintlawa ya xikambelo na ya vulawuri. Hi leswi swi endleke leswaku Propensity Score Matching a ku ri xihlawuhlawu.

Rimba ra ku Fanisa Swikoweto swa Ntshikelelo

Rimba leri heleleke ri sekeriwe hi xitalo eka atikili leyi nge “ Ku fambelana ka xikoro xa ku navela na R: tindlela leti tolovelekeke na swihlawulekisi leswintshwa ” naswona ri katsa magoza ya ntlhanu (Xifaniso 2).


Goza ro sungula i ku hlengeleta datha leyi eka yona ku ringanyetiwaka xikoro xa propensity naswona ku kumiwa mutirhisi loyi a ringanisiweke.


Goza ra vumbirhi i ku ringanyeta xikoro xa propensity hi ku tirhisa tindlela, to fana na logistic regression, na ku titoloveta eka dataset ku vhumbha loko mutirhisi a ta averiwa eka ntlawa wa swikambelo. Eka mutirhisi un’wana na un’wana, modele lowu leteriweke wu humesa ku koteka ka ku va eka ntlawa wa swikambelo.


Goza ra vunharhu ri kombetela eka ku fambelanisa loku sekeriweke eka xikoro xa propensity, laha ku ringetiwa tindlela to hambana to fambelanisa, ku fana na muakelani wa le kusuhi.


Eka goza ra vumune, ku ringanisela ka ti covariates exikarhi ka mintlawa ya vutshunguri na vulawuri ku kamberiwa hi ku hlayela tinhlayo ta ku ringanisela na ku tumbuluxa tiploto. Ku ringanisela loku nga riki kahle ku kombisa leswaku modele lowu ringanyetaka xikoro xa propensity wu lava ku boxiwa nakambe.


Eka goza ro hetelela ra vuntlhanu, vuyelo bya xikambelo byi ringanyetiwa hi ku tirhisa datha leyi ringanisiweke naswona ku endliwa xikambelo xa tinhlayo.


Xifaniso 2. Rimba ra ku Fananisa Swikoweto swa Ntshikelelo

Nhlengeleto wa Data

Xiyenge lexi i mayelana na ku hlengeleta swilo leswi cinca-cincaka leswi lavekaka, ti-covariate na ti-confounders. Covariate (X) i xihlawulekisi lexi tiyimeleke lexi nga khumbhaka mbuyelo wa xikambelo (Y), kambe lexi nga tsakisiki hi ku kongoma. Confounder i nchumu wun’wana handle ka lowu dyondziwaka lowu fambelanaka na ku averiwa eka ntlawa wa xikambelo (W) na mbuyelo wa xikambelo (Y).


Girafamu leyi nga laha hansi yi kombisa vuxaka bya swilo leswi cinca-cincaka. X i covariate, W i xikombiso xa xiavelo xa vutshunguri, naswona Y i mbuyelo. Girafamu leyi nga etlhelo ra ximatsi yi kombisa vuxaka bya confounder naswona leyi nga exineneni yi kombisa ku hlanganisiwa loku tiyimeleke ka covariate eka mbuyelo wa xikambelo (Y) na ku kambela avelo ra ntlawa (W).


Xifaniso 3. Vuxaka bya covariate, xiavelo xa xikambelo na mbuyelo. 


Laha i swa nkoka ku kandziyisa leswaku a swi bumabumeriwi ku hlawula ntsena swilo leswi cinca-cincaka leswi fambelanaka na ku averiwa ka vatirhisi eka ntlawa wa xikambelo (W) hikuva swi nga hunguta ku kongoma eka ku kambela ku hambana ka ntlawa handle ko hunguta ku va na xihlawuhlawu ( https://www.ncbi .nlm.nih.gov/pmc/swihloko/PMC1513192/ ).


U nga ha vutisa leswaku i swilo swingani leswi cinca-cincaka leswi ndzi faneleke ndzi swi hlawula? Nhlamulo ya olova - loko swi tele, swa antswa leswaku ku kumiwa xiringanyeto xa le henhla xa mimbuyelo na ku hunguta ku va na xihlawuhlawu eka dyondzo . Nakona laha ndzi vulavula hi tinomboro letikulu tani hi 20-50 kumbe ku tlula.

Xiringanyeto xa Xibalo xa Ntshikelelo

Ku ya emahlweni eka goza leri landzelaka, swa laveka ku hlengeleta datha na ku veka mujeko wa ku va wa ntlawa wa vutshunguri. Vatirhisi van’wana hinkwavo va ta va na vuswikoti byo vumba ntlawa wa vulawuri. Endzhaku ka sweswo propensity score yi ringanyetiwa hiku tirhisa maendlelo yohambana hambana, kufana na logistic regression kumbe makhwati ya random.


Vunyingi bya tiatikili leti ndzi ti hlayeke ti ringanyeta ku namarhela logistic regression na ku nga tirhisi timodeli tin’wana leti rharhanganeke swinene tanihileswi ku pakanisa ka le henhla ku nga riki ka nkoka . Hambi swi ri tano, endlelo leri humelelaka ro ringanisa ri dzikisa mianakanyo eka ku pakanisa.


Endzhaku ko hlawula ndlela, modele wo vhumbha wu leteriwile eka datha hi ku tirhisa ti-covariate leti hlawuriweke ku vhumbha loko mutirhisi a ri wa ntlawa wa xikambelo. Xo hetelela, modele wu endla vuprofeta eka mutirhisi un’wana na un’wana, naswona xibalo xa propensity, ku koteka ka ku va eka ntlawa wa xikambelo, xa hlayeriwa. Hi mayelana na ti software, eka Python unga tirhisa layiburari yin’wana na yin’wana ya vuprofeta kusukela eka basic scikit-learn kuya eka Prophet.

Ku Fananisa Data

Goza leri landzelaka i ku tirhisa thekiniki yo fambelanisa ku kuma mutirhisi loyi a ringanisiweke na mutirhisi ku suka eka ntlawa wa xikambelo. Hikwalaho, ku vumbiwa ntlawa wa vulawuri.


Kuna tindlela tohambana hambana to fambelanisa leti unga hlawulaka eka tona, xikombiso ku fambelanisa hi ku kongoma kumbe ku fambelanisa mpfhuka wa Mahalanobis. Eka xihloko lexi ngopfungopfu ndzi ta vulavula hi thekiniki leyi tolovelekeke ya ku fambelanisa vaakelani va le kusuhi na ku hambana ka yona.


Ku fambelanisa ka vaakelani va le kusuhi (NNM) ku vumbiwa hi swiyenge swimbirhi. Xo sungula, algorithm yi hlawula vatirhisi, un’we-un’we eka ntlawa wa vutshunguri, hi ku landzelelana loku vekiweke. Endzhaku ka sweswo, eka mutirhisi un’wana na un’wana wa ntlawa wa xikambelo, algorithm yi kuma mutirhisi eka ntlawa wa vulawuri loyi a nga na xikoro xa le kusuhi xa ku navela. Magoza lawa ya phindha-phindhiwa ku kondza ku nga si sala vatirhisi eka mintlawa ya xikambelo kumbe ya vulawuri. Eka Python, ku na tilayiburari to karhi ta PSM tanihi PyTorch, Psmpy , causallib . Kumbe u nga tshama u namarhela layiburari yihi na yihi ya xikhale leyi nga ni tialgorithm leti fambisanaka.


I swa nkoka ku kandziyisa leswaku eka xiyimo xo tumbuluxa ntlawa wa vulawuri lowu fanaka na xikambelo xa A/B xa xikhale, laha vatirhisi eka ntlawa va hlawulekeke naswona vukulu bya xikombiso byi ringana, NNM handle ka ndlela yo cinca yi fanele ku tirhisiwa. Ndlela yi vula leswaku endzhaku ko fambelanisa, mpatswa lowu ringanisiweke wu ta susiwa, leswaku mutirhisi eka ntlawa wa vulawuri a ta tirhisiwa kan’we ntsena.


Kutlhela kuva na nhlawulo wo hlawula modele ya NNM leyingana kumbe handle ka caliper. Caliper yi veka mpimo wa le henhla wa mpfhuka wa swikoweto swa propensity eka pair leyi fambelanaka. Xisweswo, mutirhisi un’wana na un’wana a nga ringanisiwa ntsena na vatirhisi va xikoro xa ku navela endzeni ka mpimo lowu pimiweke. Loko vatirhisi lava faneleke va nga swi koti ku ringanisiwa, mutirhisi u ta lahliwa.


Ha yini ndzi fanele ndzi tirhisa caliper? Swikahle kuva uyi tirhisa loko mpfhuka wa swikoweto swa propensity eka pair leyi fambelanaka wungava wukulu. Loko u teka xiboho xa sayizi ya caliper, languta leswi landzelaka: loko matirhelo yo fambelanisa yanga enerisi, ku fambelanisa swinga endliwa hi caliper yo tiya naswona loko ku fambelanisa swihumelela kambe nhlayo ya ti pairs leti fambelanisiweke yiri yitsongo, caliper yinga ndlandlamuxiwa ( https:/ /www.ncbi.nlm.nih.gov/pmc/swihloko/PMC8246231/ ).

Swikambelo swa Balance

Hi nkarhi wa xiteji lexi ku kamberiwa loko ti covariates ta mintlawa ya xikambelo na ya vulawuri lebyi ringanisiweke ti ringanisiwile, xisweswo, yi vula loko ku fambelana ku ri ntiyiso.

I goza ra nkoka tanihileswi ti-covariate leti nga ringaniseriwangiki ti nga ta yisa eka ku pimanisiwa loku hoxeke ka mbuyelo wa xikambelo xa A/B.

Ku ni tindlela tinharhu to kambela ku ringanisela:


- tinhlayo leti hlamuselaka: ku hambana ka le xikarhi loku ringaniseriweke (SMD) kumbe mpimo wa ku hambana (VR) .

- swikambelo swa tinhlayo

- ku vona hi mahlo ya mianakanyo: qq-plot, histogram kumbe love plot


Eka xihloko lexi ndzi dzikisa mianakanyo ya mina ngopfu eka ndlela yo sungula ni ya vunharhu.


Xo sungula, a hi buleni hi standardized mean difference na variance ratio. Hi yihi mimpimo leyi kombisaka leswaku covariate yi ringaniseriwile? Ndzi ringanyeta leswaku ntikelo wa SMD wu le hansi ka 0.1 Hi mayelana na VR, mimpimo leyi nga ekusuhi na 1.0 yi kombisa ku ringanisela .


Eka ndhawu ya vumbirhi, mayelana na tindlela to vona hi mahlo, yin’wana ya tinhlayo leti hlamuselaka leti nga laha henhla yi hlayeriwa eka covariate yin’wana na yin’wana naswona yi kombisiwa hi xifaniso. Mina hi ndzexe ndzi tsakela plot ya rirhandzu tani hi leswi ti covariates hinkwato tinga vekiwaka eka graph yin’we naswona ti covariates before and after matching tinga pimanisiwa hiku olova. Ndzi veka xikombiso xa girafu leyi nga laha hansi.


Xifaniso 4. Ploto ya rirhandzu ya ti-covariate SMD emahlweni na le ndzhaku ka ku lulamisiwa


Ku vuriwa yini loko ti-covariate ta ha ri leti nga ringaniki endzhaku ko fambelana? Ku kombisa, standardized mean difference (SMD) ya covariates frequency ya ku xava na AOV swile kusuhi na 0.5, leswinga ehenhla ka leswi lavekaka 0.1. Swi vula leswaku ti covariates a ti ringani naswona ku laveka rematching.

Imbalanced covariates signal PSM model a yi tirhi naswona yi lava ku akiwa nakambe. Hikwalaho, i swa nkoka ku tlhelela endzhaku magoza ma nga ri mangani ivi u phindha ku fambisana.

Kuna tindlela ta mune to endla ku fambisana nakambe:


1. Engetela ti-covariate letintshwa

2. Cinca ntsena ndlela yo fambisana tanihi leswi ku nga na tona to tala

3. Hlanganisa Propensity Score Matching na ndlela yo fambelanisa hi ku kongoma

4. Engetela mpimo wa xikombiso

Xiringanyeto xa Vuyelo bya Vutshunguri

Eku heteleleni, hi tshinelela xiteji xo hetelela loko mbuyelo wa xikambelo wu ringanyetiwa. Ngopfungopfu kuna tinxaka tinharhu ta xiringanyeto xa mbuyelo: mbuyelo wa vutshunguri bya xikarhi (ATE), mbuyelo wa vutshunguri bya xikarhi eka loyi a tshunguriweke (ATT), na mbuyelo wa vutshunguri bya xikarhi eka vulawuri (ATC). Hi xisekelo, ATE i ku hambana loku hlayiweke eka metric ya nkoka exikarhi ka mintlawa ya xikambelo na ya vulawuri (ku pima loku fanaka ku pima metric leyikulu eka xikambelo xa A/B). Yi hlayeriwa tani hi xiringaniso xa mbuyelo wa vutshunguri, ATE = avg (Y1 - Y1) tani hileswi swi kombisiweke laha hansi eka xifaniso.


Xifaniso 5.Tifomula na swikombiso swa xibalo swa vuyelo bya vutshunguri 


Loko ATT na ATC i mbuyelo wa vutshunguri bya xikarhi wa ntlawa wa xikambelo na vulawuri, hi ku landzelelana. Hinkwaswo i tindlela to ringanyeta leti kongomeke ni leti twisisekaka.


ATE i muxaka lowu tolovelekeke swinene naswona wu tirhisiwa loko metric leyikulu ya mintlawa ya vulawuri na ya swikambelo yi pimanisiwa na mbuyelo lowu kamberiweke wu pimiwa. Loko ATT na ATC swi tsakeriwa loko ku laveka timetriki leti heleleke eka ntlawa wun’wana na wun’wana. Eku heteleleni, ku endliwa xikambelo xa tinhlayo lexi faneleke ku kambela nkoka wa tinhlayo wa mimbuyelo.

Swipimelo swa ku Fanisa Swikoweto swa Ntshikelelo

Endzhaku ka nhlamuselo ya vuxokoxoko bya ndlela ya Propensity Score Matching , swi nga va nkarhi wo sungula ku yi tirhisa entirhweni wa wena, kambe ku na swipimelo swo karhi leswi faneleke ku tekeriwa enhlokweni.


1. Bootstrap a yi hlohleteriwi ku tirhisiwa na Propensity Score Matching tani hi leswi yi engetelaka ku hambana. ( https://economics.mit.edu/sites/default/files/publications/EKA KU HLAYISEKA KA BOOTSTRAP FOR.pdf )

 2. Stable unit treatment value assumption (SUTVA) principle must be met. 3. Propensity Score Matching implies using two machine learning algorithms (one for propensity score calculations and the second one for matching), which can be a pricy method to use for a company. On that account, it's advisable to negotiate with your team on A/B test conduction. 4. Finally, as discussed above, a big number of covariates are suggested to be used in the models. Thus, it requires a high-powered machine(-s) to calculate the results of the models. Again, it's a costly method to implement.

Kambe, loko swi koteka ku tirhisa Propensity Score Matching , swi endle naswona u nga kanakani ku ndlandlamuxa ntokoto wa wena na vutivi lebyi tirhaka. Mikateko eka swikambelo swa wena swa nkarhi lowu taka na ku tshuburiwa ka dyondzo ya muchini



Xana u nga tsakela ku teka xibalesa xo hlamula swin’wana swa swivutiso leswi? Xihlanganisi xa xifaniso xa xifaniso i LAHA . Xana wa swi tsakela ku hlaya leswi nga endzeni eka switsundzuxo swa hina hinkwaswo swo tsala? Click LAHA .




L O A D I N G
. . . comments & more!

About Author

Angela Nedopekina HackerNoon profile picture
Angela Nedopekina@ngl21
Data Analyst with 3+ work experience of building analytics from 0-to-1 and managing international projects.

HANG TAGS

XITLHOKOVETSELO LEXI XI NYIKERIWE EKA...