د چپې جدول Introduction Hypothesis testing 2.1 Introduction 2.2 Bayesian statistics 2.3 Test martingales 2.4 p-values 2.5 Optional Stopping and Peeking 2.6 Combining p-values and Optional Continuation 2.7 A/B testing Safe Tests 3.1 Introduction 3.2 Classical t-test 3.3 Safe t-test 3.4 χ2 -test 3.5 Safe Proportion Test Safe Testing Simulations 4.1 Introduction and 4.2 Python Implementation 4.3 Comparing the t-test with the Safe t-test 4.4 Comparing the χ2 -test with the safe proportion test Mixture sequential probability ratio test 5.1 Sequential Testing 5.2 Mixture SPRT 5.3 mSPRT and the safe t-test Online Controlled Experiments 6.1 Safe t-test on OCE datasets Vinted A/B tests and 7.1 Safe t-test for Vinted A/B tests 7.2 Safe proportion test for sample ratio mismatch Conclusion and References 5 Mixture sequential probability ratio ازموينه 5.1 sequential ازموینه لکه څنګه چې پرمختللي A / B ازموینې انټرنېټونه پراختیا شوي دي، دوی هم فرصتونه لري چې د ازموینې پایلې [Joh + 17] وګورئ. لکه څنګه چې موږ وګورئ، دا د غلط مثبت کچه په ناڅاپي پایلې ته وده ورکوي. د خپل انټرنېټ څخه ګټه ورکولو لپاره، لوی تکنالوژۍ شرکتونه په هر وخت کې د استثنايي روشونو جوړولو پیل کړي. د استثنايي په دې سيمه کې د sequential ازموینې، یا هر وخت د valid inference په نوم دی. sequential ازموینې د دې موضوع په اړه د واډا سیمینل کاغذ، Sequential Tests of Statistical Hypotheses [Wal45] سره پیل کیږي. Wald د لومړي sequential ازموینې ازموینه، د sequential probability test Wald او Wolfowitz ثابت کړي چې د SPRT د اټکل وړتیا په اړه د اټکل وړتیا [WW48] په حد کې د اټکل وړتیا په حد کې د اټکل وړتیا ده. په هرصورت، دا باید ذکر شي چې د اټکل وړتیا د ازموینې د جوړولو سره د خوندي ازموینې سره نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې نږدې ن 5.2 د مخلوط SPRT د sequential testing لپاره د A / B ازموینې پراختیا شامل دي د SPRT پراختیا سره دوه نمونې ډاټا په کارولو سره. دا د Johari et al. [Joh+17] له خوا ترسره شوی چې د A / B ازموینې د مزي د sequential probability ratio ازموینې (mSPRT) په نوم نوم یو ازموینې مخکښ کړي. دا ازموینې په لوی تکنالوژۍ شرکتونو لکه Uber او Netflix [SA23] کې تصویب شوي دي. لکه څنګه چې د خوندي t ازموینې سره، د mSPRT د granular، sequential ډاټا سره غوره کار کوي. د mSPRT په عمده توګه د SPRT سره ورته دی، د مخکښ باور په توګه چې د حقیقتي پارامتر θ0 ته وي. موږ د دې ازموینې د ریاضی ځانګړتیاوو په موږ به د mSPRT اټکل په خپل martingale شکل کې وده ورکړي ترڅو د کیفیت سره د خوندي t ټسټ سره پرتله کړي. د نویسنده: د Daniel Beasley Author: د Daniel Beasley دا کاغذ د ATTRIBUTION-NONCOMMERCIAL-SHAREALIKE 4.0 INTERNATIONAL لائسنس لاندې په آرشیف کې شتون لري. دا کاغذ د د ATTRIBUTION-NONCOMMERCIAL-SHAREALIKE 4.0 نړیوال لائسنس لاندې. په Archive کې شتون لري په Archive کې شتون لري