Quant د توکو قانون: که وروسته د بدلون PnL دی، دا د بدلون دی. که وروسته د بدلون PnL دی، دا د بازار دی. Quant د توکو قانون: که وروسته د بدلون PnL دی، دا د بدلون دی. که د بدلون وروسته PnL ټیټ دی، دا بازار دی. زه په کچه سوداګریز کې کار کوي او په بشپړه توګه اتومات څیړنې چاپیریالونه او سوداګریز سیسټمونه جوړ کوم چې زما ته د بازار ډاټا څخه د تولید سوداګریز ستراتیژۍ ته د فعالیت تحلیل لپاره مرسته کوي. د دغو سیسټمونو د اصلي اړتیاوو څخه یو دا ده چې زه په چټکۍ سره خپل افکار ازمايښت او په چټکۍ سره تکرار کولی شي چې په عمومي توګه د سوداګریز فعالیت ښه کړي. مګر څنګه زه قضاوت کولی شي که زه ښه وي؟ دا یو خورا واضح مټريک دی چې پوه شي که زه ترټولو ښه کړم یا نه. PnL که تاسو هیڅکله د ژوند د سوداګرۍ ستراتیژۍ ترسره کړئ، نو تاسو به دا ورځني rituals پوه شئ: د سپارلو، لټینټونو، ذخیره کولو او - په ناڅاپي توګه - په PnL کې چمتو کولو لپاره ډاونلوډونه چمتو کړئ. دا گراف سټارټ سټارټ دی چې د سوداګرۍ په بریالیتوب سره څومره خلاص کیږي. مګر د مختصر هورمون PnL لخوا بدلونونه دا یو ترټولو چټک لاره ده. بازارونه غیر مستطیل دي، د پوښونو کلستر، د بیلابیلو حالتونه بدل کیږي، میکرو جوړښتونه بدل کیږي، او د پایلو د توزیع د تیلو ټیټ دی. که تاسو د PnL پړاوونو ته ځواب ورکړئ، تاسو به په پایله کې د رڼا په لټه کې وي. fool yourself دا پست د A وګورئ چې څنګه د PnL-Chasing بدلون سره - له دې امله ستاسو iteration چڼاسکه د وخت د واحد په توګه ډیر سیگنال ترلاسه کوي. practical statistical hypothesis testing ولې PnL یو ناڅاپي میټریک دی PnL یو د ډیری غیر معمولي اجزاء څخه: د مجموعې د بازار د نظام او توازن. ستاسو د ورځني PnL پراختیا کولی شي په خبرونو کې دوه برابر شي حتی که ستاسو د سیستم بدلون نلري. د مایکرو ثانیو وخت، د رخصتۍ موقعیت، فیس کټګوریو، مخکښ او د رخصتۍ تعامل - ټول په سوداګرۍ پایلې کې د رخصتۍ اغیزه کوي. د پړاو بستگی. ځینې لومړنۍ ګټې په وروسته کې (یا برعکس) د لوی مفهوم وړاندیز ته وده ورکړي، کوم چې د کرښه باور لري د هر سوداګرۍ په اساس د متوسط پایلو بدلون له الرې. ډیری مخکښونه. د مخکښ کپسونو، وړاندیز په اوږدو کې، داخلي crossings، یا routing کې بدلونونه کولی شي د PnL په مخکښ لارو کې حرکت وکړي او د یو بل بدلون یا amplify کړي. PnL د سوداګرۍ د څارنې لپاره یو ښه هدف دی، مګر اړتیا نه ده چې د مختصر کړکۍ کې د څیړنې بدلونونو قبول / رد کولو لپاره یو مناسب معیار وي. چې موږ غواړئ پوه شي د د کله چې موږ د بدلون ته ورسیږي (د دې لپاره چې په سیگنال کې یو نوی ځانګړتیا، یو بل لګښت لګښت، یو بل اغیزې قانون) موږ غواړو چې ځواب ونیسئ: آیا د ښکلا پرمختګ احتمال لري چې دوام ورکړي، یا دا یو څه چې موږ په واقعیت کې وګورئ؟ Is the observed improvement likely to persist, or is it something we saw by chance? دا موږ ته د اټکل hypothesis ازموينه نړۍ ته راځي، په کوم ځای کې چې موږ د مشاهده پایلو د اټکل شوي پایلو د اټکل شوي پایلو د اټکل شوي پایلو د اټکل شوي پایلو په اړه پوښتنه کوو. "by chance" معنی لري: دا احتمال د د کوچني p-د ارزښتونه معنی لري چې "این به نادر وي که د واقعي اغیز نه وي." د لوی p-د ارزښتونه معنی لري چې "د هغه څه چې تاسو وګورئ، د صداونو لاندې شتون لري." Under a world where the change to the true mean outcome, how often would we see a difference at least as large as what we observed? نه کوي p-value نه کوي د ګمرک مثال: دوه ستراتیژۍ چې مختلف دي، مګر نه وګورئ وګورئ اجازه ورکړئ چې موږ د بدلون په وړاندې کړي او د بدلون مخکې او وروسته د ستراتیژۍ په اړه ځینې سوداګریزونه ترلاسه کړ (د backtest یا د ژوند د سوداګرۍ څخه). موږ اوس د هر سوداګریز PnL دوو سیټونه لري: Strategy A: د بدلون مخکې Strategy B: د بدلون وروسته لاندې زه د دوو مصنوعي per-trade PnL لړۍ جوړ کړ. د مجموعي PnL لړۍ - په حقیقت کې، د PnL د سوداګرۍ ستراتیژۍ پایلې نه ده؟ موږ به چمتو کوو چې آیا په حقیقت کې په هر سوداګرۍ کې د اوسط PnL په اړه څه فرق لري. diverge visibly د کوډ چې زه د حلقوي توليدولو لپاره کارول او د اټکل ټیسټ چلولو لپاره لاندې دی: import numpy as np import pandas as pd import matplotlib.pyplot as plt from scipy import stats import seaborn as sns sns.set(); rng = np.random.default_rng(49) # generate PnLs per trade n = 1200 pnl_A = rng.normal(loc=0.0, scale=1.0, size=n) pnl_B = rng.normal(loc=0.0, scale=1.0, size=n) # generate cumulative PnLs cum_A = pnl_A.cumsum() cum_B = pnl_B.cumsum() # run a statistical test t_stat, p_value = stats.ttest_ind(pnl_A, pnl_B, equal_var=False) print(f"mean_A={pnl_A.mean():.4f}, mean_B={pnl_B.mean():.4f}") print(f"Welch t-statistic={t_stat:.3f}, p-value={p_value:.3f}") plt.figure(figsize=(12,7)) plt.plot(np.arange(1, n+1), cum_A, label="Strategy A") plt.plot(np.arange(1, n+1), cum_B, label="Strategy B") plt.ylabel("Cumulative PnL", fontsize=15); plt.xlabel("Trade #", fontsize=15); plt.legend(["Cumulative PnL — Strategy A", "Cumulative PnL — Strategy B"], fontsize=15) plt.tight_layout(); plt.savefig("cumulative_pnl_A_vs_B.png", dpi=160); plt.show(); دلته د شمېرونه دي چې دا له لاسه ورکوي: mean_A=0.0611, mean_B=0.0037 Welch t-statistic=1.380, p-value=0.168 موږ د اټکل ازموینې دوه معياري پایلې وګورئ - د t-اټیټیک او د p-اټیټیک. زه به د دې په اړه نور په تاریخ کې خبرې وکړم. د دې لپاره، موږ د تفسیر بیان کوو: په هر سوداګرۍ کې د متوسط PnL توپیر لري. په هرصورت، د دوو مجموعي کرښو په پرتله ډیره توپیر لري. دا پټ دی. there is not enough evidence هغه څه چې اوس هم واقع شوی؟ (د hypothesis demystifying test) ډیری کورسونه تاسو ته د فورمول او جدول ته ورسیږي. په شخصي توګه، زه د دې لارښوونې څخه ډیری لټه نه لرم کله چې زه د اټکل hypothesis ازموینې په اړه زده کړې، ځکه چې ډیری لارښوونې د دې پیژندل نه کوي او یوازې اجازه ورکوي چې تاسو یو ټونې شیان یادونه ونیسئ. که څه هم زه د دې سره کار کولی شي او ځینې پايلې له لارې د څرنګه کولو algorithm په څیر ونیسئ او په لوی جدولونو کې شیان وګورئ، د هغه وخت چې زه د دې جوړولو میکانیزمونه ونیسئ او کوم چې څه هم په حقیقت کې زما لپاره یو لوی آسانه وه. دلته د اندیښنې زه غواړم چې کله چې زه پیل کړم. 1) د پوښتنې چې موږ پوهیږو د Null hypothesis (H0): د سوداګرۍ په پرتله حقیقي متوسط PnL د بدلون مخکې او وروسته ورته دی. اختیاري (H1): دوی مختلف دي (د دوامداره) یا یو لوی دی (د یوځای) د خپل پوښتنې له مخې. 2) د اټکل چې موږ calculate په خپل کور کې، د او د: t-statistic په نمونې کې فرق معنی لري چې د دې فرق د معياري غلطی له خوا تقسیم کیږي. د تقسیم . difference in sample means the standard error of that difference که د دوو نمونې معنی دي تر منځ ، د t-stat په حجم کې لوی وي. که دوی د صدا په اړه نزدیک وي، د t-stat کوچنی دی. په اړه چې څومره غږونه دي 3) کله چې د p-د ارزښت څخه راځي په H0 (نه واقعي فرق) کې، د t-ستاتیتیک د یو معلومې توزیع پیژندل کیږي (a د ځینې کچه آزادی سره). د په ساده توګه: t-distribution p-value د احتمال، د H0 لاندې، د t-stat په لږ تر لږه په توګه عالي (د t-stat لوی ارزښت) څومره چې تاسو ترلاسه کړ. the probability, under H₀, of observing a t-stat at least as extreme (large value of a t-stat) as the one you got. دا ټول هغه جدولونه دي چې تاسو کولی شئ په مختلفو hypothesis ازموینې لارښوونې کې روښانه ونیسئ- د کوچني p-د ارزښت معنی لري چې ستاسو د نږدې فرق به نږدې نږدې نږدې نږدې وي که دا واقعي اغیز نه وي. looking up a quantile 4) څنګه د پیتون کوډ له خوا تولید شوي واقعي شمیره وګورئ دلته هغه څه دي چې دا شمیره تاسو ته ورکوي: t ≈ 1.380 وايي: د A او B تر منځ د هر سوداګرۍ PnL په منځنۍ ډول کې د 1380 معياري غلطۍ څخه رنګ دی. که څه هم يو معياري سیگنال-د رنګ نسبت دی. p ≈ 0.168 (د دوه اړخ) وايي: که په حقیقت کې د اوسطو کې هیڅ فرق نه وي، تاسو به په واقعیت کې د 16-17٪ په اړه لږ تر لږه دا لوی توپیر وګورئ. دا د واقعي اغیزې ته اغیزمن نه ده. معمولا څیړونکو انتظار کوي چې د p-د ارزښت لږ تر لږه د 0.05 (5٪) په توګه لږ تر لږه ټیټ وي چې د اساتټیټي مهمیت ته اغیزمن شي. 5) د کارټونو له امله موږ ته اندیښنه وکړه د مجموعي PnL ده a د زیرمې متوسط په اړه. د هزاران سوداګریزونو سره، د تصادفي پیښو په منظم ډول د ناڅاپي مقدارونو لخوا رامینځته کیږي - حتی که د منځنۍ مقدارونه ورته وي. زموږ دماغونه د پړاو او تادیاتو د تشخیص لپاره تنظیم شوي دي مګر د تادیاتو په سمه توګه شاملولو لپاره ډیر نه دي. د ټ ټیسټ تاسو ته د اوسط فرق وزن ورکوي . random walk against the per-trade dispersion 6) هغه څه چې دلته "کامل" به وي؟ په عملی توګه، تاسو به په 0.05 کې د p-د ارزښت وګورئ که د t-احتمال 1.96 دی (د احتمالي t-احتمالاتو یوازې د 5٪ څخه ډیر دي). د variance او نمونې اندازه جوړښت په ورته توګه، تاسو به د 1.96 / 1.38 ≈ 1.42) په پرتله 42٪ لوی متوسط فرق ته اړتیا لرئ ترڅو د 5٪ دوه ځله بار ته ورسیږي. په ورته توګه، که د حقیقتي اغیزې ورته وي، تاسو به د 1.96 / 1.38)^2 ≈ 2.0 څخه د 1.96 په پرتله د t-احتمالاتو د فشار کولو لپاره په اړه 2x نور معلوماتو ته اړتیا لرئ. "نه PnL دا دی چې د حسابونو ورکوي." حق - او ... ... موږ د PnL نښلوي نه. موږ : separating roles PnL تاسو ته خبر ورکوي که آیا د شرکت په ټولیزه توګه کار کوي. hypothesis ازموینه تاسو ته پوه شي که آیا دا ځانګړي بدلون به د نمونې څخه بهر مرسته وکړي چې تاسو یوازې وګورئ. کله چې د دوو موافقې ندي، تاسو یو څه زده کړه: شاید د چاپیریال غیر معمولي ګټور دی، شاید د روټنگ ټویک لګښت زیاتیدل شوی، شاید تاسو څو بدلونونه ورکړئ. د اغیزې اضافي implementation pattern I recommend (د ځان د مخامخولو پرته د سرعت iteration) Per-trade PnL ښه دی، په لوړ فریکونسۍ / بازار جوړولو ستراتیژۍ کې دا عام دی چې د مجموعې لکه per-interval PnL (د مثال په توګه، 1 دقیقې، 5 دقیقې) کاروي ترڅو د ذخیره، فیس، او خطر د مجموعې ته وده ورکړي - او د سیریز اړیکو کم کړي. For a mean-effect question, Welch’s t-test is a good default. If tails are very heavy or serial correlation is strong, switch to: Choose the statistic. (cluster by day, by venue, by symbol group), or Cluster-robust tests (label-shuffling), or Randomization / permutation tests (resample blocks to respect autocorrelation). Bootstrap Pre-commit د stopper قانون. د اختیاري stopper ("په هر ساعت کې وګورئ او کله چې p < 0.05") د غلط مثبتو پرچون کوي. د تجربې پیل کولو مخکې د افق یا د سوداګریزونو شمیره حل کړئ. د ډیرو مقایسهونو په کارولو سره. که تاسو 20 بوتلونه هڅه وکړئ، یو به په لټه کې "کړتیا" وي. په لوړ شرطونو کې د غلط کشف نرخ (بینجیمین-اچچبرګ) یا بونفرونین کارول. د ټولو ازموینې چې تاسو ترسره کړئ په مرکز کې لیږد کړئ. د رخصتۍ او backtest overfitting څخه ساتنه وکړئ. د بازارونو یا وختونو په برخه کې، په ټرین / ټسټ کې د ځانګړتیاوو په دوامداره توګه نلري، او د رخصتۍ تاریخونو په اړه واضح وي. Sanity-check عملي معنی. د p-د ارزښت کولای شي د یو میلیونه سوداګریزو لپاره کوچنی وي، مګر د اغیزې په اقتصاد کې د فیسونو او خطرونو وروسته غیر معنوي. د اغیزې اندازه (د مثال په توګه، په هر سوداګریز کې د بیلګې پینټونو کې منځني فرق) او د خطر سره تنظیم شوي PnL (Sharpe، drawdown)، نه یوازې ستراتیژیکي معنی. د ثبات نظارت. د حقیقي لګښت باید د تقسیمونو په ژوند کې ولري: د نمونوي لګښت د بکس، د ورځ د وخت په توګه، د بیلابیلو حالت. که ستاسو "جین" یوازې په یو ټینګ ټوټې کې شتون لري، محتاط وي. واپس زموږ د مثال: هغه څه چې تاسو باید په پایله کې وي د لاندې شمیره شمیره (t ≈ 1.380, p ≈ 0.168): د استراتيجي B د هر سوداګرۍ متوسط PnL د استراتيجي A څخه توپیر نه لري. په مجموعي PnL کې د پرتله اختلاف د مساوي منځني پروسسونو لاندې تصادفي سره مطابقت لري. یا د ډیرو معلوماتو راټول کړئ (د لوی نمونې لپاره مخکښ کړئ)، د hypothesis (د ښه ځانګړتیاوو، د خطر کنترول) وده ورکړئ، یا د پاکیزه A / B (د انفرادي مخکښونه) چلول کړئ. د عمومي پټلونه (په دې توګه چې تاسو اړتیا نلري) په ازموینه کې تکرار کول او کله چې p-د ارزښت د 0.05 څخه نیولو څخه ډډه کوي. د fixed-horizon یا sequential روشونه کاروي چې د peeking لخوا حساب ورکوي، یا تاسو غلط مثبتونه راټول کړئ. د "per-fill" پايلې کارولو کله چې پوښونو ډېر تړلي دي. تاسو فکر وکړئ چې تاسو د 100k نمونې لري، مګر ممکن تاسو په حقیقت کې د 2k مستقل واقعاتو لري. د کلستر یا د وخت د مجموعې. د مختلفو vol/liquidity وختونو تر منځ د مجموعي curves مقایسه او دا د ګټلو په نامه. Normalizing یا condition on regime. د "اټیټیک معنی" سره "اقتصادي ارزښت" برابر کړي. یو کوچني لګښت کولی شي د فیسونو، لټینټ لګښت، یا ذخیره خطر لګښت شي. که تاسو د 20 ځانګړتیاوې تادیه کړئ او غوره راځي، ستاسو د p-د ارزښت باید د دې انتخاب لپاره اصلاح شي. د T-Test لپاره یو mnemonic چې په واقعیت کې پټوي کله چې تاسو د PnL جدول په لټه کې احساس کړئ، په یاد ولرئ: t = "چول چې د دوو نمونه مادي دي" ÷ "چول چې دا مادي مادي دي." t = “how far the two sample means are” ÷ “how uncertain those means are.” که تاسو ستاسو د نمونې اندازه دوه ځله کړئ، د نامتو (انبعاث) ضایع کیږي؛ بیلابیلو اختلافات د "د مهمه" نظر څخه مخه ونیسئ. که ستاسو د متغیر لوی دی (د عالي حجم حالت)، د نامتو زیات کیږي؛ دا د یو خوشحاله رنګ په اساس د توپیر ته اړتیا نلري. د نندارتونونو زه امیدوارم چې تاسو د څېړنې پروسس ډیر قوي کړي، او ممکن د معلوماتو په اړه ځینې واضحتیا لرئ چې دا ستاسو د سوداګرۍ ستراتیژۍ کې د بدلونونو په اړه څنګه چې یوازې د PnL فرق په اړه وګورئ، کوم ستراتیژیکي وسایلو کولی شي د څیړنې پروسس ډیر قوي وکارول شي، او ممکن د دې په اړه چې د ستراتیژیکي hypothesis ازمايښت کې کارول کیږي او څنګه په واقعیت کې د څیړنې لارښوونې پرته څنګه وکارول شي. ډیری څیړنې ټیمونه ځکه چې دوی د ښه کولو لپاره خوشحاله غلط کوي. دوی د ډیزاین بورډ ډیزاینونو له لارې چیرې چیرې چیرې چې د گراف ښه ښکاري، د هغه سپارلو، او بیا میاشتې د خسارتونو له لاسه ورکړئ. تاسو د بریښنا لپاره د سختو اټکلونو ته اړتیا نلري. تاسو یوازې اړتیا لرئ چې د hypothesis بیان کړئ، د تجزیه کولو یو منطقي واحد غوره کړئ، د ټسټ کاروي چې د غیرقانونیت په اړه سیگنال اندازه کوي، د څو ازموینې او د بند کولو قواعدونو په لټه کې وي او د دوو اټکلونو په اساس فیصلہ وکړئ Economics. ټیمونه ډیر پیچلي فریم ورکونه جوړ کړي چې د دوی هدف لپاره مناسب وي، مګر دا د پیل لپاره یو ښه ځای دی. fail to iterate او دا وکړئ، او ستاسو iteration چڼاسکه به د آرامۍ، چټک، او composing وي. دا مطبوعاتي یوازې د عمومي معلومات کاروي او د زده کړې لپاره دی، نه د سرمایه گذاری مشورې. ټول نظرونه او نظرونه زما خپل دي او د زما د سابقو / اوسني کارفرمایانو یا د نورو برخو څخه رامینځته نه کوي.