কোয়ান্টের যোগ্যতা আইন: যদি পরবর্তী পরিবর্তন PnL হয়, এটি পরিবর্তন ছিল; যদি পরবর্তী পরিবর্তন PnL হয়, এটি বাজার ছিল। Quant এর যোগ্যতা আইন: যদি পরবর্তী পরিবর্তন PnL আছে, এটি পরিবর্তন ছিল। যদি বদলির পরে PnL কমে যায়, তাহলে এটি বাজার ছিল। আমি পরিমাণ ট্রেডিং কাজ করি এবং সম্পূর্ণরূপে স্বয়ংক্রিয় গবেষণা পরিবেশ এবং ট্রেডিং সিস্টেমগুলি তৈরি করি যা আমাকে বাজার ডেটা থেকে উৎপাদন ট্রেডিং কৌশলগুলি থেকে কর্মক্ষমতা বিশ্লেষণ পর্যন্ত যাতে সাহায্য করে। এটি একটি খুব স্পষ্ট মেট্রিকাল যা বলতে পারে যে আমি আগের চেয়ে ভাল করছি কিনা বা না। PnL আপনি যদি কখনও একটি লাইভ ট্রেডিং কৌশল চালু করেন তবে আপনি এই দৈনন্দিন রিটার্নটি জানবেন: পূরণ, দেরি, স্টক এবং - অনিবার্যভাবে - পিএনএল-এ চেক করার জন্য ড্রাইভবোর্ড খুলুন। বাজারগুলি অস্থায়ী, পূরণ ক্লাস্টার, volatility নিয়মগুলি ফ্লিপ, মাইক্রোস্ট্রাক্টরি পরিবর্তন এবং ফলাফলগুলির বিতরণ ফলমূলক। fool yourself এই পোস্টটি একটি দেখুন কিভাবে PnL-চ্যাকিং প্রতিস্থাপন করবেন —তাহলে আপনার iteration loop প্রত্যেক সময় ইউনিটের প্রতি আরো সংকেত পাবেন। practical statistical hypothesis testing কেন PnL একটি নোংরা মেট্রিক পিএনএল একটি অসংখ্য অ্যালুমিনিয়াম উপাদান: সংখ্যালঘু আপনার দৈনন্দিন PnL dispersion একটি খবর-এ দিন দ্বিগুণ করতে পারে এমনকি যদি আপনার সিস্টেম অপরিবর্তিত হয়। মাইক্রো সেকেন্ডের টাইমিং, র ্যাং পজিশন, ফি স্তর, লুকানো vs আলো ইন্টারেকশন-সবই ট্রেডের ফলাফলগুলিতে র ্যাঙ্কিং ইনজেকশন করে। পথ নির্ভরশীলতা. কয়েকটি প্রাথমিক জয়গুলি পরে (বা বিপরীতভাবে) বৃহত্তর ধারণামূলক প্রভাবের মধ্যে সংমিশ্রিত হয়, যা প্রতিটি ট্রেডের জন্য মৌলিক গড় ফলাফল পরিবর্তন না করে কুরআনটি বিশ্বাসযোগ্য দেখায়। বহু বিভ্রান্তিকর. স্টক ক্যাপস, উদ্ধৃতি গভীরতা, অভ্যন্তরীণ ক্রসিং, বা রুটিং পরিবর্তন PnL বিপরীত দিকগুলিতে স্থানান্তর এবং বাতিল বা একে অপরকে শক্তিশালী করতে পারে। PnL ব্যবসা ট্র্যাক করার জন্য একটি চমৎকার লক্ষ্য, কিন্তু সংক্ষিপ্ত উইন্ডোতে গবেষণা পরিবর্তনগুলি গ্রহণ / প্রত্যাখ্যান করার জন্য একটি উপযুক্ত মাত্রা নয়। কী আমরা জানতে চান ডি ডি যখন আমরা একটি পরিবর্তন প্রেরণ করি (উদাহরণস্বরূপ, সংকেতের একটি নতুন বৈশিষ্ট্য, একটি ভিন্ন উদ্ধৃতি লজিক, একটি ভিন্ন বাস্তবায়ন নিয়ম), আমরা উত্তর দিতে চাই: পর্যবেক্ষিত উন্নতি অব্যাহত থাকার সম্ভাবনা আছে কি না, অথবা এটি কি আমরা দুর্ভাগ্যবশত দেখেছি? Is the observed improvement likely to persist, or is it something we saw by chance? এটি আমাদের পরিসংখ্যানগত অনুমান পরীক্ষার জগতে নিয়ে আসে, যেখানে আমরা পর্যবেক্ষিত ফলাফলের পরিসংখ্যানগত গুরুত্ব নিয়ে প্রশ্ন করি। এই সম্ভাবনাটি হচ্ছে ছোট p-values মানে “এটা যদি কোন বাস্তব প্রভাব না থাকে তাহলে বিরল হবে” বড় p-values মানে “আপনি যা দেখেছেন তা শব্দে সাধারণ। Under a world where the change to the true mean outcome, how often would we see a difference at least as large as what we observed? does nothing p-value কিছুই করেন না একটি উদাহরণ: দুটি কৌশল যা আলাদা কিন্তু নয় দেখুন দেখুন আসুন আমরা একটি পরিবর্তন পাঠিয়েছি এবং পরিবর্তনের আগে এবং পরে কয়েকটি ট্রেড পেয়েছি (বা ব্যাকটেস্ট বা লাইভ ট্রেডিং থেকে)। কৌশল A: পরিবর্তনের আগে কৌশল B: পরিবর্তনের পরে নিচে আমি দুটি সিন্থেটিক প্রতি ট্রেড PnL সিরিজ উত্পাদন করেছি। কিন্তু আমরা কি আসলে যা দেখছি তা বিশ্বাস করতে পারি এবং এর উপর ভিত্তি করে সিদ্ধান্ত নিতে পারি? অবশেষে, একটি ট্রেডিং কৌশলের চূড়ান্ত লক্ষ্য কি PnL নয়? আমরা নিচের একটি সাধারণ পরিসংখ্যানগত টেস্ট চালানোর মাধ্যমে পরীক্ষা করব যে প্রতি ট্রেডের গড় PnL সত্যিই আলাদা। diverge visibly কোড আমি জায়গা উত্পাদন এবং একটি পরিসংখ্যানগত পরীক্ষা পরিচালনা করার জন্য ব্যবহৃত হয় নিচের: import numpy as np import pandas as pd import matplotlib.pyplot as plt from scipy import stats import seaborn as sns sns.set(); rng = np.random.default_rng(49) # generate PnLs per trade n = 1200 pnl_A = rng.normal(loc=0.0, scale=1.0, size=n) pnl_B = rng.normal(loc=0.0, scale=1.0, size=n) # generate cumulative PnLs cum_A = pnl_A.cumsum() cum_B = pnl_B.cumsum() # run a statistical test t_stat, p_value = stats.ttest_ind(pnl_A, pnl_B, equal_var=False) print(f"mean_A={pnl_A.mean():.4f}, mean_B={pnl_B.mean():.4f}") print(f"Welch t-statistic={t_stat:.3f}, p-value={p_value:.3f}") plt.figure(figsize=(12,7)) plt.plot(np.arange(1, n+1), cum_A, label="Strategy A") plt.plot(np.arange(1, n+1), cum_B, label="Strategy B") plt.ylabel("Cumulative PnL", fontsize=15); plt.xlabel("Trade #", fontsize=15); plt.legend(["Cumulative PnL — Strategy A", "Cumulative PnL — Strategy B"], fontsize=15) plt.tight_layout(); plt.savefig("cumulative_pnl_A_vs_B.png", dpi=160); plt.show(); এখানে তার বেরিয়ে আসা সংখ্যাগুলি: mean_A=0.0611, mean_B=0.0037 Welch t-statistic=1.380, p-value=0.168 আমরা একটি পরিসংখ্যানগত টেস্টের দুটি স্ট্যান্ডার্ড আউটপুট দেখি—একটি t-পরিসংখ্যানগত এবং একটি p-মূল্য। বলা যায়, প্রতি ট্রেডের গড় PnL আলাদা। তবে দুটি সংকুচিত লাইনগুলি বেশ আলাদা দেখায়। there is not enough evidence কী ঘটেছে (অনুভূতি পরীক্ষা) অধিকাংশ টিউটোরিয়ালগুলি এর পেছনে ধারণাটি ব্যাখ্যা করে না এবং শুধু আপনাকে অনেক জিনিস মনে রাখতে দেয়. ব্যক্তিগতভাবে, আমি প্রথমবারের মত এই পদ্ধতিটি পছন্দ করি না, কারণ অধিকাংশ টিউটোরিয়ালগুলি এর পেছনে ধারণাটি ব্যাখ্যা করে না এবং শুধু আপনাকে অনেক জিনিস মনে রাখতে দেয়। ১) আমরা যে প্রশ্ন করি Null hypothesis (H0): প্রতি ট্রেডের সত্য গড় PnL পরিবর্তনের আগে এবং পরে একই। বিকল্প (H1): তারা আলাদা (দুই দিক), বা একটি বড় (এক দিক), আপনার প্রশ্নের উপর নির্ভর করে। 2) আমরা যে পরিসংখ্যান সংগ্রহ করি তার কেন্দ্রে, এ এটা : t-statistic নমুনা পার্থক্য মানে এই পার্থক্যের স্ট্যান্ডার্ড ত্রুটি দ্বারা বিভক্ত। বিভক্ত . difference in sample means the standard error of that difference যদি দুটি নমুনা অনেক দূরে থাকে যদি তারা শব্দের তুলনায় নিকটবর্তী হয়, তাহলে t-stat ছোট। তাদের কতটুকু আওয়াজ 3) যেখানে p-value আসে H0 (না বাস্তব পার্থক্য) অধীনে, t-পরিসংখ্যান একটি পরিচিত বিতরণ অনুসরণ করে (a) কিছু মাত্রার স্বাধীনতা থাকবে। এটা সহজে: t-distribution p-value H0 এর অধীনে, একটি t-stat অন্তত আপনি একটি পেয়েছেন হিসাবে একেবারে অত্যন্ত (একটি t-stat এর বড় মান) পর্যবেক্ষণ করার সম্ভাবনা। the probability, under H₀, of observing a t-stat at least as extreme (large value of a t-stat) as the one you got. যে সব টেবিলগুলি (যা আপনি বিভিন্ন অনুমান পরীক্ষার গাইডগুলিতে মুখোমুখি হতে পারেন) করছে- ছোট p-value মানে আপনার পর্যবেক্ষিত পার্থক্য সত্য প্রভাব না থাকলে বিরল হবে। looking up a quantile 4) উপরের পাইথন কোড দ্বারা উত্পাদিত বাস্তব সংখ্যাগুলি পড়তে কিভাবে এখানে এই সংখ্যাগুলি আপনাকে কি বলছে: t ≈ 1.380 বলছে: A এবং B এর মধ্যে প্রতি ট্রেডের গড় PnL মধ্যে পর্যবেক্ষিত পার্থক্য শূন্য থেকে 1.380 স্ট্যান্ডার্ড ত্রুটি। p ≈ 0.168 (দ্বিতীয় দিক) বলছে: যদি সত্যিই কোন পার্থক্য না থাকে, তাহলে আপনি অন্তত 16-17% সময় এত বড় একটি পার্থক্য দেখতে পাবেন. এটি একটি বাস্তব প্রভাব দাবি করার জন্য যথেষ্ট বিরল নয়. সাধারণত গবেষকরা পরিসংখ্যানগত গুরুত্ব দাবি করার জন্য 0.05 (5%) হিসাবে কমপক্ষে একটি p-value আশা করে। ৫. কেন চার্ট আমাদের প্রতারণা করেছে কোয়ালিটিভ PnL একটি হাজার হাজার ট্রেডের সাথে, র্যান্ডম পথগুলি নিয়মিত চোখ-পপপিং পরিমাণ দ্বারা আলাদা হয় - এমনকি যদি মাধ্যমগুলি একই হয়। আমাদের মস্তিষ্কগুলি পর্দা এবং আলাদাতা সনাক্ত করার জন্য সংযুক্ত করা হয় কিন্তু সঠিকভাবে বৈচিত্র্যকে অন্তর্ভুক্ত করার জন্য খুব বেশি নয়। . random walk against the per-trade dispersion ৬) এখানে ‘সবচেয়ে গুরুত্বপূর্ণ’ কি ছিল? বাস্তবসম্মতভাবে, আপনি 0.05 এ p-value দেখতে পাবেন যদি t-statistics এর অবিচ্ছেদ্য 1.96 হয় (মাত্র সম্ভাব্য t-statistical মানের 5% এর বাইরে থাকে)। variance এবং নমুনা আকার কাঠামো একই রাখা, আপনি প্রায় 42% বড় গড় পার্থক্য প্রয়োজন হবে (কারণ 1.96 / 1.38 ≈ 1.42) 5% দ্বৈত বার পৌঁছান। “কিন্তু পিএনএল হল যে বিলগুলি পরিশোধ করে” সত্য—এবং... ...আমরা পিএনএল ছাড়বো না, আমরা : separating roles PnL আপনাকে জানায় যে ব্যবসা পুরোপুরি কাজ করছে কিনা। হাইপোথেসি পরীক্ষাগুলি আপনাকে বলবে যে এই নির্দিষ্ট পরিবর্তনটি আপনি কেবলমাত্র দেখেছেন এমন নমুনার বাইরে সাহায্য করার সম্ভাবনা রয়েছে কিনা। যখন দুটি একমত না হয়, আপনি কিছু শিখেছেন: সম্ভবত পরিবেশ অস্বাভাবিকভাবে সুবিধাজনক ছিল, সম্ভবত একটি রুটিং টিউক জোরদার এক্সপোজার, সম্ভবত আপনি একাধিক পরিবর্তন পাঠিয়েছেন। প্রভাব বাড়তি বাস্তবায়ন প্যাটার্ন আমি সুপারিশ (স্বাভাবিক প্রতারণা ছাড়া দ্রুত iteration) প্রতি ট্রেড PnL ভাল, উচ্চ ফ্রিকোয়েন্সি / বাজার তৈরির কৌশলগুলিতে এটি সাধারণত সংমিশ্রণগুলি ব্যবহার করা হয় যেমন প্রতি ইন্টারভিউ PnL (উদাহরণস্বরূপ, 1 মিনিট, 5 মিনিট) স্টক, ফি এবং ঝুঁকি সংমিশ্রণ প্রতিফলন করতে - এবং সিরিয়াল সংমিশ্রণ হ্রাস করতে। For a mean-effect question, Welch’s t-test is a good default. If tails are very heavy or serial correlation is strong, switch to: Choose the statistic. (cluster by day, by venue, by symbol group), or Cluster-robust tests (label-shuffling), or Randomization / permutation tests (resample blocks to respect autocorrelation). Bootstrap অ্যাপ্লিকেশন স্টপিং (“আমরা প্রতি ঘন্টা এবং p < 0.05 যখন জাহাজ তাকাবো”) মিথ্যা ইতিবাচকগুলি উত্পাদন করে। একাধিক তুলনা পরিচালনা করুন. যদি আপনি 20 বোতাম চেষ্টা করেন, তাহলে একজন ভাগ্যবানভাবে "জয়" পাবেন. উচ্চ স্ট্যাকের ক্ষেত্রে ভুয়া আবিষ্কার হার (বেনজামিনি-হোচবার্গ) বা বোনফেরোনি ব্যবহার করুন. আপনি যে সমস্ত পরীক্ষাগুলি চালাচ্ছেন তার একটি কেন্দ্রীয় রেকর্ড রাখুন। ভাগ বাজার বা সময়, ট্রেন / টেস্ট জুড়ে ডাবল ডিপ বৈশিষ্ট্যগুলি করবেন না, এবং ফ্রিজের তারিখ সম্পর্কে স্পষ্ট থাকুন। একটি p-মূল্য একটি মিলিয়ন ট্রেডের জন্য ছোট হতে পারে কিন্তু ফি এবং ঝুঁকি পরে অর্থনৈতিকভাবে অর্থনৈতিকভাবে অর্থনৈতিকভাবে অর্থনৈতিকভাবে অর্থনৈতিকভাবে অর্থনৈতিকভাবে অর্থনৈতিকভাবে অর্থনৈতিকভাবে অর্থনৈতিকভাবে অর্থনৈতিকভাবে অর্থনৈতিকভাবে অর্থনৈতিকভাবে অর্থনৈতিকভাবে অর্থহীন। নজরদারি স্থিতিশীলতা. একটি বাস্তব সীমানা বিভাজন বেঁচে থাকতে হবে: প্রতীক বৈদ্যুত্থানের বাক্স দ্বারা, দিনের সময় দ্বারা, বৈদ্যুত্থানের ব্যবস্থা দ্বারা. যদি আপনার "জয়" শুধুমাত্র একটি ছোট টুকরা মধ্যে থাকে, সাবধান থাকুন। আমাদের উদাহরণে ফিরে আসুন: আপনি কী সিদ্ধান্ত নিতে হবে উপরের সংখ্যাগুলি অনুসারে (t ≈ 1.380, p ≈ 0.168): যথেষ্ট প্রমাণ নেই যে কৌশল বি এর প্রতি ট্রেডের গড় PnL কৌশল এ থেকে আলাদা। কুমুল্যাটিক PnL এর বেশী বিচ্ছিন্নতা সমান গড় প্রক্রিয়াগুলির অধীনে কাস্টমাইজেশনের সাথে সামঞ্জস্যপূর্ণ। সিদ্ধান্ত: সেই চার্টের কারণে এই পরিবর্তনটি প্রেরণ করবেন না. অথবা আরও ডেটা সংগ্রহ করুন (একটি বৃহত্তর নমুনা পূর্বে সেট করুন), হাইপোথেশনটি শক্তিশালী করুন (সবচেয়ে ভাল বৈশিষ্ট্য, ঝুঁকি নিয়ন্ত্রণ), অথবা একটি পরিষ্কার A / B (নিঃসন্দেহে বিভ্রান্তিকর) চালান। কারণ সাধারণ ফাঁদ (আমি তাদের সব তৈরি করেছি যাতে আপনাকে এটি করতে হবে না) পরীক্ষায় পুনরাবৃত্তিতে পাইকিং এবং p-value 0.05 এর নিচে নেমে গেলে থামানোর সময় পাইকিং ব্যবহার করুন, অন্যথায় আপনি ভুয়া ইতিবাচকগুলি উন্নীত করবেন। আপনি মনে করেন আপনি 100k নমুনা আছে, কিন্তু আপনি সত্যিই 2k স্বাধীন ঘটনা আছে হতে পারে। ভিন্ন ভলিউম / তরলতা সঙ্গে সময়ের মধ্যে সংখ্যালঘু সংকোচন সংকোচন তুলনা এবং এটি একটি জয় বলে। "অর্থনৈতিক মূল্য" এর সাথে "পরিসংখ্যানগত গুরুত্ব" সমান করা. একটি ছোট সীমানা ফি, ল্যাটিনেশন slappage, বা স্টক ঝুঁকি দ্বারা মুছে ফেলা যেতে পারে. যদি আপনি 20 বৈশিষ্ট্য সংযোজন করেন এবং সেরাটি রাখেন, তাহলে আপনার p-value সেই নির্বাচন জন্য সংশোধন করা উচিত। T-টেস্টের জন্য একটি mnemonic যা সত্যিই স্টিক যখন আপনি একটি PnL চার্টটি চোখে পড়ার জন্য অনুপ্রাণিত হন, মনে রাখবেন: t = "দুই নমুনা মাধ্যমগুলি কত দূর" ÷ "এই মাধ্যমগুলি কত অবিশ্বাস্য" t = “how far the two sample means are” ÷ “how uncertain those means are.” আপনি যদি আপনার নমুনা আকার দ্বিগুণ করেন, তাহলে নামকরণকারী (অবিশ্বাস্যতা) সংকুচিত হবে; সামান্য পার্থক্যগুলি "সম্মত" দেখতে থাকে না। নোট শেষ আমি আশা করি আপনি আপনার ট্রেডিং কৌশলের পরিবর্তনগুলি কেবলমাত্র PnL পার্থক্যটি দেখে বিচার করার জন্য স্পষ্ট নয় কেন, গবেষণা প্রক্রিয়াটি আরও শক্তিশালী করার জন্য কোন পরিসংখ্যানগত সরঞ্জামগুলি ব্যবহার করা যেতে পারে, এবং সম্ভবত এই সমস্ত শর্তগুলির পিছনে কিছু স্পষ্টতা রয়েছে যা পরিসংখ্যানগত অনুমান পরীক্ষায় ব্যবহৃত হয় এবং কীভাবে তারা অন্ধভাবে পাঠ্যবই নির্দেশাবলী অনুসরণ করে না। অনেক গবেষণা দল কারণ তারা উন্নতির জন্য সৌভাগ্য ভুল করে। তারা ড্রাইভারবোর্ড ড্রাইভিং টিউটোরিয়ামগুলির মাধ্যমে সাইক্লিং করে যতক্ষণ না গ্রাফটি ভাল দেখায়, এটি পাঠান, এবং তারপরে ক্ষতি হ্রাস করে মাসগুলি ব্যয় করে। আপনাকে ভাল করার জন্য ভারী পরিসংখ্যানের দরকার নেই। আপনি শুধু অনুমান করতে হবে, বিশ্লেষণের একটি যৌক্তিক ইউনিট নির্বাচন করুন, একটি পরীক্ষা ব্যবহার করুন যা অনিশ্চয়তা সম্পর্কিত সংকেত পরিমাপ করে, একাধিক পরীক্ষা এবং স্টপিং নিয়ম মেনে চলুন এবং উভয় পরিসংখ্যানের ভিত্তিতে সিদ্ধান্ত নিন টিমগুলি তাদের উদ্দেশ্যে উপযুক্ত আরও জটিল ফ্রেমওয়ার্ক তৈরি করে, তবে এটি শুরু করার জন্য একটি ভাল জায়গা। fail to iterate এবং এই কাজটি করুন, এবং আপনার iteration loop শান্ত, দ্রুত এবং কম্পোডিং হবে। এই প্রকাশনা শুধুমাত্র পাবলিকভাবে উপলব্ধ তথ্য ব্যবহার করে এবং শিক্ষামূলক উদ্দেশ্যে নয়, বিনিয়োগ পরামর্শ. প্রদত্ত সমস্ত মতামত এবং মতামত আমার নিজস্ব এবং আমার সাবেক / বর্তমান নিয়োগকারীদের বা অন্য কোন পক্ষের মতামত প্রতিনিধিত্ব করে না।