इस गर्मी में, मैं एक ऐसी समस्या पर अपने संचालन अनुसंधान कौशल का परीक्षण करना चाहता था जो मुझे परेशान कर रही है। मैं ऑनलाइन दैनिक फंतासी बेसबॉल में इतना बुरा क्यों हूँ?
यदि आप इसे पढ़ रहे हैं, तो आप शायद जानते हैं कि मैं किस बारे में बात कर रहा हूं। मुझे लगता है कि आप वह प्रकार हैं जो थोड़ा शोध करना चाहते थे और हो सकता है कि इस डेटा विज्ञान ब्लॉग पोस्ट पर ठोकर खाई हो, अपनी टीम बनाने के तरीके के बारे में सुझावों की तलाश में।
स्पॉयलर अलर्ट: मेरे पास आपके लिए बुरी खबर है।
इस ब्लॉग में, आप सीखेंगे कि ऑनलाइन फंतासी खेल कठिन क्यों हैं। आप देखेंगे कि इन ऑनलाइन गेम प्रदाताओं द्वारा बनाई गई अर्थव्यवस्था कुशल है, और यदि आप सिस्टम को गेम करना चाहते हैं तो आपको बहुत समय लगाना होगा।
अगर आप किसी ऐसी चीज से परिचित नहीं हैं जिसके बारे में मैं बात कर रहा हूं तो यह पैराग्राफ आपके लिए है। एक ऑनलाइन जुआ वेबसाइट के अनुसार, जो बिना नाम के चली जाएगी, ऑनलाइन फंतासी स्पोर्ट्स बेटिंग $48 बिलियन डॉलर का उद्योग है। फंतासी खेलों में, आप उन खिलाड़ियों को चुनते हैं जो उस दिन खेल रहे हैं और देखते हैं कि क्या वे अच्छा प्रदर्शन करके आपको पैसा कमा सकते हैं। बेसबॉल संस्करण में, आप 8 स्थिति वाले खिलाड़ियों और 2 पिचरों का रोस्टर चुनते हैं; और उनका वेतन लीग की वेतन सीमा से ऊपर नहीं जा सकता। उस दिन उनका प्रदर्शन आपके द्वारा अर्जित अंक निर्धारित करता है। आपको उस दिन सर्वश्रेष्ठ खिलाड़ियों को चुनने के अलावा कुछ नहीं करना है।
सरल, है ना?
मेरी फंतासी टीम, शिकागो रेड लाइन हसलर दर्ज करें। हां, मैंने अपनी मेक विश्वास टीम के लिए एक लोगो बनाया है। आपके लिए यह क्या है?
हम इतने अच्छे नहीं हैं। मैं एक या दो महीने से खेल रहा हूं और मेरी टीम ने पैसे गंवाए हैं। बहुत कुछ नहीं, मैं लाइन पर एक गुच्छा नहीं डाल रहा हूँ। हालाँकि, मैं अपनी दिन की नौकरी नहीं छोड़ सकता; और मैं जानना चाहता हूं कि क्यों।
यह समझने के लिए कि मैं इस खेल में इतना बुरा क्यों हूं, मैं अपने निर्णय विश्लेषण टूलकिट में पहुंचा और पुराने आजमाए हुए और सच्चे पोर्टफोलियो एनालिटिक्स टूल - मोंटे कार्लो सिमुलेशन को धूल चटा दिया। अनुकरण मुझे कार्मिक निर्णयों में जोखिम को समझने में मदद करेगा - विशेष रूप से लीग वेतन कैप से नीचे होने की हमारी बाधा को देखते हुए किन दस खिलाड़ियों को चुना जाना चाहिए।
सिम्युलेशन 2018 से उस दिन पहले तक के प्रमुख लीग बेसबॉल खिलाड़ियों के लिए वास्तविक जीवन के परिणामों का उपयोग करेगा जिसका हम अनुकरण कर रहे हैं। मैं सभी सक्रिय प्रमुख लीगर्स के लिए एमएलबी.कॉम के सार्वजनिक एपीआई से दैनिक आंकड़े प्राप्त करके इसे प्राप्त करता हूं। (नोट: डेटा इंजीनियरिंग इस ब्लॉग के दायरे से बाहर है।)
एक बार आंकड़े एकत्र हो जाने के बाद, हमें उस काल्पनिक खेल में शामिल योग्य खिलाड़ियों को एकत्र करना होगा, जिसकी हम अनुकरण करने में रुचि रखते हैं। मैं दैनिक फंतासी खेलों में विशेषज्ञता वाले ऑनलाइन खेल जुआ के एक ऑपरेटर के सार्वजनिक एपीआई के साथ बातचीत करके इसे प्राप्त करता हूं। (नोट: डेटा इंजीनियरिंग इस ब्लॉग के दायरे से बाहर है।)
एक बार जब डेटा एकत्र कर लिया जाता है और योग्य खिलाड़ियों की पहचान कर ली जाती है, तो सिमुलेशन सर्वश्रेष्ठ प्रदर्शन करने वाले लाइनअप को खोजने के लिए, उपन्यास बाधा प्रसार द्वारा संशोधित एक थकाऊ खोज कर सकता है; या कोई उपयोगकर्ता लाइनअप को परिभाषित कर सकता है और उसके प्रदर्शन का आकलन कर सकता है।
सिमुलेशन का उद्देश्य 2 पिचर्स और 8 पोजीशन खिलाड़ियों के एक लाइनअप द्वारा खेले जाने वाले बेसबॉल गेम के संभावित परिणामों का अनुकरण करना है। उन परिणामों को ऑनलाइन प्रदाता की दैनिक फंतासी बेसबॉल प्रतियोगिता के क्लासिक नियमों का उपयोग करके स्कोर किया जाता है।
उपलब्ध डेटा के साथ, हम अपने वास्तविक दुनिया के डेटा से अपेक्षित परिणामों का प्रयोग और मॉडलिंग कर सकते हैं। हमारा लक्ष्य 8 स्थिति खिलाड़ियों (बेसबॉल में सभी 8 क्षेत्ररक्षण पदों का प्रतिनिधित्व) और 2 पिचर के लिए काल्पनिक स्कोरिंग की पहचान करना है। हमारे मॉडल को खिलाड़ियों और पिचरों की स्थिति को अलग-अलग संबोधित करने की आवश्यकता होगी।
स्थिति खिलाड़ियों के लिए, बल्लेबाजी परिणामों की ओर स्कोरिंग अत्यधिक विषम है। स्थिति खिलाड़ियों के लिए, हमारा ध्यान प्लेट दिखावे के अनुकरण और उस प्लेट उपस्थिति के संबंधित संभावित परिणामों पर होगा।
हम इसे अपराध के परिणामों का अनुकरण करके प्राप्त करते हैं और हम केवल प्लेट दिखावे की परवाह करते हैं क्योंकि यह एकमात्र मौका है जब कोई खिलाड़ी फंतासी खेल को प्रभावित कर सकता है। हमारे सिमुलेशन का फ़्लोचार्ट दिखाता है कि हमारा मॉडल प्लेट दिखावे और उनके संभावित परिणामों की पहचान करने के लिए कैसे आगे बढ़ेगा।
खिलाड़ियों के पास प्रत्येक गेम में विभिन्न प्रकार के प्लेट दिखावे हो सकते हैं, और यह ज्यादातर उस क्रम से जुड़ा होता है जो वे लाइनअप में दिखाई देते हैं। लाइनअप के पीछे एक स्थिति खिलाड़ी लाइनअप के शीर्ष (शुरुआत) में एक खिलाड़ी की तुलना में कम प्लेट दिखावे की प्रवृत्ति रखता है। हमारे मॉडल के पास उस प्लेट प्रदर्शन की संख्या तक पहुंच है जो एक खिलाड़ी ने ऐतिहासिक रूप से किया है, लेकिन उस गेम के लिए दिखाई देने वाले लाइनअप में ऑर्डर तक पहुंच नहीं है। यह हमारे अनुकरण की सटीकता के लिए पहली सीमा है। मैं आगामी खेल के लिए बल्लेबाजी क्रम के आधार पर वास्तविक उम्मीदों पर नहीं ऐतिहासिक परिणामों के आधार पर प्लेट दिखावे का मॉडल करता हूं।
हमारे अनुकरण को पूरा करने के लिए, हम प्रत्येक स्थिति खिलाड़ी के लिए ऐतिहासिक प्लेट दिखावे की एक आदेशित सूची से प्लेट दिखावे का चयन करने के लिए एक यादृच्छिक संख्या जनरेटर का उपयोग करके पिछले खेलों से अनुभवजन्य रूप से नमूना प्लेट दिखावे।
नकली प्रत्येक खेल के लिए, प्लेट दिखावे का यह यादृच्छिक चयन किया जाता है। प्रत्येक खिलाड़ी के लिए अपेक्षित परिणामों के मिलान के लिए यह पद्धति बहुत सटीक है।
एक बार प्लेट दिखावे का अनुकरण करने के बाद, हमें अब यह निर्धारित करने के लिए मॉडल की पहचान करने की आवश्यकता है कि कौन से परिणाम संभव हैं और एक परिणाम का चयन करने के लिए एक नेस्टेड संभावना का लाभ उठाएं जो यह दर्शाता है कि खिलाड़ी को क्या हासिल करने की उम्मीद है। हमारे नेस्टेड या जंजीर प्रायिकता में पहला पड़ाव एक प्लेट उपस्थिति को आक्रामक परिणाम में बदलने की खिलाड़ी की क्षमता से नमूना लेना है। यह अनुपात अनुकार के प्लेट दिखावे पर लागू किया जा सकता है ताकि यह पता लगाया जा सके कि खिलाड़ी ने उस खेल में कितने परिणाम हासिल किए हैं।
निर्धारित परिणामों की संख्या के साथ, हम खिलाड़ी के ऐतिहासिक परिणामों का उपयोग यह अनुकरण करने के लिए कर सकते हैं कि वह खिलाड़ी क्या करने में सक्षम है। उदाहरण के लिए, यदि हम बहुत सारे घरेलू रन बनाने के लिए जाने जाने वाले खिलाड़ी का अनुकरण कर रहे हैं - तो हम उसके ऐतिहासिक प्रदर्शनों में कई घरेलू रन देखेंगे।
सिमुलेशन अनुभवजन्य रूप से उन परिणामों के वितरण से नमूना लेगा जो खिलाड़ी ने अतीत में हासिल किया है। फिर परिणाम को ऑनलाइन फंतासी प्रदाता के स्कोर कार्ड के अनुसार स्कोर किया जा सकता है और उस परिणाम के होने पर खेल की स्थिति के आधार पर अतिरिक्त परिणामों को अनुकरण करने के लिए संसाधित किया जा सकता है।
जब कोई परिणाम होता है तो खेल की स्थिति तीन अंतिम परिणामों को भी प्रभावित करेगी जो हमारे सिमुलेशन को मॉडल करना चाहिए। वे तीन परिणाम खिलाड़ी द्वारा परिणाम प्राप्त करने से पहले, उसके दौरान और बाद में हुई घटनाओं पर निर्भर करते हैं। हमारे फ़्लोचार्ट की अंतिम परत रन, चोरी के ठिकानों और आरबीआई को तभी संभव बनाती है जब कुछ निश्चित परिणाम होते हैं।
इसके अलावा, उन तीन घटनाओं की मात्रा भी परिणाम से प्रभावित होती है। उदाहरण के लिए, यदि कोई खिलाड़ी होम रन हिट करता है, तो उसे कम से कम एक आरबीआई और एक रन दिया जाता है। उस परिणाम के कारण उनके पास चुराए गए आधार को प्राप्त करने का कोई मौका नहीं है। हम इन सभी नियमों को नेस्टेड संभाव्यता की एक अतिरिक्त परत में मॉडल करते हैं और पिछले खिलाड़ी के प्रदर्शन के आधार पर अनुभवजन्य रूप से नमूना लेते हैं ताकि खिलाड़ी प्रदर्शन कर रहा था। इन परिणामों में से एक का एक उदाहरण नीचे है, मॉडलिंग चलता है।
हमारे सभी कार्यों को परिभाषित करने के साथ, अब मैं किसी भी खिलाड़ी के लिए असीमित गेम का अनुकरण कर सकता हूं जिसमें से आकर्षित करने के लिए पर्याप्त नमूना प्रदर्शन हो। परिणाम बहुत अच्छा प्रदर्शन करता है। यहां ला डोजर्स से नकली ट्री टर्नर का एक उदाहरण दिया गया है।
सिमुलेशन में बल्लेबाजों के लिए जिम्मेदार होने के साथ, मॉडल को पिचर परिणामों को अनुकरण करने में भी सक्षम होना चाहिए। घड़े के लिए फंतासी स्कोरिंग केवल प्लेट की उपस्थिति और उनके द्वारा सामना किए जाने वाले बल्लेबाजों के परिणामों पर विचार करता है।
घड़े के लिए, मॉडल पिच की हुई पारी का अनुकरण करके शुरू होता है। यह महत्वपूर्ण है क्योंकि मेरे अपने उपन्यास शोध से पता चलता है कि अधिक पारी पिच करने वाले पिचर बेहतर प्रदर्शन करते हैं (रन, हिट को कम करके और खेल की प्रगति के रूप में अपनी जीत प्रतिशत में सुधार करके)
यह अवलोकन सहज है क्योंकि एक प्रबंधक को एक मजबूत पिचर खींचने की संभावना कम होती है जो खेल से दूसरे पिचर के लिए वरीयता में अच्छा होता है।
अपने अनुकरण को पूरा करने के लिए, हम प्रत्येक पिचर के लिए पिच की गई ऐतिहासिक पारियों की एक क्रमबद्ध सूची से पिच की गई पारी का चयन करने के लिए एक यादृच्छिक संख्या जनरेटर का उपयोग करके पिछले खेलों से आनुभविक रूप से नमूना पारी का नमूना लेते हैं। इसे हासिल करने के लिए कोड बल्लेबाजों के लिए प्लेट अपीयरेंस फंक्शन की तरह है। नकली प्रत्येक गेम के लिए, यह यादृच्छिक चयन किया जाता है। प्रत्येक पिचर के लिए अपेक्षित पारियों के मिलान के लिए यह पद्धति बहुत सटीक है।
पिचर के परिणामों का मूल्यांकन पिच की गई पारियों की संख्या के आधार पर किया जाता है। जैसा कि मैंने पहले संकेत दिया था, मैं ऐसा इसलिए करता हूं क्योंकि खिलाड़ी का प्रदर्शन इस बात पर निर्भर करता है कि पिचर कितने गहरे खेल में खेलता है।
ऐसे तीन परिणाम हैं जिनकी हम परवाह करते हैं- वे जीत, रन, हिट, वॉक और स्ट्राइक आउट की संख्या हैं। मैं पिच की गई पारी के अनुरूप पिचर डेटा के सबसेट के लिए अनुभवजन्य रूप से नमूना करके इन परिणामों का अनुकरण करता हूं। यह प्रक्रिया सुनिश्चित करती है कि हम पिच की गई पारी के एक समारोह के रूप में पिचर के प्रदर्शन का सम्मान करते हैं।
अंतिम परिणाम प्रत्येक रन के बाद सिमुलेशन स्थिति के लिए एक जांच है। जब भी नकली पिचर 9 पूर्ण पारियों को पिच करता है तो मॉडल पूर्ण गेम स्कोर करता है। जब भी नकली पिचर 9 पूरी पारियां फेंकता है और कोई अर्जित रन नहीं होता है तो यह पिचर को एक पूर्ण गेम शटआउट के साथ श्रेय देता है। अंत में, मॉडल नकली पिचर को नो-हिटर के साथ श्रेय देता है यदि सिमुलेशन एक पिचर उत्पन्न करता है जो सभी 9 पारियों को पूरा करता है और कोई हिट हासिल नहीं करता है।
हमारे सभी पिचिंग कार्यों को परिभाषित करने के साथ, अब मैं पर्याप्त नमूना डेटा वाले किसी भी पिचर के लिए असीमित गेम अनुकरण कर सकता हूं। नकली डेटा हमारे द्वारा बनाए गए घड़े के वास्तविक एमएलबी प्रदर्शन के समान है।
इस परियोजना का लक्ष्य दैनिक फंतासी स्पोर्ट्स गेम के लिए लाइनअप चुनने में जोखिम का आकलन करना था। इसे प्राप्त करने के लिए, मैंने एक फ़ंक्शन बनाया है जो एक काल्पनिक बेसबॉल प्रदाता के क्लासिक नियमों में इंगित $ 50,000 वेतन कैप तक खर्च करके एक वैध लाइनअप को बेतरतीब ढंग से भरता है। मैंने अनुकरण करने के लिए 500 यादृच्छिक, वैध लाइनअप बनाने के लिए 500 बार ऐसा किया। वैध लाइनअप में प्रत्येक खिलाड़ी को अपने स्वयं के सिमुलेशन के माध्यम से रखा गया था - प्रत्येक प्रदर्शन के 50 गेम का अनुकरण। परिणाम आश्चर्यजनक नहीं थे।
ऐसा प्रतीत होता है कि बेसबॉल के परिणामों में उनमें बहुत अधिक यादृच्छिकता है।
यहां बिंदुओं के अनुपात से परिवर्तनशीलता के आधार पर चुने गए शीर्ष 10 यादृच्छिक लाइनअप के सिम्युलेटेड प्रदर्शन का सारांश दिया गया है - जैसे वित्त में शार्प अनुपात। ये लाइनअप कम से कम जोखिम भरे, लेकिन सबसे प्रभावी विकल्पों का प्रतिनिधित्व करते हैं।
यहाँ वही दृश्य है लेकिन शीर्ष स्कोरिंग मान्य लाइनअप का चयन करना है।
ये छवियां मजबूत प्रदर्शन के साथ मान्य लाइनअप दिखाती हैं, लेकिन इन सभी लाइनअप में अपेक्षित मान हैं जो एक दूसरे के बहुत करीब हैं। इस व्यापक खोज के माध्यम से, हमें ऐसा कोई लाइनअप नहीं मिला जो अन्य सभी लाइनअप से बेहतर प्रदर्शन करता हो। हमारा अनुकरण यह दिखाने में सफल रहा कि फ़ंतासी बेसबॉल खेल, महत्वपूर्ण विस्तृत खिलाड़ी विश्लेषण और मूल्यांकन के बिना, केवल मौके के खेल हैं।
अंत में, निर्णय लेने से जुड़े जोखिमों को समझने के लिए अनुकरण एक बहुत ही उपयोगी उपकरण है। यह उत्पाद डिजाइन, पायलट प्रशिक्षण, कतार अनुसंधान, और अब फंतासी खेलों सहित अनुप्रयोगों की एक विस्तृत श्रृंखला में सफलतापूर्वक लागू किया गया है।
इस विशिष्ट सिमुलेशन के परिणाम बताते हैं कि अल्पावधि में बेसबॉल बहुत अधिक यादृच्छिक है। कोई भी खिलाड़ी किसी भी दिन अच्छा या बुरा खेल सकता है। मैचअप खेल में आ सकते हैं, और खेल की स्थिति खिलाड़ी के निर्णय को प्रभावित कर सकती है।
हमने एक बहुत ही जटिल प्रणाली को मॉडल करने और बहुत वास्तविक दुनिया के परिणाम प्राप्त करने की क्षमता हासिल की। लंबी अवधि में, मुझे उम्मीद है कि मेरा अनुकरण ऐसे खिलाड़ी उत्पन्न करेगा जो अपने वास्तविक जीवन के समकक्षों के समान प्रदर्शन करेंगे।
सिमुलेशन में सुधार किया जा सकता है। उदाहरण के लिए, हमारे पास किसी भी प्रदर्शन परिणाम के लिए खेल स्थिति पर डेटा नहीं है। हम पिछली उपलब्धियों के आधार पर अनुकरण करते हैं, लेकिन एक बेहतर मॉडल खेल की स्थिति का भी अनुकरण करेगा। यह एक महत्वपूर्ण अगला कदम होगा क्योंकि अन्य खिलाड़ी निर्णय और खेल की स्थिति खिलाड़ी की परिणाम उत्पन्न करने की क्षमता को प्रभावित करेगी। इसके अलावा, मॉडल मैचअप का अनुकरण नहीं कर सकता - फंतासी खेलों में एक महत्वपूर्ण विषय। बल्लेबाज जिस पिच का सामना करते हैं या जिस टीम से वे खेल रहे हैं, उसके आधार पर बल्लेबाज अलग-अलग प्रदर्शन करते हैं।
अंत में, मैं नए सुधारों को स्थापित करने की आशा करता हूं जो मैचअप पर विचार करते हैं और अल्पकालिक खिलाड़ी के प्रदर्शन का आकलन करने की मेरी क्षमता में वृद्धिशील सुधार करते हैं।
यहाँ भी प्रकाशित हो चुकी है।.