संभाव्यता ने मुझे सदैव आकर्षित किया है। यह मशीन लर्निंग और आर्टिफिशियल इंटेलिजेंस की छिपी हुई रीढ़ बनाता है। मुझे स्कूल और कॉलेज में इसका अध्ययन करने का अवसर मिला। लेकिन जब तक मैंने बायेसियन सांख्यिकी पर पाठ्यक्रम नहीं लिया तब तक मुझे एहसास नहीं हुआ कि इसके बारे में मेरी समझ कितनी गलत थी।
आपके सामने यह प्रश्न अवश्य आया होगा, "सिक्का उछालने पर चित आने की प्रायिकता क्या है"? यदि आपका उत्तर 1/2
है, तो फिर से सोचें। यहीं यह दिलचस्प हो जाता है।
गणित को आम तौर पर "सुसंगत" होने के आलोक में देखा जाता है। हम मानते हैं कि किसी समस्या का समाधान हमेशा एक ही होगा चाहे हम उसे कैसे भी हल करें। यह सच है सिवाय इसके कि जब संभावना की बात आती है।
संभाव्यता एक अपवाद की तरह है क्योंकि इसकी तीन अलग-अलग परिभाषाएँ या रूपरेखाएँ हैं। इन परिभाषाओं के साथ एक ही समस्या पर विचार करने से अलग-अलग (और वैध) उत्तर मिल सकते हैं।
इसे प्रदर्शित करने के लिए, आइए निम्नलिखित समस्या पर विचार करें। हम संभाव्यता के तीनों ढाँचों का उपयोग करके इसे हल करेंगे। सभी रूपरेखाओं में एक बात समान है कि किसी प्रयोग के सभी परिणामों की कुल संभावना हमेशा 1
होती है।
“मेरे दोस्त सोविट ने मुझे एक सिक्का दिया। उसने मुझे यह नहीं बताया कि सिक्का सही है या नहीं। इस सिक्के पर चित आने की प्रायिकता क्या है?”
यह संभाव्यता की दृष्टि से सबसे सरल रूपरेखा है। इसे समझना भी सबसे आसान है.
शास्त्रीय रूपरेखा कहती है कि "समान रूप से संभावित परिणामों की समान संभावना होती है"।
उपरोक्त समस्या में, हम नहीं जानते कि सिक्का उचित है या नहीं। हम यह नहीं कह सकते कि क्या चित आने की भी उतनी ही संभावना है जितनी कि पट आने की। इसलिए, हम शास्त्रीय ढांचे का उपयोग करके इस समस्या का समाधान नहीं कर सकते।
लेकिन इस ढांचे के उपयोग को प्रदर्शित करने के लिए, मान लें कि सिक्का उचित है। इसका मतलब यह है कि चित आने की संभावना उतनी ही है जितनी कि पट आने की। चूँकि ये केवल दो संभावित परिणाम हैं और कुल संभावना 1
है, चित आने की संभावना 1/2
है।
शास्त्रीय ढाँचा अल्पविकसित लग सकता है लेकिन यह सबसे अधिक दुरुपयोग किया जाने वाला ढाँचा भी है। "या तो मंगल ग्रह पर जीवन है या नहीं है और इसलिए मंगल पर जीवन के अस्तित्व की संभावना 1/2
है" जैसे तर्क गलत हैं। क्योंकि शास्त्रीय ढाँचा तभी काम करता है जब परिणाम समान रूप से संभावित हों। इस मामले में, मंगल ग्रह पर जीवन के अस्तित्व और गैर-अस्तित्व की समान संभावना नहीं है।
यह संभाव्यता में सबसे अधिक उपयोग की जाने वाली रूपरेखाओं में से एक है। यदि आपने संभाव्यता में किसी समस्या को हल किया है, तो संभवतः आपने ऐसा करने के लिए फ़्रीक्वेंटिस्ट ढांचे का उपयोग किया होगा।
फ़्रीक्वेंटिस्ट ढाँचा कहता है कि किसी घटना की संभावना की गणना करने के लिए, हमें एक प्रयोग करने और परिणाम का निरीक्षण करने की आवश्यकता है। प्रयोग को अनंत बार दोहराएँ। और, घटना की संभावना P(E) = Count(favorable outcomes) / Count(total outcomes)
है।
व्यवहार में, हम एक प्रयोग को अनंत बार नहीं कर सकते। इसलिए, हम इसे निश्चित रूप से बड़ी संख्या में करते हैं। अपनी समस्या के लिए, आइए प्रयोग को 10
बार करें। आइए मान लें कि हमें 6
चित और 4
पट मिले। तो, चित आने की प्रायिकता 0.6
है।
बारंबारतावादी ढांचे की भी सीमाएँ हैं। कल बारिश की संभावना जानने के लिए समस्या पर विचार करें। परिभाषा के अनुसार, हमें अनंत संख्या में समानांतर ब्रह्मांडों की आवश्यकता है। फिर हमें इनमें से प्रत्येक ब्रह्मांड में आने वाले कल का निरीक्षण करना होगा और उन ब्रह्मांडों को गिनना होगा जहां बारिश हो रही है।
लेकिन यह मुमकिन नहीं। इसके अलावा, अगर हम कल देख सकते हैं तो हम कल बारिश की संभावना की गणना क्यों करेंगे?
यह संभाव्यता में सबसे अधिक उपयोग की जाने वाली रूपरेखाओं में से एक है। इसे समझना भी सबसे आसान है लेकिन इसके साथ काम करना कठिन है।
बायेसियन फ्रेमवर्क कहता है कि किसी घटना की संभावना वही है जो आप सोचते हैं। यह आपके व्यक्तिगत दृष्टिकोण के बारे में अधिक है। आप क्रिकेट देख रहे हैं और सचिन तेंदुलकर 94
के हैं. आप कहते हैं कि 90%
संभावना है कि वह शतक लगाएगा। यह घटना की आपकी बायेसियन संभावना है।
अब तक, उपरोक्त दो रूपरेखाओं में, हम समस्या में अन्य महत्वपूर्ण जानकारी पर ध्यान केंद्रित करने से चूक गए हैं: "मेरे दोस्त सोविट ने मुझे सिक्का दिया।" सोविट मेरा दोस्त है और मैं उसे जानता हूं। उसने पहले भी मुझे अन्य सिक्के दिये हैं। मान लीजिए कि उन सिक्कों में सिर मुड़ने की संभावना 0.4
थी।
इसे "पूर्व" जानकारी कहा जाता है. उपरोक्त दो ढाँचों में इसका उपयोग करने का कोई तरीका नहीं है। यह वह जगह है जहां बायेसियन ढांचा चमकता है। यह हमें पूर्व सूचना और डेटा दोनों का उपयोग करने की अनुमति देता है, फ़्रीक्वेंटिस्ट ढांचे के विपरीत जो केवल डेटा पर निर्भर करता है।
हमें यह मानना होगा कि हम अपने पूर्व पर कितना भरोसा करते हैं और हम अपने डेटा पर कितना भरोसा करते हैं। मान लीजिए कि हम दोनों 50%
(जिन्हें वज़न कहा जाता है) पर भरोसा करते हैं। शीर्ष की संभावना पूर्व और डेटा का भारित औसत होगी: 0.5 * 0.4 + 0.5 * 0.6 = 0.5
।
बायेसियन ढांचा पूर्व सूचना का उपयोग करके अधिक यथार्थवादी उत्तर प्रदान कर सकता है। लेकिन, हमें वज़न पर धारणाएँ बनानी होंगी। यह आलोचना का महत्वपूर्ण बिंदु है। चूँकि हम धारणाएँ बनाते हैं, इसलिए हमारे पूर्वाग्रहों के आधार पर परिणामों में गड़बड़ी संभव है।
इसलिए यह कहना कि उचित सिक्के पर चित आने की संभावना 1/2 है, सत्य नहीं है। यह तभी सत्य है जब हम शास्त्रीय ढांचे के बारे में बात कर रहे हैं। यह कहना कि 10 बार उछालने के प्रयोग में 6 चित और 4 पट देने वाले सिक्के पर चित आने की प्रायिकता भी गलत है।
यह तभी सच है जब हम बारंबारवादी ढांचे के बारे में बात कर रहे हैं। तुम्हें नया तरीका मिल गया है। इस प्रकार, उन रूपरेखाओं को ध्यान में रखना महत्वपूर्ण है जिनका उपयोग हम किसी घटना की संभावना बताते समय कर रहे हैं।
यह सब संभाव्यता और इसकी विभिन्न रूपरेखाओं के बारे में है। मुझे टिप्पणियों में बताएं कि क्या इसने आपके दिमाग को वैसे ही हिला दिया जैसे कि मेरे दिमाग को। अगर आपको लेख पसंद आया हो तो मुझे शाबाशी दीजिए।