क्यों असाधारण सांख्यिकी?

कल्पना कीजिए हमारे पास एक सवाल था: "क्या पुरुषों और महिलाओं को एक्स पर भिन्नता है?"

कोई बात नहीं, जो "एक्स" है-ऊंचाई, सहानुभूति, 13 वीं सदी के स्पेनिश इतिहास का ज्ञान, या कुछ और-हम जानते हैं कि कोई भी व्यक्ति किसी भी महिला से अलग होगा, लेकिन हमें नहीं पता कि यह कैसे है कि "पुरुष" औसतन "महिलाओं से औसत" औसत है। "यही है, जब हमने हमारे शुरुआती सवाल पूछे, तो हम शायद यह जानना चाहते थे कि पुरुषों के लिए महिलाओं के मतलब के मुकाबले इसका मतलब क्या है। लेकिन हम पुरुषों के लिए वास्तविक अर्थ या महिलाओं के वास्तविक अर्थ को कभी नहीं जानते, क्योंकि इसमें 7 अरब से अधिक लोगों को मापना शामिल होगा! इसलिए, हमें किसी तरह, पुरुषों का एक नमूना और महिलाओं का एक नमूना मिलना चाहिए, उनकी तुलना करना चाहिए, और उस से एक निष्कर्ष निकालना चाहिए

मान लें कि हम 100 पुरुष और 100 महिलाओं का नमूना लेते हैं, और हम उन्हें स्पेनिश इतिहास के बारे में पूछते हैं हमारे नमूने में, महिलाओं की औसत 68% और पुरुषों की औसत 63% है। यह हमारे नमूने के लिए परिणाम है और यह एक ठोस ठोस परिणाम है लेकिन, याद रखना, हम विशेष रूप से हमारे नमूने में दिलचस्पी नहीं रखते – हमें "पुरुष बनाम महिलाओं" में दिलचस्पी है, न कि "पुरुषों को हम" बनाम बनाते हैं "महिलाओं को देखने के लिए हमने देखा"। बड़ी आबादी के बारे में कुछ अनुमान लगाने के लिए नमूना (और वह है जो अनुमान लगाता है इंफॉर्मर एटियल आँकड़ों में)

इन संदर्भों को बनाने में एक गंभीर चुनौती है: हमारे नमूनों में जो भी अंतर होता है, वह मौके के कारण हो सकता है! बेशक, हमारा पुरुष समूह हमारे महिलाओं के समूह से अलग है, लेकिन इससे हमें बहुत कुछ नहीं बताया गया है, क्योंकि अगर हम बेतरतीब ढंग से पुरुषों के दो समूहों को उठाते हैं, तो वे भी अलग होंगे। यह एक गंभीर समस्या है: यह देखते हुए कि किसी भी दो नमूने स्पष्ट रूप से एक-दूसरे से अलग होंगे, जो हम मापने की कोशिश करेंगे (यदि हम पर्याप्त विवरण में माप कर सकते हैं), हम निष्कर्ष निकालने के लिए नमूने कैसे उपयोग कर सकते हैं?

सब खो नहीं है, हालांकि, एक छोटे से अंतर्ज्ञान के रूप में हमें बताना होगा। यादृच्छिक मौके के कारण होने वाले अंतर छोटे होने की संभावना है, और यदि हम एक ही परीक्षा में फिर से करते हैं तो यह बहुत अलग आकार होने की संभावना है। अगर हम अपनी परीक्षा दोबारा दोबारा दोबारा दोहरा सकते हैं (नए नमूनों के साथ), तो इससे हमें बेहतर निष्कर्ष बनाने में मदद मिलेगी: अगर हमें 100 पुरुष और 100 महिलाओं के नमूने मिले 20 बार, और हर बार हमें पुरुषों की तुलना में 5 अंक अधिक अंक मिलते हैं, तो हम हमारे खोज में अधिक आत्मविश्वास होगी हालांकि प्रतिकृति आमतौर पर व्यावहारिक नहीं है, हम एक नमूना का उपयोग अनुमान लगाने के लिए कर सकते हैं कि यदि हम दोहराया जाए तो क्या होगा। और, हमारे अंतर्ज्ञान यहां भी हमारी मदद कर सकते हैं: यदि हमें केवल कुछ ही लोगों की संख्या को मापने के बाद समूहों के बीच एक छोटा सा अंतर मिल गया है, तो यह याद रखे जाने की संभावना से अधिक होने की अधिक संभावना है, अगर हमें एक मापने के बाद समूहों के बीच एक बड़ा अंतर मिल जाए बहुत सारे लोग। उस नीचे को तोड़कर: 1) बड़े मतभेद छोटे अंतर से मौके के कारण होने की संभावना कम है, और 2) नमूने का बड़ा आकार, और अधिक बिंदु 1 सच है।

अगर हम "कम संभावना" बनाम "अच्छा होने" पर एक अच्छा गणितीय संभाल ले सकते हैं, तो उन दावों के "और अधिक संभावना" हिस्सा, हम हमारे नमूनों का उपयोग करना शुरू कर सकते हैं ताकि हमारे परिणामों को कैसे नकल किया जा सके। अर्थात्, हम अपने एकल नमूने का उपयोग करने के लिए मज़बूती से भविष्यवाणी कर सकते हैं कि यदि हम अपने अध्ययन को बार-बार दोहराएंगे तो क्या होगा। हम पहले से ही सहमत हुए हैं कि यदि परिणाम बार-बार दोहराया गया है, तो हम बड़ी आबादी के बारे में निष्कर्ष निकालने पर आश्वस्त होंगे। और अब हम जानते हैं कि यदि हम कई नमूने हैं तो हम क्या करेंगे, इसके बारे में निष्कर्ष निकालने के लिए एक नमूना का उपयोग कर सकते हैं आखिरी दो वाक्यों को एक साथ रखना: यदि हम हमारे पीछे कुछ गणित प्राप्त कर सकते हैं, तो हम बड़ी संख्या के बारे में विश्वसनीय जानकारी बनाने के लिए हमारे एकल नमूना का उपयोग कर सकते हैं।

इस प्रकार, हम जो प्रयोगिक आंकड़ों का प्रयोग करते हैं, कोई फर्क नहीं पड़ता कि प्रश्न हमेशा ऐसा कुछ होता है: "हमारे नमूने में यह अंतर हमने पाया, संभावना क्या है, हमने एक बड़ा अंतर पाया, सिर्फ मौके से?" जब यह संभावना नहीं है कि हमारे अंतर में अंतर मौके के कारण होता है, हमें विश्वास है कि यह वास्तविक है।