छोटे बहुमत से सावधान रहें

गैलटॉन हाल के एक पोस्ट में मैंने तर्क दिया कि, हालांकि मानव (और गैर-मानव) अनुरूपता की मूलभूत समझदारी के लिए बहुत कुछ कहा जा सकता है, वहां भी समस्या हो सकती है उदाहरण du jour एक सौंदर्य प्रतियोगिता थी। महिलाओं के बीच बहुत अधिक पसंद प्रतिलिपि बनाने के साथ (महिलाओं को चुनने वाली महिलाओं की पसंद करते हुए महिलाएं), दोनों महिलाओं और पुरुषों को औसत पर, भुगतना पड़ सकता है।

एक और सीमा बहुमत के आकार की नकल की जा रही है। मान लीजिए आप ग्लास जार में पत्थर की संख्या का अनुमान लगाने की कोशिश कर रहे हैं। आपके द्वारा गिनती की तुलना में अधिक पत्थर हैं फिर भी, आप जार के आकार और व्यक्तिगत पत्थर के आकार की अपनी छाप का उपयोग करके अनुमान लगा सकते हैं। अब मान लीजिए कि आपको बताया जाता है कि 100 अन्य लोगों ने पहले से अनुमान लगाया है कि वे एक दूसरे से स्वतंत्र हैं और इन अनुमानों में से 95% इन 700 और 800 के बीच आते हैं। इस जानकारी के लाभ से, आपकी सबसे अच्छी रणनीति का अनुमान है कि इसमें 750 पत्थर हैं जार। यदि आप 200 के रूप में संख्या का अनुमान लगाते हैं, तो आप अपने आप को आकस्मिक रूप से पहचान लेंगे, जिसका निर्णय विश्वसनीय नहीं होना चाहिए। दूसरों के अनुमानों की एकत्रित जानकारी का उपयोग करना "पोल-द प्रेडर" लाइलाइन से "कौन करोड़पति बनना चाहता है" का उपयोग करना जैसा है, लेकिन क्या होगा यदि आप दूसरों की अनुमानों को जानकर 200 से ज्यादा पत्थर का अनुमान लगाते हैं? एक बार जब आप पाते हैं कि आप बाकी समूह से कितनी दूर हैं, तो आपको अनुमान लगाया जाना चाहिए जब आपके अनुमान को आउटवेयर के रूप में हटा दिया गया हो।

एक सामान्य नियम के रूप में, आउटरीयर की पहचान करना आसान हो जाता है क्योंकि अवलोकन की संख्या बढ़ जाती है और विचरण के रूप में या ये टिप्पणियां घट जाती हैं। अब मान लीजिए कि केवल दो अन्य लोग हैं जो दोनों एक उच्च अनुमान देते हैं, जबकि आपने कम अनुमान दिया है। क्या आप इस विचार से प्रसन्नता से स्वीकार करते हैं कि उनका अनुमान आपके जितना सटीक है क्योंकि वे एक-दूसरे से सहमत हैं, जबकि आप असहमत हैं? यह एक मोहक विचार है। संभवतया समझौते से सटीकता का पता चलता है, जब भी सहमति वाले व्यक्ति की संख्या तार्किक न्यूनतम पर होती है

अब मैं तर्क दूंगा कि यह समझौता सटीकता का एक मात्र प्रॉक्सी है, और उस पर कोई खास अच्छा नहीं है। यह सच है कि यदि सभी निर्णय सही हैं, तो वे सभी एक दूसरे के साथ सहमत होंगे। उलटा हालांकि, यह सच नहीं है क्योंकि फैसले उन कारणों के लिए समझौते में हो सकते हैं जिनके पास सटीकता से कोई लेना-देना नहीं है। इनमें से एक कारण मौका है

आगे बढ़ने का वैकल्पिक तरीका सभी तीन निर्णय (आपके और दो अन्य के निर्णय) का उपयोग करना है और औसत की गणना करना है। औसत अव्यक्त पैरामीटर का सबसे अच्छा अनुमान है कि आप सभी को कैप्चर करने की कोशिश कर रहे हैं। इस दृष्टिकोण के अनुसार, तीनों न्यायाधीशों में से प्रत्येक एक स्वतंत्र माप उपकरण है और प्रत्येक व्यक्तिगत निर्णय जानकारी (सच्चाई) और शोर (त्रुटि) का एक सम्मिश्र है। त्रुटियों को एक दूसरे से स्वतंत्र माना जाता है, और औसतन औपचारिक रूप से उन्हें दूर कर दिया जाता है

हमारे पास अब दो प्रतिस्पर्धी सिफारिशें हैं जिन पर आगे बढ़ने के तरीके हैं यदि दो उच्च और एक निम्न निर्णय हैं (ए) कम निर्णय निकालना या बहुमत में शामिल होने के लिए बाहरी न्यायाधीश को मनाने; (बी) उनमें से किसी एक व्यक्ति के खिलाफ पूर्वाग्रह के बिना तीन निर्णय औसत प्रत्येक विधि के अपने अधिवक्ताओं के पास है ए के लिए मुख्य तर्क यह है कि कम अनुमान "स्पष्ट रूप से" और बाहर है और यह अनुबंध सटीकता को इंगित करता है [मैंने पहले से ही इस विचार पर सवाल उठाया है] इसके अलावा, ए के समर्थकों का मानना ​​है कि न्यायाधीशों के बीच आम सहमति की चर्चा हमेशा लाभदायक होती है। चर्चा के माध्यम से, न्यायाधीश सत्य के करीब आ सकते हैं लेकिन यह सच्चाई क्या है? यदि दो उच्च न्यायाधीश थोड़ा स्वीकार करते हैं और कम जज बहुत कुछ मानते हैं, तो परिणाम औसत हो सकता है जो मूल फैसले से पहले ही गिना गया था। यदि हां, तो समूह चर्चा एक कचरा था। वैकल्पिक रूप से, यदि केवल बाहरी न्यायाधीश मानता है (जो विषम अनुरूपता दबाव के तहत होने की संभावना है), तो परिणाम यह है कि किसी को केवल बाहरी क्षेत्र की उपेक्षा करके क्या मिलेगा। फिर, समूह चर्चा समय की बर्बादी और एड्रेनालाईन थी तीसरी संभावना यह है कि बाहरी न्यायाधीश एक साथ दो संसद के न्यायाधीशों की तुलना में थोड़ा अधिक मानते हैं। नतीजा एक समूह का निर्णय है जिसे भारित औसत के रूप में वर्णित किया जा सकता है, जहां प्रत्येक व्यक्ति का वजन समग्र अर्थ के लिए फैसले की निकटता के अनुपात में होता है। यह एक अच्छा विचार की तरह अच्छा लगता है, लेकिन कोई नहीं जानता कि वज़न वास्तव में क्या होना चाहिए। शुद्ध रणनीतियों ए और बी के बीच कई बिंदु हैं, जहां भारित फैसले खत्म हो सकता है। इसलिए, मैं इस निबंध के बाकी हिस्सों में सिर्फ ए और बी का विचार करूंगा।

दो सांख्यिकीय सिद्धांतों का उपयोग करके, हम यह निर्धारित कर सकते हैं कि ए या बी, अंतर्ज्ञान, प्रवीणता या परंपरा (हम हमेशा इसे इस तरह से किया है!) के लिए अपील किए बिना बेहतर रणनीति है। पहला तरीका यह पूछने के लिए है कि अगर हमने मान लिया है कि ए या बी सही है तो तीन निष्कर्ष निकाले गए हैं। मान लीजिए कि तीन निर्णय 2, 2, और -2 हैं 1 के मानक विचलन के साथ आबादी से ली गई एक नमूने के रूप में इन नंबरों के बारे में सोचें। मानक सामान्य वितरण के विपरीत, हालांकि, इसका मतलब 0 नहीं है। इसके बजाय, इसका अर्थ 2 या तो है यदि हम मानते हैं कि सिद्धांत A सही है, या यह .667 (2/3) है यदि सिद्धांत बी सही है। सिद्धांत 2 के तहत 2, 2, और -2 (या अधिक चरम संख्याएं) खोजने की संयुक्त संभावना .000008 हो जाती है, सिद्धांत बी के तहत .00003 और बी के उत्तरार्द्ध का अनुपात 3.75 है, जिसका अर्थ है कि यदि दोनों सिद्धांतों को शुरू में सच होने की समान संभावना के रूप में माना जाता था, सिद्धांत बी सिद्धांत ई से लगभग चार गुना अधिक सच साबित होने की संभावना है। इसका परिणाम यह है कि यदि आप अपने दिमाग को बदलने के लिए दूरदराज के निर्णय (या असंतुष्ट न्यायाधीश को राजी) आप महत्वपूर्ण जानकारी खो देते हैं, और परिणामस्वरूप समूह का निर्णय खराब हो जाता है

दूसरा तरीका यह पूछना है कि यदि अन्य स्वतंत्र पर्यवेक्षकों से अधिक निर्णय एकत्र किए गए तो क्या होगा? [ध्यान दें कि वास्तव में उन निर्णयों को प्राप्त करने की कोई आवश्यकता नहीं है!] अब हम मानते हैं कि इन सभी निर्णयों के आधार पर संख्या की आबादी एक सामान्य सामान्य है (एम = 0, एसडी = 1) इसलिए, निकाय हटाने या सुधार (2, 2, 2) के बाद सिद्धांत ए से जुड़े संख्याओं का सेट अत्यंत सकारात्मक है अगर तीन फैसलों का एक और समूह जनसंख्या से नमूना था, तो परिणामस्वरूप इसका मतलब 0 से 2 के बीच होने वाला होगा, और उत्तरार्द्ध के करीब होगा क्योंकि माप प्रक्रिया विश्वसनीय है। चूंकि माप त्रुटि से पूरी तरह से मुक्त नहीं होता है, हम उम्मीद करते हैं कि कुछ प्रतिगमन मतलब है। सिद्धांत बी (2, 2, -2) द्वारा दिए गए संख्याओं के सेट को मानते हुए, तीन फैसले के दूसरे नमूने का मतलब सबसे ज़्यादा 0 से 2/3 के बीच होता है, और क्योंकि 2/3 2 से कम चरम है, सिद्धांत ए के तहत सिद्धांत बी के नीचे अपेक्षित प्रतिगमन प्रभाव का आकार छोटा है।

जैसा कि इस अभ्यास से पता चलता है, एक छोटे से नमूने में बहिष्कृत (या दांतेदार) आउटलाइयर माप में प्रसिद्ध प्रतिगमन प्रभाव को सही नहीं करता; बजाय, यह इससे भी बदतर बना देता है सिद्धांत बी (2/3) के तहत सबसे अच्छा अनुमान संभवतः नमूना जारी रखने के बाद की तुलना में थोड़ा अधिक है। यदि कुछ भी हो, तो यह अनुमान घटाया जाना चाहिए। बाक़ी काटने से, हम समूह के अनुमान को 2/3 से 2 तक ले जाते हैं। अनुमान को अधिक चरम करके, हम सकारात्मक रूप से फुलाया जाने की अधिक संभावनाएं बना रहे हैं।

चलो ठोस संख्याओं के साथ प्रतिगमन प्रभाव को स्पष्ट करते हैं। यदि हम आशा करते हैं कि निर्णय अत्यधिक विश्वसनीय हैं (r = .9), तो 2 का औसत निर्णय (2, 2, और 2 का मतलब) 1.8 के औसत के रूप में दोहराए जाने की भविष्यवाणी की गई है। तुलना करके, 2/3 का औसत निर्णय (2, 2, और -2 का मतलब) को 6.6 के रूप में दोहराए जाने की भविष्यवाणी की गई है। ध्यान दें कि इसके अधिक से अधिक छोर के आधार पर, पूर्व निर्णय उत्तरार्द्ध से अधिक फुलाया जाता है। फिर भी, इस विचार के अनुसार कि समझौता सटीकता का संकेत देता है, पूर्व निर्णय बेहतर है यदि हम अधिक निराशावादी मानते हैं कि निर्णय में केवल मामूली विश्वसनीयता (आर = .6) है, तो प्रतिगमन प्रभाव बड़े होते हैं लेकिन समान पैटर्न दिखाते हैं 1.2 की अनुमानित मान के 2 रिग्रेसेस के एक मूल औसत, और 2/3 की एक मूल औसत .4 के अनुमानित मान के लिए regresses।

क्या आपको लगता है कि यह कहानी बहुत सार है और सिद्धांतों ए और बी में कोई दिक्कत नहीं है, मुझे इस बात पर ज़ोर देना चाहिए कि छोटे समितियां प्रवेश, धन, प्रोन्नति आदि तय करते हैं। पैसे के लिए आवेदन करने वाले 100 उम्मीदवारों पर विचार करें। अनुसंधान करने के लिए। प्रत्येक प्रस्ताव को तीन न्यायाधीशों द्वारा मूल्यांकन किया जाता है और प्रत्येक न्यायाधीश के स्कोर को मानकीकृत किया जाता है। केवल शीर्ष कुछ को वित्त पोषित किया जा सकता है 2, 2 और 2 की रेटिंग के साथ एक प्रस्ताव सुरक्षित है, लेकिन 1, 1 और 1 की रेटिंग के साथ कोई प्रस्ताव नहीं है। अब एक तीसरा प्रस्ताव ऊपर बताया गया है (2, 2, -2) सिद्धांत बी (साधारण औसत) के अनुसार, यह प्रस्ताव कटौती नहीं करता है थिअरी ए (बाउडर हटाने) के अनुसार, यह प्रस्ताव दूसरे एक से ऊपर बढ़ जाता है, और संभवतः इसे वित्त पोषित होने से रखता है। तो समूह चर्चा बहुत नुकसान कर सकती है। अगर, इस उदाहरण के रूप में, अपेक्षाकृत उच्च स्कोर सबसे ज्यादा हित के हैं, प्रस्तावों (लोगों) को एक नकारात्मक आउटएयर के साथ चुनिंदा रूप से इष्ट होगा। किसी फंडिंग या पदोन्नति संदर्भ में, दो कम स्कोर और एक उच्च स्कोर वाले मामलों में कोई भी दिलचस्पी नहीं लेता है

प्रतिगमन असतत फैसलों को भी प्रभावित करता है जब 3 न्यायाधीश एक सर्वसम्मति से एक परियोजना (एक सहयोगी को बढ़ावा देने, या एक संदिग्ध को बरी) को निधि देने के लिए वोट देते हैं, तो यह निष्कर्ष निकाला जा सकता है कि यदि पूछा जाए तो बाकी सब सहमत होंगे। 'ए' की वास्तविक संभावना [शायद] नमूना में इसकी संभावना से छोटी है अगर बाद में उच्च है। यदि, उदाहरण के लिए, सच्ची संभावना 9 है, तो संभावना है कि 3 स्वतंत्र न्यायाधीशों का एक नमूना (यानी, उनके निर्णयों को असंबद्ध कर दिया गया है) पक्ष में सर्वसम्मति से होगा .73। दूसरे शब्दों में, दुर्लभ घटनाओं (यहां: नकारात्मक वोट) छोटे नमूने में प्रस्तुत किए जा रहे हैं। 3 सर्वसम्मति से न्यायाधीशों का एक नमूना देखकर, यह संभव है कि सच्ची आम सहमति सही से कम है। लेकिन यह कैसे अपूर्ण है? हम कैसे जानते हैं कि सुधार करने के लिए कितना करना है?

इस उदाहरण में, मैंने मान लिया है कि सच्चाई में, पी =। 9, लेकिन पी में 0 के अलावा कोई अन्य मूल्य हो सकता है [यदि पी 0 थे, तो कोई हां वोट नहीं होगा] लापलस द्वारा प्रस्तावित सुरुचिपूर्ण समाधान, अज्ञानता का दावा करना है; यह मानना ​​है कि शुरू में, पी के सभी मूल्य समान रूप से होने की संभावना है। एक नमूना को देखते हुए, हम यह पूछ सकते हैं कि इस नमूना को पी के प्रत्येक संभावित मूल्य से कैसे आकर्षित किया जाए। जाहिर है, 3 हां वोटों का एक नमूना सबसे अधिक होने की संभावना है यदि पी = .99, उसके बाद पी = .98, और इसी तरह पी = .01 इसे सही करने के लिए एक अभिन्न गणना की आवश्यकता है, लेकिन अज्ञान की धारणा के तहत, यह सभी एक सरल और सुंदर सूत्र के लिए उबाल हो जाता है। सबसे अच्छा अनुमान है, जो अनुमान है कि प्रतिगमन और विपरीत प्रकार की त्रुटियों की त्रुटियों को कम करता है, (कश्मीर + 1) / (एन 2), जहां कश्मीर "सफलताओं" की संख्या [यहां, हां वोट] और n नमूना आकार है 3 हां वोट और कोई असंतोष नहीं देखा, आबादी में सच्चे समर्थन का लाप्लासीयन अनुमान 4/5 या पी = .8 है। Laplace को नजरअंदाज करने के लिए और p = 1 का अनुमान करने के लिए प्रतिगमन त्रुटि करना है जो आकार में अनुमान का पांचवां हिस्सा है। यदि नमूना बड़ा था, और एकमत भी मनाया जाता था, तो सच एकमत की धारणा के मामले मजबूत होंगे [उदाहरण के लिए, यदि 30 में से 30 नमूना जजों का वोट हां है, तो पी का अनुमान 31/32 या। 9 6 9 है]

चलो सही एकमत के बिना पैनल पर लौटें। यदि 2 9 लोग कहते हैं कि किसी शब्द को छोड़ दिया जाता है या मन में बदलाव लाया जाता है, तो सर्वसम्मति के मुखिया का अनुमान काफी प्रतिगमन प्रभाव (.094 = 1-9 06) बहिष्कार या सामाजिक प्रभाव की एक ही रणनीति एक छोटे से नमूने में बहुत अधिक प्रतिगमन त्रुटि उत्पन्न करती है। यदि 2 यहा-कहने वाले एक असंतोष को बहिष्कृत या परिवर्तित करते हैं, तो त्रुटि है .4 (1 -6, जहां .6 है (2 + 1) / (3 + 2)।

संभावित त्रुटि के लिए माप, डेटा एकीकरण और सुधार का तर्क एक कठिन बिक्री है। बहुत से लोगों को कुचलने की संख्या में घृणा होती है क्योंकि यह मैकेनिकल लगता है। यह उचित व्यक्तियों के बीच वार्तालाप करने और आम सहमति तक पहुंचने के लिए बहुत अधिक मानवीय लगता है। आम सहमति अच्छी लगता है बहुमत वाले सदस्य, जो संभवतः प्रबल होंगे, वे वास्तविकता से सही और सामाजिक रूप से प्रेरक होने के विश्वास के आधार पर विश्वास कर सकते हैं (असंतोष को सीधे सेट कर सकते हैं) पूर्व असंतुष्ट समूह कम से कम समूह द्वारा स्वीकार किए जाने की उथल संतुष्टि पर है। 3 न्यायाधीश शायद रात को अच्छी तरह नींद लेते हैं, यह नहीं जानते कि उन्होंने एक अन्याय किया है मूल उदाहरण में, कोई प्रारंभिक विचरण (1, 1, 1) के साथ कोई अच्छा मामला अब उस मामले से नीचे होता है जो (2, 2, -2) से (2, 2, 2) तक बढ़ गया है। एक वित्तपोषण के संदर्भ में, जहां जीवन और मृत्यु के बीच एक तेज रेखा है, ऐसे मामलों में से एक ने पायदान छोड़ दिया क्योंकि समीक्षा की गई केस बढ़ गया है, उस रेखा को पार करेगा असमंजसता के कारण अन्याय हो सकता है।

हम निष्कर्ष निकाल सकते हैं कि यहां निर्णय लेने की प्रक्रिया के प्रकार में विचार किया गया है, सिद्धांत तर्कसंगत (और नैतिक) प्रत्येक निर्णय को एक स्वतंत्र नमूने के रूप में माना जाता है जैसा कि सिद्धांत बी द्वारा सुझाव दिया गया है। यदि निर्णय निरंतर हैं, तो उन्हें औसत होना चाहिए यदि फैसले असतत हैं, तो उन्हें अनुपात में परिवर्तित किया जाना चाहिए। प्रतिगमन प्रभावों से निपटने के लिए संभावित नमूनाकरण त्रुटि के लिए दोनों प्रकार के अनुमान को सही किया जा सकता है। यह रॉकेट विज्ञान नहीं है, और जो लोग खुद को न्याय के लिए प्रस्तुत करते हैं, उनके लिए सर्वोत्तम मानदंडों का इलाज किया जाना चाहिए।

बीटीडब्ल्यू, फोटो में सज्जन सर फ्रांसिस गैलटन हैं

Intereting Posts
पैडलबोर्ड योग की कोशिश करने से मैंने सीखा 5 सबक मन को शिक्षित करते वक्त दिल का विस्तार गुलाबी वियाग्रा के लिए प्रतीक्षा की जा रही है आपको थैरेपी या परामर्श रोकना चाहिए? 7 सरल दिशानिर्देश क्या हमारे सेववेस हमेशा हमारे साथ यात्रा करते हैं? झूठे आरोप, बलात्कार और शब्द की शक्ति लगातार सीमाएं तलाक से बचें बच्चों को मदद निवासी चिकित्सकों के घंटे की नई सीमाएं-क्या वे बहुत दूर जाते हैं? Snark Attack! "माँ-ड्राइव" से सावधान रहें धन्यवाद व्यंजन विधि: प्रियजनों और क्रैनबेरी को ढूंढना दादा दादी और ग्रैंडकिड्स: लंबी दूरी के मुकाबले प्यार कैसे वर्तमान एआई मानव खुफिया के खिलाफ ढेर है? जनजातीय गले लगाओ क्या हम भूल गए हैं कैसे पता है? IGen का उद्भव