झूठी पॉजिटिव का भय

मैं केवल एकमात्र ईश्वर हूं जो चाबियाँ / शस्त्रागार को जानता है जहां बिजली की बोल्ट मुहरबंद है। / उस के लिए कोई ज़रूरत नहीं, यहां नहीं। / मुझे तुम्हें समझाया ~ ऐशिलोस: द ईमनेइड्स [1]

प्रकृति , बेंजामिन और 71 सह-लेखकों में प्रकट होने वाले एक बहुत अधिक परिचालित कागज में यह पूछे जाने पर कि <0. 05 से .005 के वर्तमान सम्मेलन से महत्व का स्तर कड़ा हो। तर्क यह है कि मनोवैज्ञानिक विज्ञान के प्रकाशित रिकॉर्ड में बहुत से झूठे सकारात्मक परिणाम होते हैं, जो उन चीजों में विश्वास करने के लिए प्रेरित होते हैं जो ऐसा नहीं है, जैसे कि सास्कक्व या सामाजिक भड़काना महत्व सीमा को कम करने से झूठी सकारात्मक घटनाओं को कम किया जाएगा। इसी समय, वे कहते हैं, यदि नया परिपालन अपनाया जाता है, तो प्रतिकृति संकट को ठीक करने में मदद करेगा। या यह होगा? अगर सांख्यिकीय शक्ति के दिए गए स्तर पर .05 खोज को दोहराना मुश्किल है, तो उसी पावर स्तर पर .005 की खोज करना मुश्किल होगा। याद रखें कि सांख्यिक शक्ति की संभावना है [सम्मेलन द्वारा परिभाषित] [संभावित रूप से परिभाषित] [पारंपरिक रूप से .8] अगर मूल खोज वास्तविक है, यह है, अगर यह सत्य है और एक झूठी सकारात्मक नहीं है प्रतिकृति संकट के लिए उनके प्रस्ताव को सकारात्मक रूप से प्रासंगिक बनाने के लिए, लेखकों ने एक कम महत्त्व सीमा का प्रस्ताव केवल उपन्यास परिकल्पना परीक्षणों के लिए लागू किया है। दूसरे शब्दों में, वे पूछते हैं कि हम केवल पी <.005 के नए अनुसंधान की रिपोर्ट करते हैं, जबकि हमें पी <.05 के साथ इसे दोहराने की इजाजत देते हैं। [यह प्रस्ताव हमें यह सवाल पूछता है कि हम कैसे जानते हैं कि एक उपन्यास का परीक्षण क्या है।]

इस कसने-के- the-screws प्रस्ताव दिलचस्प है लेकिन यह असमानता के साथ flirts। पुरानी कहावत याद रखें कि भगवान पी = .055 नहीं पीते हैं (या बहुत कम नहीं) उससे प्यार करता है p = .045 (और प्रोफेसर गेलमैन का सबूत)। अब भगवान को भी बहुत परवाह नहीं है कि पहले किस अध्ययन का आयोजन किया गया था और इसे उपन्यास परिकल्पना परीक्षण माना जाता है और जो बाद में आयोजित किया गया था। इन अध्ययनों का क्रम सैद्धांतिक रूप से और सांख्यिकीय अप्रासंगिक है (क्रुएजर, 2001)। अगर हम अलग-अलग सांख्यिकीय मानकों के लिए पहली और द्वितीय अध्ययन करना चाहते हैं, तो हम तर्क को उलट सकते हैं। हमें प्रारंभिक अवधारणा परीक्षणों में आसान होना चाहिए क्योंकि वे अभी तक नहीं जानते हैं कि वे क्या हैं। प्रारंभिक परीक्षण अन्वेषणकारी हैं, पुष्टि नहीं (सकाळुल, 2016)। शुरुआती परीक्षण वैज्ञानिक तरीके से माहिर हैं वैज्ञानिक समझता है कि आसान शुरुआती परीक्षण कई सुरागों का उत्पादन करेंगे जो बाद में मृत समाप्त हो जाएंगे, लेकिन वह और वह यह भी समझता है कि ऐसे परीक्षण कई निष्कर्षों को बदलेंगे जो बाद में वास्तविक खोजों के रूप में गिना जाएंगे।

बेंजामिन एट अल झूठी नकारात्मक त्रुटियों के जोखिमों को पता है, लेकिन वे बहुत चिंतित नहीं लगता है। चिंता की कमी अतिरिक्त-सांख्यिकीय है यह एक मूल्य निर्णय है यदि वे मानते हैं कि झूठी नकारात्मकताओं के भयावहता से भ्रामक भयावहता भयावह हैं, तो उन्हें एक सख्त पी थ्रेसहोल्ड की वकालत करनी चाहिए। क्योंकि वे एक सख्त पी थ्रेसहोल्ड की वकालत करते हैं, हम रिवर्स-अनुमान कर सकते हैं कि वे झूठी सकारात्मक (क्रूजर, 2017) से घृणा करते हैं। लेकिन जैसा कि हमारे में से कुछ ने तर्क दिया है, हमें परंपरागत अभ्यास (फेइडलर, कुत्ज़नेर और क्राउजर, 2012) में हुए बदलावों पर विचार करने पर किस दिशा विज्ञान पर विचार करना होगा। फिर भी, सांख्यिकीय विचार हैं जिसमें हम अनुमान लगा सकते हैं कि जिस दर पर झूठी सकारात्मक और गलत नकारात्मक पी दहलीफ में बदलाव के साथ बदल जाएगा। अनुकार प्रयोगों में, हम पाते हैं कि पी थ्रेशोल्ड कम करने से आगमनात्मक संदर्भों की कुल वैधता (क्रुएजर एंड हेक, 2017) कम हो जाती है। यह इसलिए है क्योंकि मिस का अनुपात झूठी पॉसिटिव्स के अनुपात की तुलना में अधिक तेज हो जाता है। इन निष्कर्षों के प्रकाश में महत्व सीमा को कम करने पर जोर देने के लिए एक सच्चे सकारात्मक पर एक उपयोगिता की तुलना में झूठी सकारात्मकता पर अधिक असर डालना है।

और क्यों .005 और नहीं .01 या .001? बेंजामिन एट अल मानना ​​है कि मनमाना के रूप में चुनाव व्यावहारिक है। वे सामाजिक सबूत (कई एहसान के लिए) का उल्लेख करते हैं और बढ़ती Bayes कारक है कि इसके साथ चला जाता है। पी मान कम, वैकल्पिक परिकल्पना का समर्थन करने वाले बीएफ अधिक। यह बायोसियन के लेखकों के बीच सच्चाई का एक क्षण है। बीएफ, जैसा कि यह पता चला है, पी मूल्य का लॉग-रैखिक रूपांतर है। प्रियजनों को शामिल किए जाने तक कोई भी सांख्यिकीय जोड़ा नहीं जाता है, लेकिन यह एक और कहानी है

72 लेखक की रिपोर्ट महत्त्वपूर्ण साहित्य से महत्वपूर्ण परीक्षण पर आती है। यह साहित्य दो दावों को उकसाता है:

  1. पी मान असंगत और अविश्वसनीय होने के अर्थ में खराब तरीके से दोषपूर्ण हैं;
  2. पी मान पर्याप्त कम नहीं हैं

72 ने बाद के बिंदु पर जोर दिया, जिससे पूर्व पर जोर दिया। निश्चित रूप से, एक ही अखबार में दोनों शिकायतों को लॉग करना मुश्किल होगा। यह पुराने यहूदियों की कचरे की तरह होगा कि "भोजन भयानक था, और यह भाग बहुत छोटा था!"

एक तीसरा मुद्दा है, जो सांख्यिकीय मूलभूत चीज़ों के बारे में नहीं है, बल्कि उनके उपयोग के बारे में है। आलोचकों ने शिकायत की कि शोधकर्ताओं ने "कुछ" की उपस्थिति या अनुपस्थिति के बारे में स्पष्ट संदर्भ बनाने के लिए बिना किसी निरंतर या स्लाव से एक महत्व सीमा का उपयोग किया। फिशर या नेयमन और पीयरसन ने भी कठोर निर्णय लेने की वकालत की। फिशर को .05 को एक उचित दहलीज के रूप में देखा जाता है जब थोड़ा और जाना जाता है, और नेमन और पियरसन ने सुझाव दिया है कि शोधकर्ताओं को .05, .01, या .001 का उपयोग करना चाहिए, दो प्रकार की त्रुटि के सापेक्ष उपयोगिताओं के आधार पर। अब 72 एक मानक परिवर्तन की मांग करने के करीब आये, एक नया महत्व मानदंड जो सामाजिक विचार-विमर्श और संपादकीय विधि द्वारा बाध्यकारी होगा। इसके साथ ही 72 अनुसूचित जनजातियों के मुख्य पाप के रूप में निंदा की जाती है, जो कि एक उज्ज्वल लाइन के चित्रण के बीच होना चाहिए और नहीं।

वास्तव में उज्ज्वल लाइन वर्गीकरण का एक मनोविज्ञान है। शुरुआती ताजफेल (जैसे, 1 9 6 9) प्रस्तावित अधिग्रहण सिद्धांत को मनमाना (और गैर-मनमाने ढंग से) वर्गीकरण के विभिन्न परिणामों की भावना बनाने के तरीके के रूप में प्रस्तावित किया गया था। उन्होंने प्रतिकृति परिणाम की रिपोर्ट की है कि एक सातत्य पर रखे गए मान क्रमशः छोटे और बड़े के रूप में माना जाता है यदि वे बाईं (छोटे) या सीमांकन बिंदु (क्राउजर एंड क्लेमेंट, 1 ​​99 4) के दाहिने (बड़ा) तरफ गिर जाते हैं। सांख्यिकीय सूचकांकों और फैसले के क्षेत्र में अवधारणात्मक अभिव्यक्ति एस.टी. से बाहर आने वाली एक विशेष बीमारी नहीं है।

72 रिपोर्ट में छिपे हुए एक अंतिम जटिलता यह है कि पिछले परिणामों के साथ क्या करना है शायद 72 का अर्थ यह है कि .05> p> .005 के साथ सभी निष्कर्षों की अवहेलना हो। दरअसल, यह निष्कर्ष उनके प्रस्ताव से है। जैसा कि ऊपर वर्णित है, भगवान (और फिशर) परिणामों की सापेक्ष कालक्रम के बारे में परवाह नहीं करते हैं यहाँ 72 एक अंतर कर सकते हैं वे रिकॉर्ड पर जाने का चुनाव कर सकते हैं और .05> p> .005 के साथ अपने सभी पिछले निष्कर्षों को अस्वीकार कर सकते हैं। इन परिणामों के किसी भी संभावित बाद में प्रतिकृति बेखबर है क्योंकि यह चाहिए – अपने तर्क के अनुसार – कभी नहीं हुआ है

[1] ऐशिलॉज़, इन शब्दों को एथेना के मुंह में डालते हुए, प्राधिकरण के ऊपर अनुनय की शक्ति पर बल देता है इसी तरह, हमारे वैज्ञानिक अभ्यासों को तर्क से जवाब देना चाहिए, प्राधिकरण द्वारा घोषणा नहीं करना।

बेंजामिन, डीजे, बर्गर, जे।, जोहानसन, एम।, नोसेक, बीए, वेगनमेकर, ई। जे।, बर्क, आर, … जॉनसन, वी। (2017, 22 जुलाई)। सांख्यिकीय महत्व को फिर से परिभाषित करें Osf.io/preprints/psyarxiv/mky9j से पुनर्प्राप्त

फिडेलर, के।, कुटज़नेर, एफ।, और क्राउजर, जे (2012)। एक नियंत्रण से वैधता के लिए लंबा रास्ता उचित: एक छोटी-देखी झूठी सकारात्मक बहस के साथ समस्याएं मनोवैज्ञानिक विज्ञान पर परिप्रेक्ष्य, 7 , 661-66 9

क्रुएजर, जे (2001) नल परिकल्पना महत्वपूर्ण परीक्षण: एक दोषपूर्ण विधि के अस्तित्व पर। अमेरिकन साइकोलॉजिस्ट, 56 , 16-26

क्रुएजर, जी (2017) रिवर्स आकलन एसओ लिलाइनफेल्ड एंड आईडी वाल्डमैन (एड्स।) में, जांच के तहत मनोवैज्ञानिक विज्ञान: हालिया चुनौतियों और प्रस्तावित समाधान (पीपी 110-124) न्यूयॉर्क, एनवाई: विले

क्रुएजर, जे। एंड क्लेमेंट, आरडब्ल्यू (1994)। कई श्रेणियों के बारे में मेमोरी-आधारित निर्णय: ताजफेल के अधिग्रहण सिद्धांत का एक संशोधन और विस्तार। व्यक्तित्व और सामाजिक मनोविज्ञान जर्नल, 67 , 35-47

क्रुएजर, जी, और हेक, पीआर (2017) अनुमानित सांख्यिकीय अनुमान में पी के अनुमानिक मूल्य। मनोविज्ञान में सीमावर्ती: शैक्षिक मनोविज्ञान [अनुसंधान विषय: सामाजिक विज्ञान में अनुसंधान के व्यावहारिक और नैतिक पहलुओं] https://doi.org/10.3389/fpsyg.2017.00908

सकलूक, जेके (2016) छोटे, बड़े की पुष्टि करना: संचयी और प्रतिकृति मनोवैज्ञानिक अनुसंधान को आगे बढ़ाने के लिए नए आंकड़ों के लिए एक वैकल्पिक प्रणाली। जर्नल ऑफ़ एक्सपेरिमेंटल सोशल साइकोलॉजी, 66 , 47-54

ताजफेल, एच। (1 9 6 9) पूर्वाग्रह के संज्ञानात्मक पहलू जर्नल ऑफ सोशल इश्यूज, 25 , 79-97

Intereting Posts