जहां ऑपरेंट कंडीशनिंग गलत हो गया था

ऑपरेंट कंडीशनिंग, बी.एफ. स्किनर का नामांकन सीखने के लिए नाम है: परिणामों से सीखना बिल्कुल नया विचार नहीं, बिल्कुल। मानवता हमेशा से ज्ञात है कि बच्चों और जानवरों को पुरस्कार और सजा के माध्यम से कैसे सिखाना है। स्किनर के लेबल को किनारे मिलाकर व्यक्तिगत जीवों में इस प्रकार की शिक्षा का अध्ययन करने की शानदार पद्धति का आविष्कार किया गया था। स्किनर बॉक्स और संचयी रिकॉर्डर एक अपराजेय जोड़ी थे।

JS image
स्रोत: जेएस छवि

ऑपरेटर कंडीशनिंग पहले से तेजी से उन्नत सुदृढीकरण के अनुसूचियों की खोज से अनसब्त नियमितताएं सामने आईं। प्रत्येक नए सुदृढीकरण कार्यक्रम संचयी रिकॉर्ड के एक नए पैटर्न को मिला: निश्चित अंतराल "स्कैलप", स्थिर अंतराल पर स्थिर प्रतिक्रिया और निश्चित-अनुपात कार्यक्रमों पर ब्रेक-एंड-रन। पैटर्न विश्वसनीय थे और जीव एक नई प्रक्रिया में बदल दिया गया था के बाद पुनर्प्राप्त किया जा सकता है। डेटा को अंदर-जीव प्रयोग प्रायोगिक पद्धति का पूरा शोषण करने की अनुमति दी गई: जानवरों के दो समूहों की तुलना करने के बजाय, एक ही जानवर के व्यवहार की तुलना में दो अलग-अलग प्रक्रियाओं के सामने उल्लिखित किया गया। समूह के परिणाम समूहों पर लागू होते हैं; वे एक समूह बनाने वाले व्यक्तियों पर लागू या लागू नहीं हो सकते हैं 2016 में, ब्रेटीट के 52% ब्रिटन्स को मंजूरी दे दी गई; लेकिन प्रत्येक व्यक्ति या तो 100% या 100% के खिलाफ था। सभी अक्सर शोधकर्ताओं ने मान लिया कि ग्रुप डेटा में चिकनी सीखने की अवस्था का मतलब है कि व्यक्तिगत विषयों को धीरे-धीरे सीखना चाहिए। वे नहीं करते।

प्राकृतिक अगले कदम संचयी रिकॉर्ड से पता चला आदेश के पीछे प्रक्रियाओं को सुलझाना होगा। अनुसूची प्रक्रिया और व्यक्तिगत जीव के बीच इस बातचीत में क्या चल रहा है जो इन हड़ताली नियमितताओं को जन्म देता है? दूसरे शब्दों में, जीव की शिक्षा क्या है और यह कैसे सीख रहा है? प्रक्रिया क्या है?

क्षेत्र इस कदम नहीं उठाया। इस नोट में मैं कोशिश करूँगा और इसकी व्याख्या क्यों करूंगा?

तीन चीजों ने एक ऑपरेटिंग कंडीशनिंग को विज्ञान के रूप में विकसित करने से रोक दिया है: विधि का एक सीमा, अधिक महत्व वाले आदेश और सिद्धांत का अविश्वास।

प्रक्रिया। संचयी रिकॉर्ड एक सम्मान में एक शानदार सफलता थी: वास्तविक समय में अध्ययन करने के लिए एक एकल जानवर के व्यवहार के अध्ययन की अनुमति दी गई थी। स्किनर तक, पशु मनोविज्ञान का आंकड़ा समूह की औसत श्रेणियों में शामिल था – उदाहरण के लिए, समूह X या Y में कितने जानवरों की चपेट में बाएं बना दिया। न केवल समूह में खो गए व्यक्तिगत जानवर थे, इसलिए वास्तविक समय थे- भूलभुलैया में चूहे कितने समय तक तय करने के लिए कितना समय लगा, कितनी तेज़ी से यह चल रहा था? यह निर्णय लेने से पहले क्या पता चला?

लेकिन स्किनर-बॉक्स सेटअप भी सीमित है – एक या कुछ पूर्व-निर्धारित प्रतिक्रियाओं के लिए और उनकी उपस्थिति की दर में परिवर्तन। वास्तव में ऑपरेटिंग कंडीशनिंग में गतिविधियों की एक प्रदर्शनों की सूची शामिल होती है: परीक्षण-और-त्रुटि का परीक्षण बिट स्किनर-बॉक्स पद्धति केवल एक या दो पहले से सीखा प्रतिक्रियाओं के अध्ययन को प्रोत्साहित करती है। प्रदर्शनों की सूची में, संभावित प्रतिक्रियाओं ("स्किनर के शब्दों में)" अन्य कारणों के लिए उत्सर्जित प्रतिक्रियाओं का यह सेट – उन सभी संभव तरीकों से जो कि सीमा से नीचे छिपते हैं, लेकिन उपलब्ध होने के लिए उपलब्ध हैं – इन गुप्त प्रतिक्रियाओं में, सहायक सामग्री सीखने के लिए बहुत आवश्यक है कोई जिक्र नहीं।

बहुत अधिक आदेश? दूसरी समस्या व्यवस्थित आंकड़ों के लिए एक अनपेक्षित सम्मान है: चिकनी घटता जो व्यवहार के सरल, नाभिकीय गुणों को माप सकता है। फ्रेड स्किनर ने अक्सर पावलोव का हवाला दिया: "अपनी परिस्थितियों को नियंत्रित करें और आप व्यवस्था देखेंगे।" लेकिन किस क्रम में? बस किसी भी आदेश के लायक हो रही है? या कुछ व्यवस्थित परिणाम शायद दूसरों की तुलना में अधिक जानकारीपूर्ण हैं?

आदेश प्राप्त करने का सबसे आसान तरीका, भिन्नता को कम करने के लिए, औसत लेना है। स्किनरियन प्रयोगों में एकल जानवर शामिल होते हैं, इसलिए विधि जानवरों के औसत में हतोत्साहित करती है। लेकिन उन सभी चोंच या लीवर प्रेस की औसत क्यों नहीं? स्किनर खुद को एक तर्क प्रदान करने के लिए लग रहा था। अपने कुछ सैद्धांतिक भ्रमणों में से उन्होंने प्रस्ताव दिया कि प्रतिक्रियाओं की प्रतिक्रिया की संभावना के बराबर ताकत है । उन्होंने इस विचार को वास्तव में कभी भी उचित नहीं ठहराया, लेकिन यह इतना सुगम है कि छोटे औचित्य की आवश्यकता हो।

अगले कदम महत्वपूर्ण था: कैसे प्रतिक्रिया संभावना को मापने के लिए? प्रतिक्रिया की दर एक स्पष्ट उम्मीदवार है लेकिन संचयी रिकॉर्ड दिखाते हैं कि सुदृढीकरण के अधिकांश कार्यक्रमों पर प्रतिक्रिया की दर क्षण से क्षण तक भिन्न होती है। निश्चित अंतराल पर, उदाहरण के लिए, विषयों प्रत्येक सुदृढीकरण के बाद सही जवाब देना बंद कर देते हैं और फिर अगले सुदृढीकरण दृष्टिकोण के लिए समय के रूप में धीरे-धीरे अधिकतम गति बढ़ाते हैं। एक निश्चित अंतराल शेड्यूल (FI) व्यवस्था करता है कि एक निश्चित समय के बाद पहली प्रतिक्रिया, इसे I कहते हैं, प्रबलित है बाद के सुदृढीकरण का समय एक विश्वसनीय संकेत है जब अगले पुरस्कार उपलब्ध होगा। ऑर्गेनाइजेशन तदनुसार अनुकूलित होता है, जवाब देने से पहले मैं समय के एक निश्चित अंश का इंतजार कर रहा हूं

लेकिन दूसरे समय में, चर-अंतराल (VI), समय चर है यदि यह क्षण से पूरी तरह से यादृच्छिक होता है और जीव स्थिर दर पर प्रतिक्रिया देता है, तो पोस्टरिनफोर्समेंट समय संभावना के बारे में कोई जानकारी नहीं देता है कि अगली प्रतिक्रिया का पुरस्कृत होगा। चरम अंतराल शेड्यूल पर एक अविश्वसनीय दर पर प्रतिक्रिया देकर संगठनों की जानकारी के अभाव में अनुकूल है। छठी की यह संपत्ति इसे एक स्पष्ट उपकरण बना दिया स्किनर की प्रतिक्रिया की ताकत को मापने का एक सरल तरीका प्रदान करने के लिए यह लगातार प्रतिक्रिया उत्पन्न करता है। इसलिए, ऑपरैंट मनोविज्ञान में सर्वाधिक व्यापक रूप से इस्तेमाल किए जाने वाले आंकड़े, एक छठी अनुसूची द्वारा निरंतर प्रतिक्रिया दर है। दर आमतौर पर प्रतिक्रियाओं की संख्या से मापा जाता है जो एक समय अवधि या घंटों में होती है।

परिवर्तनशीलता को कम करने का दूसरा तरीका नकारात्मक प्रतिक्रिया है एक थर्मोस्टैटिक रूप से नियंत्रित एचवीएसी सिस्टम गरम होता है, जब तापमान नीचे एक प्रीसेट स्तर से नीचे गिर जाता है, और जब यह ऊपर बढ़ता है तब ठंडा होता है। इस तरह से यह घर के तापमान में भिन्नता को कम कर देता है जो अन्यथा तापमान के बाहर होता है। किसी भी प्रकार की नकारात्मक प्रतिक्रिया नियंत्रित चर में भिन्नता कम हो जाएगी। दुर्भाग्य से, प्रतिक्रिया को और अधिक प्रभावी, निर्भर चर में जितना कम होता है और कम हम फीडबैक तंत्र के बारे में ही सीख सकते हैं। एकदम सही नकारात्मक प्रतिक्रिया प्रक्रिया अदृश्य है

परिचालित कंडीशनिंग, परिभाषा के अनुसार, प्रतिक्रिया प्राप्त करने के बाद से प्राप्त किए गए पुरस्कारों की प्रतिक्रियाओं पर निर्भर करता है। अधिक जीव प्रतिक्रिया करता है, जो अधिक इनाम मिलता है – जो कुछ भी सुदृढीकरण कार्यक्रम की बाधाओं के अधीन होता है, वह प्रभाव में है। यह सकारात्मक प्रतिक्रिया है लेकिन सबसे अधिक अध्ययन योग्य ऑपरेटिंग पसंद प्रक्रिया – समवर्ती चर-अंतराल शेड्यूल – इसमें नकारात्मक प्रतिक्रिया भी शामिल है। जब विकल्प दो वैरिएबल-अंतराल शेड्यूल के बीच होता है, तो अधिक समय एक विकल्प पर खर्च होता है, दूसरे को स्विच करने के लिए भुगतान की अधिक संभावना। तो विकल्पों के लिए अदायगी दरों में कोई फर्क नहीं पड़ता, जीव केवल एक पर फिक्स नहीं करेगा। परिणाम पसंद वरीयता और रिश्तेदार अदायगी के बीच एक बहुत ही नियमित संबंध है – मिलान कानून । (पूरी तकनीकी कहानी के लिए, अनुकूली व्यवहार और सीखना, 2016 देखें)

प्रौद्योगिकी के रूप में उन्नत, इन दो चीजें एकजुट हुईं: ऑर्डर की इच्छा, औसत और नकारात्मक प्रतिक्रिया से सक्षम और स्किनर का विचार है कि प्रतिक्रिया की संभावना उचित है – उपयुक्त-निर्भर चर परिवर्तनीय-अंतराल शेड्यूल अकेले या दो-विकल्प वाली स्थितियों में, एक तरह का मापने वाला उपकरण बन गया। छठी प्रतिक्रिया दर स्थिर है – कोई इंतजार नहीं करता है, विराम देता है या अचानक स्पाइक यह प्रतिक्रिया की संभावना को मापने के लिए एक सरल और प्रत्यक्ष तरीका प्रदान करता था। प्रतिक्रिया की दर से प्रतिक्रिया की सैद्धांतिक विचार की संभावना के रूप में किसी तरह प्रतिक्रिया शक्ति के बराबर था, लेकिन एक छोटा कदम है। इस प्रकार मिलान करने वाला कानून सामान्य सिद्धांत के रूप में माना जाता था। शोधकर्ताओं ने इसे केवल पशु पसंद नहीं बल्कि वास्तविक जीवन परिस्थितियों में मनुष्य के चुनाव व्यवहार को अंतर्निहित के रूप में देखना शुरू किया।

थ्योरी रेस्पॉन्स ताकत एक सैद्धांतिक निर्माण है। यह प्रतिक्रिया की दर से कहीं बेहतर है या वास्तव में किसी भी अन्य सीधे मापने योग्य मात्रा दुर्भाग्य से, अधिकांश लोग सोचते हैं कि वे जानते हैं कि उनका क्या मतलब है "ताकत" स्किनरियन परंपरा ने यह देखना मुश्किल बना दिया था कि अधिक की आवश्यकता है

जॉर्ज रेनॉल्ड्स द्वारा एक मील का पत्थर 1 9 61 का अध्ययन इस समस्या को दिखाता है (हालांकि जॉर्ज ने इसे इस तरह कभी नहीं देखा) यहां एक सरलीकृत संस्करण है: दो प्रयोगात्मक स्थितियों और दो समान कबूतरों की कल्पना करो। प्रत्येक स्थिति कई दैनिक सत्रों के लिए चलती है कंडीशन ए में, कबूतर एक छठी 30 के अनुसूची पर वितरित किए गए खाद्य इनाम के लिए एक लाल कुंजी को चोंचता है कंडीशन बी में, कबूतर बी छठे 15 के अनुसूची पर वितरित किए गए खाद्य इनाम के लिए एक हरे रंग की कमान लगाता है। चूंकि प्रक्रिया की लंबी अवधि के बाद दोनों खाने की दरें अपेक्षाकृत अधिक होती हैं, इसलिए कबूतर दोनों ही मामलों में उच्च दर से चोंचेंगे: प्रतिक्रिया दर – इसलिए 'ताकत' – लगभग एक ही होगा अब दोनों कबूतरों के लिए प्रक्रिया को बदल दें सिंगल शेड्यूल के बजाय, दो घंटे के लिए वैकल्पिक, एक मिनट या प्रत्येक के लिए, एक घंटे के प्रायोगिक सत्र में। जोड़ा कबूतरों के लिए दूसरा अनुसूची एक समान है: छठी 15 एस, एक पीले रंग की कुंजी (इस तरह से दो सिग्नल अनुसूचियां बदलकर कई बार शेड्यूल कहा जाता है) द्वारा सिग्नल किया गया। इस प्रकार, कबूतर ए, एक विशाल VI 15, 15 (हरे और पीले उत्तेजनाओं) पर एक छत्तीस 30 छः 15 (लाल और पीले उत्तेजना) और कबूतर बी पर है। संक्षेप में, दो प्रयोगात्मक स्थितियां (प्रेरक रंग () में हैं):

प्रयोग A: VI 30 (लाल); बहु 60 (लाल) छठी 15 (पीला)

प्रयोग बी: छठी 15 (ग्रीन); बहु VI 15 (ग्रीन) VI 15 (पीला)

अब प्रत्येक कबूतर के लिए दूसरी स्थिति देखें अशुभ, हरे रंग की बी की प्रतिक्रिया दर में परिवर्तन नहीं होगा। उसके लिए जो कुछ भी बदल गया है वह चाबी का रंग है – हरे रंग से हर समय से हरे और पीले रंग की बारी में, दोनों ही भुगतान के साथ। लेकिन ए की प्रतिक्रिया दर, लाल छड़ी 30 उत्तेजनाओं में बहुत अधिक उदास हो जाएगी, और ए के पीले रंग की प्रतिक्रिया की दर बी की पीली प्रतिक्रिया दर से काफी अधिक होगी, भले ही VI 15 के अनुसूची दोनों में समान हो। कबूतर ए द्वारा पीले उत्तेजना में प्रतिक्रिया देने पर प्रभाव, जब किसी दिए गए अनुसूची को पतला एक के साथ बदल दिया जाता है तो प्रतिक्रिया की दर में वृद्धि को सकारात्मक व्यवहार के विपरीत कहा जाता है और कबूतर A के लिए पतला अनुसूची में दर में कमी नकारात्मक विपरीत है

पहली स्थिति में लाल और हरे रंग की उत्तेजनाओं की उपस्थिति में और बी का जवाब बहुत ही समान है और इसलिए दो प्रतिक्रियाओं की ताकत होनी चाहिए। लेकिन वैकल्पिक पीले उत्तेजना को जोड़ने का बहुत ही अलग प्रभाव, दूसरी हालत में दो जानवरों पर, अमीर शेड्यूल पर भुगतान किया गया, जो यह दर्शाता है कि ऐसा नहीं है।

आम सहमति है कि प्रतिक्रिया दर एक ऑपरेटेंट प्रतिक्रिया की 'ताकत' का पर्याप्त उपाय है गलत है VI अनुसूचियों द्वारा बनाए गए स्थिर दर भ्रामक है। यह शक्ति का सरल उपाय दिखता है आदेश पर स्किनर के जोर के कारण, क्योंकि औसत-प्रतिक्रिया और प्रतिक्रिया-समृद्ध समवर्ती चर-अंतराल अनुसूची इसे प्रदान करना प्रतीत होता था और क्योंकि प्रतिक्रिया की प्रतिक्रिया के साथ प्रतिक्रिया की संभावना को समान बनाना आसान था, इस विचार ने रूट फिर भी 1 9 50 के दशक में, यह अच्छी तरह से ज्ञात था कि उत्तरदायित्व की दर को ही हेरफेर किया जा सकता है – उदाहरण के लिए तथाकथित अंतर-सुदृढीकरण-की-कम दर (डीआरएल) समय-सारिणी।

निष्कर्ष दो कारक – स्किनर के एकल-जीव पद्धति और आदेश के लिए इच्छा – प्रतिक्रिया दर को ऑपरेटेंट कंडीशनिंग में प्राथमिक भूमिका देने के लिए साजिश रची। दर प्रतिक्रिया शक्ति का एक उपाय माना गया था लेकिन एक तीसरा पहलू, सिद्धांत के प्रति तिरस्कार का मतलब था कि इस संबंध को कभी अधिक जांच नहीं की गई थी। यह निश्चित रूप से झूठा है: प्रतिक्रिया दर प्रतिक्रिया की शक्ति के बराबर नहीं है। दरअसल, शक्ति की अवधारणा ही बीमार-परिभाषित है इसलिए, निर्भर चर के रूप में प्रतिक्रिया की दर पर फ़ील्ड का जोर शायद एक गलती है। यदि ताकत का विचार दर के निधन के रूप में सबसे अच्छा उपाय के रूप में जीवित रहना है, तो इसके लिए कुछ और जरूरी है: कारक के बारे में एक सिद्धांत जो ऑपरेटर प्रतिक्रिया को नियंत्रित करता है। लेकिन क्योंकि स्किनर ने सफलतापूर्वक घोषणा की थी कि सीखने के सिद्धांत आवश्यक नहीं हैं , एक पर्याप्त सिद्धांत कई वर्षों तक आने वाला नहीं था (स्किनरियन सिद्धांत के इतिहास के बारे में अधिक जानकारी के लिए, नया व्यवहार, 2014 देखें)।

Intereting Posts
वैलेंटाइन्स दिवस: इस रिश्ते को चुनौती दें! आप के बारे में सुना मत कैसे एक आदमी का सबसे अच्छा दोस्त सिर्फ एक साथी से अधिक है मैं अमीर कैसे प्राप्त करूं? वित्तीय समस्या के प्रति आपका उत्तर कैंसर स्क्रीनिंग और प्राकृतिक आपदा: एक समान बहस आपका कोर जोखिम क्या है? ओकक्यूपिड की कोशिश करें यदि आप एक पॉलिमर वेलेंटाइन की तलाश कर रहे हैं क्यों दौड़ पर बातचीत अक्सर व्यर्थ हैं? 3 चिंताओं आपके बच्चे में सीखना विकलांग है कैसे ईर्ष्यापूर्ण पार्टनर मॉनीटर और मैनिप्लेट करने के लिए फेसबुक का उपयोग करते हैं यातना काम करता है? सिंक्रनाइनिसिस सिग्नल लव पल या ब्रेकथ्रूज लोकप्रियता के अनुसार सूची रैंकिंग नस्लों अब उपलब्ध है क्रोध का जुनून एक रचनात्मक तरीके से इस्तेमाल किया जा सकता है सुपर बाउल क्या आप पर एक टोल ले रहा है?