बर्थडे हैप्पी बर्थडे अल्फाजो

मशीन इंटेलिजेंस एंड कॉग्निटिव साइकोलॉजिकल साइंस

चलो अल्फाज़ो से मिलते हैं

अल्फाजेरो डीपमाइंड द्वारा विकसित एक मशीन लर्निंग प्रोग्राम है जिसने बिना किसी मानव मार्गदर्शन के गहन शिक्षण के माध्यम से रचनात्मक शतरंज खेलने में अंतर्दृष्टि हासिल की है। यह अब दुनिया का सबसे मजबूत शतरंज, जापानी शतरंज (शोगी) और गो प्लेयर है, जो लगातार बेहतरीन मानव खिलाड़ियों और सर्वश्रेष्ठ शतरंज इंजनों को हरा रहा है। मैं इसे जन्मदिन की शुभकामना क्यों दूंगा? मेरा मतलब है कि मैं इसके जन्म के बारे में क्यों बधाई दूंगा? संक्षिप्त उत्तर यह है कि ऐसा इसलिए है क्योंकि मुझे हाल ही में पता चला है कि अल्फाज़ेरो ने अक्टूबर 2017 के दौरान अंतर्दृष्टि प्राप्त की और इस तरह मेरे विचार में वास्तव में बुद्धिमान बन गया। इसलिए मेरे जन्मदिन की हार्दिक शुभकामनाएं।

इनसाइट शब्द का मेरा उपयोग निम्नलिखित न्यू यॉर्क टाइम्स द्वारा 12/26/18 को रिपोर्टिंग के लिए प्रेरित किया गया था: “सबसे अधिक अनावश्यक यह था कि अल्फाज़ेरो अंतर्दृष्टि को व्यक्त करने के लिए लग रहा था। यह एक कंप्यूटर की तरह खेला, सहज और खूबसूरती से, एक रोमांटिक, हमलावर शैली के साथ। इसने जुआ खेला और जोखिम लिया ”। Google “परिभाषित: अंतर्दृष्टि” आदेश निम्न प्राथमिक परिभाषा देता है: “किसी व्यक्ति या चीज़ की सटीक और गहरी सहज समझ प्राप्त करने की क्षमता।” अंतर्दृष्टि के लिए समानार्थी शब्द में शामिल हैं: अंतर्ज्ञान, धारणा, जागरूकता, समझ, समझ, समझ। , प्रशंसा, तीक्ष्णता और सूक्ष्मता। अंतर्दृष्टि की एक माध्यमिक परिभाषा “किसी व्यक्ति या चीज़ की गहरी समझ है।” ये वास्तव में बुद्धिमान इकाई के गुण हैं।

मैथ्यू सैंडलर और नताशा रेगन दोनों अंग्रेजी शतरंज के स्वामी हैं। उन्होंने शतरंज में न्यू द्वारा प्रकाशित गेम चेंजर नामक एक पुस्तक लिखी है, जिसमें वे शतरंज और गो के खेल में अंतर्दृष्टि का विश्लेषण करते हैं कि अल्फ़ाज़ेरो बिना किसी मानव मार्गदर्शन के अपने दम पर विकसित हुआ। उन्होंने कहा कि अल्फ़ाज़ेरो ने खुद से शतरंज खेलना सीखते हुए अच्छी तरह से ज्ञात उद्घाटन और रणनीतियों की खोज की। उन्होंने कहा कि इसने नई, प्रभावशाली रचनात्मक दीर्घकालिक रणनीतियाँ भी विकसित कीं क्योंकि यह मानव प्रोग्रामर द्वारा प्रदान की गई पारंपरिक ज्ञान से विवश नहीं था। यहां हमारे पास भव्य स्वामी हैं जो उन अंतर्दृष्टिओं की प्रशंसा करते हैं जो अल्फ़ाज़ेरो ने अपने दम पर हासिल की हैं। कोई यह तर्क दे सकता है कि अल्फ़ाज़ेरो नई अंतर्दृष्टि प्राप्त करने में सक्षम था क्योंकि पारंपरिक मानव ज्ञान को रोक दिया गया था, जिससे अल्फ़ाज़ेरो को मानव पूर्वाग्रह से मुक्त किया गया था। अंतर्दृष्टि प्राप्त करने की क्षमता वास्तव में एक बुद्धिमान मानव विशेषता है। ऐसी क्रांतिकारी और उल्लेखनीय बुद्धिमत्ता का “जन्म” सम्मानजनक मान्यता का हकदार है। इसलिए, मैं अल्फ़ाज़ेरो को एक जन्मदिन की शुभकामना देता हूँ!

generalizability

सामान्यता वैधता की परीक्षा है। पारंपरिक नियम-आधारित कृत्रिम बुद्धिमत्ता (एआई) कार्यक्रमों के लिए सामान्यता लंबे समय से एक बड़ी समस्या रही है। उनकी उपलब्धियों को बहुत विशिष्ट कार्यों तक सीमित कर दिया गया है। नियम-आधारित कार्यक्रम अत्यधिक विशिष्ट हैं और केवल वही कर सकते हैं जो वे विशेष रूप से करने के लिए प्रोग्राम किए गए थे। वे संबंधित समान कार्यों के लिए सामान्यीकरण नहीं करते हैं क्योंकि वे अपने दम पर नहीं सीख सकते हैं। वे मनुष्यों को अतिरिक्त नए नियमों के साथ प्रदान करने की प्रतीक्षा करते हैं।

अपने आप को शतरंज, शोगी और गो को पढ़ाने से, अल्फाज़ेरो ने प्रदर्शित किया है कि यह सुदृढीकरण सीखने के माध्यम से अपने दम पर नए ज्ञान की खोज कर सकता है। अपने आप सीखकर सामान्यीकरण करने की यह क्षमता एक उल्लेखनीय उपलब्धि है। अपने आप सीखना सच्ची बुद्धिमत्ता की पहचान है। यह क्षमता यकीनन नियम-आधारित AI पर मस्तिष्क-आधारित AI की श्रेष्ठता स्थापित करती है। आगे का विवरण उपलब्ध है।

एक अन्य डीपमाइंड प्रोजेक्ट, एक प्रोग्राम, जिसे अल्फाफोल्ड कहा जाता है, एक असाधारण जटिल समस्या को हल करने के लिए गहन सीखने वाले मस्तिष्क-आधारित तंत्रिका नेटवर्क एआई दृष्टिकोण का उपयोग करता है, जिसमें अब तक वैज्ञानिक शामिल हैं। मैं यह समझने का उल्लेख करता हूं कि प्रोटीन कैसे मोड़ते हैं। शरीर के अंदर प्रोटीन तीन आयामी संरचनाओं में कैसे बदल जाता है, यह निर्धारित करता है कि वे नई दवाओं सहित अन्य अणुओं से कैसे बंधेंगे। यह ज्ञान उन प्रभावों को समझने और भविष्यवाणी करने की कुंजी है जो नई दवाओं के पास होंगे। अल्फाफोल्ड अब इस प्रक्रिया को समझने में प्रगति कर रहा है।

इस ब्लॉग के शेष भाग में कुछ बुनियादी नेटवर्क सिद्धांतों को प्रदान करने से पहले मस्तिष्क-आधारित मनोवैज्ञानिक मॉडल के साथ मन-आधारित मनोवैज्ञानिक मॉडल हैं जो हमें बेहतर तरीके से समझने में सक्षम करते हैं कि अल्फ़ाज़ेरो और अल्फ़ाफोल्ड जैसी गहरी सीखने वाली कनेक्शन मशीन कैसे काम करती हैं।

ब्रेन-बेस्ड बनाम माइंड-बेस्ड मॉडल्स

मन-आधारित मॉडल

मनोविज्ञान प्राकृतिक दर्शन की एक शाखा के रूप में शुरू हुआ जहां मानव व्यवहार की मन-आधारित व्याख्या आत्मनिरीक्षण से ली गई थी। पारंपरिक संज्ञानात्मक मनोवैज्ञानिकों ने अपने दृष्टिकोण से इस अभ्यास को जारी रखा है कि लोग सीखते हैं और व्यवहार करते हैं क्योंकि मन नियमों का पालन करता है जो प्रतीक हेरफेर को नियंत्रित करते हैं। साक्ष्य कि यह सिद्धांत गलत है, विशेषज्ञों से उन नियमों के बारे में पूछकर प्राप्त किया जा सकता है जो वे काम करते समय करते हैं। विशेषज्ञ आमतौर पर स्वीकार या रिपोर्ट नहीं करते हैं कि वे किसी भी प्रकार के नियमों का पालन करते हैं जैसे वे काम करते हैं। जब वे नौसिखिए थे, तो उन्होंने नियमों का पालन किया हो सकता है, लेकिन जब वे विशेषज्ञ बन गए, तो वे नियम-पालन से परे चले गए। लेकिन कई संज्ञानात्मक मनोवैज्ञानिक कार्य करते रहते हैं जैसे कि लोग हमेशा नियमों का पालन करते हैं जब वे सोचते हैं और व्यवहार करते हैं। यह मानने के लिए कि कोई चीज़ सच है जब वह पेशेवर रूप से सुविधाजनक नहीं हो सकती है, लेकिन ऐसा करना बहुत सफल नहीं रहा है जैसा कि हम आगे देखेंगे।

नियम-आधारित प्रतीक हेरफेर दृष्टिकोण ने कृत्रिम बुद्धि बनाने के लिए प्रारंभिक प्रयासों की विशेषता बताई। उदाहरण के लिए, कंप्यूटर को एक बार शतरंज खेलने के लिए बहुत सारे नियमों के साथ प्रोग्राम किया गया था, लेकिन उन्होंने कभी बहुत अच्छा नहीं किया। कंप्यूटर को तस्वीरों या वीडियो से लोगों की पहचान करने के लिए बहुत सारे नियमों के साथ प्रोग्राम किया गया था, लेकिन उन्होंने इससे भी अच्छा प्रदर्शन किया और वे वास्तविक समय में ऐसा नहीं कर सके। नियम-आधारित दृष्टिकोण की सीमाएं प्रकट होती हैं, लेकिन कई संज्ञानात्मक मनोवैज्ञानिक नियमों और नियम-पालन के संदर्भ में मानव व्यवहार की व्याख्या करना जारी रखते हैं क्योंकि उन्होंने हमेशा ऐसा किया है और क्योंकि यह उनके कंप्यूटर रूपक का समर्थन करता है। वे कंप्यूटर हार्डवेयर की तरह काम करने के लिए मस्तिष्क को समझते हैं और कंप्यूटर सॉफ्टवेयर की तरह संचालित करने के लिए मन जिसमें कंप्यूटर प्रोग्राम जैसे नियम होते हैं जो लोगों के सोचने, महसूस करने और व्यवहार करने के तरीके को नियंत्रित करते हैं।

ये वही संज्ञानात्मक मनोवैज्ञानिक एज़्ज़ेरो जैसी गहरी सीखने की प्रणालियों की उपलब्धियों की प्रशंसा करते हैं, लेकिन वे उन पर भरोसा नहीं करते हैं क्योंकि वे समझ नहीं सकते हैं कि वे कैसे सोचते हैं क्योंकि वे प्रतीक या रूप उत्पन्न नहीं करते हैं और नियमों का पालन करते हैं जैसा कि हम सामान्य रूप से समझते हैं। इसलिए, अल्फाज़ेरो इन संज्ञानात्मक मनोवैज्ञानिकों के साथ उन तरीकों से संवाद नहीं कर सकता है जो वे समझते हैं। यहाँ समस्या यह है कि अल्फ़ाज़ो दिमाग की तरह सीखता है, न कि दिमाग की तरह कहा जाता है। अल्फाज़ो कैसे सोचता है, यह समझने का एक नया तरीका यह समझने के लिए प्रासंगिक है कि मस्तिष्क कैसे काम करता है। इस नए दृष्टिकोण का उपयोग तंत्रिका नेटवर्क मॉडल के आधार पर संज्ञानात्मक मनोविज्ञान को समझने के लिए भी किया जा सकता है।

मस्तिष्क आधारित मॉडल

कनेक्शनल न्यूरल नेटवर्क मॉडल, जिसे न्यूरल नेटवर्क, डीप लर्निंग, और मशीन इंटेलिजेंस के रूप में भी जाना जाता है, को रेखांकित करते हैं और बताते हैं कि अल्फा शून्य कैसे काम करता है। ये मॉडल संज्ञानात्मक मनोविज्ञान की व्याख्या करने के लिए एक मस्तिष्क-आधारित दृष्टिकोण लेते हैं। मैकलेलैंड और रोमेलहार्ट और रोमेलहार्ट और मैकलेलैंड ने 1986 में अपने सेमिनल कार्यों को प्रकाशित किया, क्योंकि मैंने 2014 में संज्ञानात्मक तंत्रिका विज्ञान और मनोचिकित्सा: नेटवर्क सिद्धांतों के लिए मेरी पुस्तक में मनोविज्ञान के लिए एक मस्तिष्क-आधारित कनेक्शन तंत्रिका नेटवर्क व्याख्यात्मक दृष्टिकोण प्रकाशित किया। सिद्धांत । यह 1986 के बाद के दशकों में हुए विकास को दर्शाता है।

तंत्रिका नेटवर्क मॉडल में तीन या अधिक परतों से जुड़े प्रसंस्करण नोड्स होते हैं जिनमें समान कार्यात्मक गुण होते हैं जो वास्तविक न्यूरॉन्स होते हैं। उदाहरण के लिए, प्रत्येक कृत्रिम न्यूरॉन कई अन्य कृत्रिम न्यूरॉन्स से इनपुट प्राप्त करता है जैसे कि असली न्यूरॉन्स करते हैं। प्रत्येक कृत्रिम न्यूरॉन इन इनपुटों को लिखता है और एक आउटपुट उत्पन्न करता है यदि उनके इनपुटों का योग वास्तविक न्यूरॉन्स की तरह एक सीमा राशि से अधिक हो।

कृत्रिम न्यूरॉन्स एक दूसरे से जुड़े हुए सिंटैप्स से जुड़े होते हैं जिन्हें कनेक्शन वेट कहा जाता है। ये भार शुरू में छोटे यादृच्छिक मूल्यों पर सेट होते हैं। सीखने और याददाश्त सीखने के परीक्षणों पर इन भारों को धीरे-धीरे समायोजित करके होती हैं। अंतिम परिणाम एक नेटवर्क है जहां प्रसंस्करण नोड्स को विचार के तहत कार्यों के लिए इष्टतम भार के साथ जोड़ा जाता है। कनेक्शन वजन कनेक्शनवादी तंत्रिका नेटवर्क मॉडल की कार्यक्षमता के लिए इतना केंद्रीय है कि कनेक्शन कनेक्शन शब्द को अक्सर छोड़ दिया जाता है। कनेक्शनवादी तंत्रिका नेटवर्क सिस्टम इस तरह से कार्य कर सकते हैं जैसे कि वे नियमों का पालन कर रहे हैं, लेकिन वे कभी भी नियम नहीं बनाते हैं या उनका पालन नहीं करते हैं जैसा कि हम आम तौर पर उन्हें समझते हैं और वे निश्चित रूप से प्रतीकों को उत्पन्न नहीं करते हैं। अगले खंड में अतिरिक्त विवरण प्रदान किए गए हैं।

ब्रेन-बेस्ड मॉडल्स को समझना

मुझे लगता है कि अल्फ़ाज़ेरो और अन्य गहन शिक्षण कृत्रिम बुद्धिमत्ता द्वारा उपयोग किए जाने वाले तंत्रिका नेटवर्क सिस्टम को समझने का सबसे अच्छा तरीका उन सिद्धांतों को समझना है जो उन्हें नियंत्रित करते हैं। इन नेटवर्क सिद्धांतों को तंत्रिका नेटवर्क गुण के रूप में भी समझा जा सकता है। अब मैं इनमें से चार सिद्धांतों / गुणों की चर्चा करता हूं। अन्य हैं लेकिन ये चार मौलिक हैं और आपको आरंभ करना चाहिए। अधिक जानकारी के लिए ट्रायटन (2012, 2014) देखें।

सिद्धांत / संपत्ति 1: वास्तुकला

वास्तविक दिमाग की तंत्रिका वास्तुकला उनके कार्य के लिए महत्वपूर्ण है। उदाहरण के लिए, सेरिबैलम में विशेष सर्किट्री होती है जो इसे हमारी मांसपेशियों को तेजी से नियंत्रित करने में सक्षम बनाती है ताकि हम चल सकें, दौड़ सकें और खेल खेल सकें। इसी तरह, कृत्रिम तंत्रिका नेटवर्क की वास्तुकला महत्वपूर्ण है कि वे कैसे कार्य करते हैं। उदाहरण के लिए, तंत्रिका नेटवर्क, जिसमें सिर्फ दो परतें होती हैं, जिन्हें परसेप्ट्रॉन कहा जाता है, कुछ तार्किक समस्याओं को हल नहीं कर सकते हैं। तीन या अधिक परतों वाले नेटवर्क सभी तार्किक समस्याओं को हल कर सकते हैं। गणितीय प्रमाण मौजूद है कि बहुपरत तंत्रिका नेटवर्क संभावित रूप से सभी प्रकार की समस्याओं को हल कर सकते हैं। इस दावे के गणितीय प्रमाण के लिए हॉर्निक, स्टाइनकोम्बे और व्हाइट (1989, 1990) देखें।

सिद्धांत / संपत्ति 2: नेटवर्क कैस्केड: अचेतन प्रसंस्करण

कृत्रिम न्यूरॉन्स द्वारा कृत्रिम न्यूरॉन्स पर किए गए सक्रियणों का वर्णन नीचे दिए गए तरीके से किया जाता है, जो यह दर्शाता है कि वास्तविक न्यूरॉन्स द्वारा वास्तविक मस्तिष्क नेटवर्क में कैस्केड द्वारा उत्पन्न गतिविधियां कैसे होती हैं। अधिकांश मस्तिष्क प्रसंस्करण अनजाने में होता है। प्रसिद्ध हिमशैल सादृश्य इन घटनाओं को सटीक रूप से दर्शाता है। एक हिमखंड का नब्बे प्रतिशत हिस्सा पानी के नीचे होता है, और अचेतन मस्तिष्क प्रसंस्करण के लिए आनुपातिक होता है। एक हिमखंड का दस प्रतिशत जो पानी के ऊपर होता है, वह मस्तिष्क के प्रसंस्करण के लिए आनुपातिक होता है। आगे के विवरण के लिए कोहेन, डनबर और मैकलेलैंड (1990) देखें।

निम्न आंकड़ा दिखाता है कि नेटवर्क कैस्केड कैसे काम करता है। यह एक बहुत ही सरल नेटवर्क है लेकिन इस पृष्ठ पर फिट होने के लिए आवश्यक है। तीन मंडलियों की शीर्ष परत तीन इनपुट न्यूरॉन्स का अनुकरण करती है। उन्हें संवेदी न्यूरॉन्स के रूप में समझा जा सकता है। सर्कल के अंदर संख्या “1” इंगित करता है कि नकली न्यूरॉन सक्रिय है। संख्या “0” इंगित करता है कि नकली न्यूरॉन निष्क्रिय है। साथ में, वे इस प्रणाली के तीन इनपुटों को परिभाषित करते हैं: 1, 0, 1।

Warren W. Tryon

इलस्ट्रेटिव न्यूरल नेटवर्क

स्रोत: वॉरेन डब्ल्यू। ट्रेटन

अगली दो परतों में सिम्युलेटेड न्यूरॉन्स की “ऑन”, “ऑफ” स्थिति को असाइन किए जाने के बजाय गणना की जाती है। तीन बक्से के तीन सेट की दूसरी परत सिंकैप्स का अनुकरण करती है जो शीर्ष परत, इनपुट परत में सिम्युलेटेड न्यूरॉन्स को जोड़ती है, तीसरी परत में तीन अतिरिक्त सिम्युलेटेड न्यूरॉन्स के साथ। दूसरी पंक्ति में तीन बक्सों का बायाँ हाथ सेट सिम्युलेटेड सिंकैप्स का प्रतिनिधित्व करता है, जो तीसरी पंक्ति में सभी तीन सिम्युलेटेड न्यूरॉन्स के साथ बाएँ हाथ के नकली न्यूरॉन को शीर्ष पंक्ति में जोड़ता है। दूसरी पंक्ति में तीन बक्से का मध्य सेट तीसरी पंक्ति में सभी तीन सिम्युलेटेड न्यूरॉन्स के साथ मध्य पंक्ति में मध्य सिम्युलेटेड न्यूरॉन को जोड़ता है। दूसरी पंक्ति में तीन बक्से के दाहिने हाथ का सेट सिम्युलेटेड सिंकैप्स का प्रतिनिधित्व करता है जो दाहिने हाथ के नकली न्यूरॉन को तीसरी पंक्ति में सभी तीन सिम्युलेटेड न्यूरॉन्स के साथ जोड़ते हैं। सकारात्मक प्रविष्टियाँ उत्तेजना का अनुकरण करती हैं। नकारात्मक प्रविष्टियाँ निषेध का अनुकरण करती हैं। इन मूल्यों को कनेक्शन वेट कहा जाता है क्योंकि वे दो सिम्युलेटेड न्यूरॉन्स के बीच कनेक्शन की ताकत निर्दिष्ट करते हैं। वर्तमान मूल्यों को एक दो तरीकों से सोचा जा सकता है। एक संभावना यह है कि वे स्टार्टअप पर बेतरतीब ढंग से असाइन किए गए पहले मूल्य हैं। एक और संभावना यह है कि वे एक मनमाना प्रसंस्करण कदम पर नेटवर्क की स्थिति को दर्शाते हैं।

तीसरी परत में तीन सिम्युलेटेड न्यूरॉन्स के = 1, ऑफ = 0 राज्यों को सौंपा के बजाय गणना की जाती है। मैं अब प्रासंगिक गणनाओं का विस्तार करता हूं। ध्यान दें कि तीसरी पंक्ति में तीन सिम्युलेटेड न्यूरॉन्स में से प्रत्येक में तीन इनपुट हैं; पहली पंक्ति में प्रत्येक नकली न्यूरॉन्स में से एक। ये इनपुट भेजने वाले न्यूरॉन की स्थिति के बराबर हैं, 1 यदि सक्रिय, 0 यदि निष्क्रिय है, तो कनेक्शन का वजन निम्नानुसार है। तीसरी परत 1 (.1) + 0 (-। 2) + 1 (.3) = = 4 में बायें हाथ के न्यूरॉन के इनपुट। इस परिणाम की तुलना एक सीमा से की जाती है जो इस मामले में शून्य है लेकिन कुछ अन्य मूल्य हो सकता है। यदि इनपुट का योग शून्य से अधिक है, तो सकारात्मक है, जैसा कि इस मामले में है, तो प्राप्त सिम्युलेटेड न्यूरॉन, बाएं हाथ एक इस मामले में, सक्रिय हो जाता है या सक्रिय रहता है यदि यह पहले सक्रिय था, जैसा कि अंदर 1 द्वारा इंगित किया गया है। तीसरी परत में बाएं हाथ के सिम्युलेटेड न्यूरॉन का प्रतिनिधित्व करने वाला सर्कल। क्योंकि शून्य समय कुछ भी शून्य है, कई इनपुट का योग कनेक्शन के वजन को सक्रिय सिम्युलेटेड भेजने वाले न्यूरॉन्स के साथ बराबर करता है।

तीसरी पंक्ति में मध्य सिम्युलेटेड न्यूरॉन के इनपुट 1 (.3) + 0 (.1) + 1 (.2) = = 5 हैं जो सकारात्मक होते हुए इस सिम्युलेटेड न्यूरॉन को उसके सर्कल में नंबर 1 द्वारा दर्शाया गया है। तीसरी पंक्ति में दाहिने सिम्युलेटेड न्यूरॉन के इनपुट 1 (- 1) + 0 (.3) + 1 (1 – 3) = -4 हैं जो नकारात्मक रूप से इस सिम्युलेटेड न्यूरॉन को निष्क्रिय कर देता है, यदि यह पहले था तो इसे बंद कर देता है। जैसा कि इसके सर्कल में 0 नंबर से संकेत मिलता है।

पांचवीं पंक्ति में दो सिम्युलेटेड गणना किए गए न्यूरॉन्स की स्थिति को तीसरी पंक्ति में तीन न्यूरॉन्स की गणना की गई अवस्थाओं और चौथी पंक्ति के बक्से में सिम्युलेटेड सिंकैप्स, कनेक्शन वेट द्वारा नियंत्रित किया जाता है। पांचवीं पंक्ति में बाएं हाथ का नकली न्यूरॉन निष्क्रिय हो जाता है क्योंकि इसके 1 (- 2) + 1 (- 2) + 0 (.4) = -4 के इनपुट का योग ऋणात्मक है और इसलिए शून्य की दहलीज से नीचे है। । पांचवीं पंक्ति में दाहिना हाथ नकली न्यूरॉन सक्रिय हो जाता है क्योंकि इसके 1 (.2) + 1 ((.1) + 0 (.3) = .3 के इनपुट का योग सकारात्मक है और इसलिए शून्य की सीमा से अधिक है।

शीर्ष, इनपुट, परत में सिम्युलेटेड न्यूरॉन्स की सक्रियता को शेष सिम्युलेटेड न्यूरॉन्स के सिम्युलेटेड सिंकैप्स के पार कैस्केड करने के लिए कहा जाता है। यह प्रक्रिया स्वचालित और नियतात्मक है।

सिद्धांत 3 / संपत्ति: अनुभव निर्भरता प्लास्टिसिटी

नेटवर्क हमेशा उसी परिणाम की गणना करेगा यदि सब कुछ जैसा है उसे छोड़ दिया जाए। कोई विकास नहीं होगा। यदि इनपुट मान बदले जाते हैं तो नेटवर्क एक अलग परिणाम की गणना करेगा। लेकिन, अगर कनेक्शन वेट समान रहेगा तो नेटवर्क बेहतर करना नहीं सीखेगा। सीखने के लिए आवश्यक है कि कनेक्शन वज़न को बदल दिया जाए। परिवर्तन की मात्रा समीकरणों द्वारा निर्धारित की जाती है जो अनुभव-निर्भर सिनैप्टिक प्लास्टिसिटी जैविक तंत्र के प्रभावों का अनुकरण करते हैं जो वास्तविक न्यूरॉन्स के बीच वास्तविक synapses को संशोधित करते हैं जब हम सीखते हैं और यादें बनाते हैं।

कनेक्शन वेट बदलने का मतलब है कि नेटवर्क पुराने उत्तेजना इनपुट मूल्यों के लिए एक नई प्रतिक्रिया की गणना करता है। कनेक्शन वज़न धीरे-धीरे बेहतर नेटवर्क प्रतिक्रिया की गारंटी देने वाले ढाल वंश तरीकों के अनुसार बदल दिए जाते हैं।

मैं यहां तीन टेक होम पॉइंट देना चाहता हूं। पहला बिंदु जिस पर मैं जोर देना चाहता हूं, वह यह है कि सीखना और स्मृति सभी मनोविज्ञान के लिए मौलिक हैं क्योंकि मनोविज्ञान मौजूद नहीं होगा यदि हम synaptic संशोधन के माध्यम से यादें नहीं सीख सकते हैं और बना सकते हैं। दूसरा बिंदु जिस पर मैं जोर देना चाहता हूं, वह यह है कि हमारे मनोविज्ञान के सभी पहलू समंग (2012) में शामिल हैं जो हमारे संयोजक को कहते हैं; हमारे सिनेप्स का पूरा संग्रह। तीसरा बिंदु जिस पर मैं जोर देना चाहता हूं वह यह है कि अनुभव-निर्भर प्लास्टिसिटी तंत्र हमारे अनुभवों को शारीरिक रूप से हमारे दिमाग को बदलने में सक्षम बनाता है और इसलिए हमारे सोचने, महसूस करने और व्यवहार करने के तरीकों को बदल देता है। इस प्रक्रिया के बारे में कुछ भी मानसिक या जादुई नहीं है।

सिद्धांत 4 / संपत्ति: सुदृढीकरण सीखना

बीएफ स्किनर जैसे व्यवहार मनोवैज्ञानिकों ने समझाया कि व्यवहार को मजबूत किया जाता है, सकारात्मक या नकारात्मक परिणामों द्वारा सुदृढ़ीकरण के माध्यम से अधिक संभावना बन जाती है, जो व्यवहार का पालन करते हैं। वह सिनैप्टिक परिवर्तन की भौतिक प्रक्रियाओं की व्याख्या नहीं कर सका जो व्यवहार को बदलने में सक्षम था इसलिए उसने बस यह दावा करते हुए परिवर्तन को स्वीकार किया कि वातानुकूलित चूहा एक बदले हुए चूहे के रूप में बच गया है। उन्होंने महसूस किया कि अनुभव मस्तिष्क को बदलता है, लेकिन अधिक जानकारीपूर्ण नहीं हो सकता क्योंकि उस समय सीखने और स्मृति का जीव विज्ञान अपनी प्रारंभिक अवस्था में था।

सुदृढीकरण सीखना अब बेहतर समझा जा सकता है। यह एक वृद्धिशील प्रक्रिया है जो मन-आधारित संज्ञानात्मक दृष्टिकोण से कोई मतलब नहीं है जहां प्रतीकों को हेरफेर करने के लिए सीखने और स्मृति में नियमों का पालन करना शामिल है। प्रतीकों को एक बार में थोड़ा सा उत्पन्न नहीं किया जाता है। न ही यह समझ में आता है कि प्रतीक एक बार में थोड़ा बदल सकते हैं या यह कि उनका अर्थ एक समय में थोड़ा संशोधित हो सकता है। इसलिए, ऐसा लगता था कि सुदृढीकरण शिक्षा यह समझाने में असमर्थ थी कि अनुभूति कैसे काम करती है।

लेकिन, सुदृढीकरण अधिगम मस्तिष्क-आधारित संयोजक तंत्रिका नेटवर्क के दृष्टिकोण से काफी हद तक समझ में आता है, जिसके ऊपर न्यूरॉन्स के बीच कनेक्शन भार यादृच्छिक स्तरों पर शुरू होता है और धीरे-धीरे सीखने के माध्यम से समायोजित किया जाता है ताकि वे परिवर्तन की एक वृद्धिशील प्रक्रिया के माध्यम से इष्टतम मूल्यों में परिवर्तित हो सकें। क्रमिक वंश के रूप में जाना जाता है।

अल्फाज़ेरो ने अपने बेहतर संज्ञानात्मक कौशल को सुदृढीकरण सीखने की वृद्धिशील प्रक्रिया के माध्यम से विकसित किया। यह उपलब्धि बताती है कि पारंपरिक संज्ञानात्मक मनोवैज्ञानिकों ने संज्ञानात्मक प्रक्रियाओं के विकास के लिए एक वैध स्पष्टीकरण के रूप में सुदृढीकरण सीखने को छूट देना गलत था।

सुदृढीकरण सीखना विकास का एक रूप है क्योंकि यह भिन्नता और चयन पर गंभीर रूप से निर्भर करता है। सफलता और असफलताएं संयुक्त रूप से भविष्य के व्यवहार को आकार देती हैं। स्किनर ने लगातार यह कहा कि पशु और मानव व्यवहार ontogenetically (किसी के जीवन काल में) के साथ-साथ phylogenetically (कई पीढ़ियों से अधिक) विकसित होते हैं। सुदृढीकरण सीखना कनेक्शन एआई सिस्टम के लिए अपने आप में अनुभव से सीखने का एक प्रभावी तरीका है। सुदृढीकरण सीखना प्रभावी ढंग से उन समस्याओं को हल करता है जो कार्यक्रम समाधान के लिए बहुत जटिल हैं। उदाहरण के लिए, यह वह तरीका है जो कारों को खुद ड्राइव करने के लिए सिखाया जाता है।

निष्कर्ष

अल्फाज़ेरो एक मस्तिष्क-आधारित सुपर आर्टिफिशियल इंटेलिजेंस है जो अंतर्दृष्टि के लिए सक्षम है, इस प्रकार यह पारंपरिक एआई मशीनों की तुलना में बहुत अधिक मानव जैसा है। यह उन तरीकों से अपने सीखने को सामान्य कर सकता है जो पारंपरिक नियम-आधारित कृत्रिम बुद्धिमत्ता नहीं कर सकते हैं। यह तेजी से सुदृढीकरण सीखने के माध्यम से अपने सिम्युलेटेड सिंकैप्स को समायोजित करता है। यह प्रतीकों को उत्पन्न या तैयार नहीं करता है और नियमों का पालन करता है जैसा कि आमतौर पर समझा जाता है। इसलिए, तंत्रिका नेटवर्क इंटेलीजेंस जैसे अल्फ़ाज़ेरो और अल्फ़ाफोल्ड पारंपरिक संज्ञानात्मक मनोवैज्ञानिकों को यह समझने में मदद नहीं कर सकते कि वे कैसे काम करते हैं। ऐसा करने के लिए एक तंत्रिका नेटवर्क अभिविन्यास आवश्यक है। ऊपर चर्चा किए गए चार तंत्रिका नेटवर्क सिद्धांत / गुण हमें अल्फ़ाज़ेरो जैसे कृत्रिम बुद्धिमत्ता को बेहतर ढंग से समझने में मदद कर सकते हैं।

अल्फाज़ेरो की सफलता हमें कम से कम दो बातें बताती है। सबसे पहले , यह अनुभवजन्य प्रमाण प्रदान करता है कि सुदृढीकरण सीखने के लिए अंतर्दृष्टि को प्राप्त करने की क्षमता सहित जटिल संज्ञानात्मक कौशल के अधिग्रहण की व्याख्या करने के लिए पर्याप्त है। दूसरा , यह दिमाग पर आधारित मॉडल पर मस्तिष्क आधारित मॉडल की वैधता का समर्थन करता है। यह संज्ञानात्मक मनोविज्ञान में एक प्रमुख प्रतिमान बदलाव का गठन करता है।

जन्मदिन मुबारक हो अल्फाज़ो!

संदर्भ

कोहेन, जेडी, डनबार, के।, और मैक्लेलैंड, जेएल (1990)। स्वचालित प्रक्रियाओं के नियंत्रण पर: स्ट्रोप प्रभाव का एक समानांतर वितरित प्रसंस्करण खाता। मनोवैज्ञानिक समीक्षा, 97, 332-361। डोई: 10.1037 // 0033-295X.97.3.332

हॉर्निक, के।, स्टिनकोम्बे, एम।, एंड व्हाइट, एच। (1989)। बहुपरत फीड-फ़ॉरवर्ड नेटवर्क सार्वभौमिक सन्निकट हैं। तंत्रिका नेटवर्क, 2, 359-366। doi: 10.1016 / 0893-6080 (89) 90020-8

हॉर्निक, के।, स्टिनकोम्बे, एम।, एंड व्हाइट, एच। (1990)। मल्टीलेयर फीडफॉर्वर्ड नेटवर्क का उपयोग करके एक अज्ञात मैपिंग और उसके डेरिवेटिव का सार्वभौमिक सन्निकटन। तंत्रिका नेटवर्क, 3, 551-560। doi 10.1016 / 0893-6080 (90) 90005-6

मैकलेलैंड, जेएल, रुमेलहार्ट, डीई, और पीडीपी रिसर्च ग्रुप (1986)। समानांतर वितरित प्रसंस्करण: अनुभूति के माइक्रोस्ट्रक्चर में स्पष्टीकरण, वॉल्यूम। 2: मनोवैज्ञानिक और जैविक मॉडल । कैम्ब्रिज, एमए: एमआईटी प्रेस।

रुमेलहार्ट, डे, मैकलेलैंड, जेएल, और पीडीपी रिसर्च ग्रुप (1986)। समानांतर वितरित प्रसंस्करण: अनुभूति के माइक्रोस्ट्रक्चर में स्पष्टीकरण, वॉल्यूम। 1: नींव । कैम्ब्रिज, एमए: एमआईटी प्रेस।

सेउंग, एस। (2012)। कनेक्टोम: मस्तिष्क की वायरिंग हमें कैसे बनाती है, हम कौन हैं । बोस्टन: हॉटन मिफलिन हरकोर्ट।

ट्रिवन, डब्ल्यूडब्ल्यू (2012)। मनोवैज्ञानिक विज्ञान के लिए एक कनेक्शन नेटवर्क दृष्टिकोण: कोर और कोरोलरी सिद्धांत। सामान्य मनोविज्ञान की समीक्षा, 16 , 305-317। doi: 10.1037 / a0027135

ट्रिवन, डब्ल्यूडब्ल्यू (2014)। संज्ञानात्मक तंत्रिका विज्ञान और मनोचिकित्सा: एक एकीकृत सिद्धांत के लिए नेटवर्क सिद्धांत । न्यूयॉर्क: अकादमिक प्रेस।

Intereting Posts

यह अभी भी क्यों है "अनमानी" होना पारिस्थितिकी के अनुकूल होना एलेन शॉन की नई संस्मरण "ट्विन" में भाई बहन की भारी ताकत क्या आपको बुरा के माध्यम से जाने के लिए अच्छा करने की आवश्यकता है? सैन्य बलात्कार पीड़ितों को कॉल करने के लिए प्रयुक्त मनोरोग निदान "बीमार" माता-पिता क्यों सोचते हैं कि डीवीडी काम करती है, तब? डॉक्टर, क्या आप सुन रहे हैं? मैरी एडवर्ड्स वाकर: ऊपर और परे आतंक-खरीदारी: रोटी-दूध-अंडे रश का मनोविज्ञान मानसिक बीमारी के चलना चलना हत्या पर्यटन मेरी माँ पर सेक्स, रोमांस, और एक अक्तूबरदार होने के नाते 4 तरीके टेक इस वसंत में अपने स्वास्थ्य को बेहतर बनाने में मदद कर सकते हैं दुविधा: क्या आप खुद को बताएं या अपना खुद का व्यवसाय करें? प्राणीवाद की आत्मा और क्यों व्यक्तित्व एक मिथक नहीं है मैनहट्टन से पत्र: क्यों अक्टूबर में NYC माता पिता फिकट