कंप्यूटर प्रोग्राम बीट्स यूरोपीय गो चैंपियन

1 99 7 में, शतरंज कंप्यूटर डीप ब्लू ने छह गेम मैच में शतरंज विश्व चैंपियन गैरी कास्पारोव को हराया था। यह परिणाम मानव गर्व के लिए एक बड़ा झटका के रूप में महसूस किया गया था – शतरंज मानव अद्वितीय बुद्धि का प्रतीक के रूप में देखा गया है अपने घावों को मारना, बुद्धिमानी के प्रतीक के रूप में शतरंज की जगह के लिए मानव जाति ने दूसरे गेम की खोज की। यह गो के एशियाई खेल को चुना।

जाओ एक 1 9 x 1 9 बोर्ड पर खेला जाता है, दो खिलाड़ियों (काले और सफेद) के बीच। एक बार रखा गया, एक टुकड़ा (जिसे "पत्थर" कहा जाता है) फिर से स्थानांतरित नहीं किया जा सकता। खेल का उद्देश्य प्रतिद्वंद्वी से अधिक क्षेत्र हासिल करना है, इसके पत्थरों के आस-पास नियम सरल होते हैं, लेकिन यह खेल बेहद जटिल है, शतरंज (गोबेट, डी व्होगट और रात्स्त्ित्ज़्की, 2004) की तुलना में बहुत अधिक है: 10 ¹⁷² संख्या संभावित स्थिति (172 शून्य के बाद एक), कई की संख्या ज्ञात ब्रह्मांड में परमाणु तुलना करके, शतरंज में पदों की संख्या "केवल" 10 ^{43 है} ।

शतरंज और चेकर्स जैसे अन्य बोर्ड खेलों की तुलना में, जाओ अधिक सामरिक और कम रणनीतिक है। यही है, दीर्घकालिक योजना अल्पकालिक संयोजनों पर भरोसा करती है यह गो बोर्ड के बड़े आकार की वजह से है, और यह तथ्य है कि बोर्ड पर एक बार पत्थरों को स्थानांतरित नहीं किया जाता है। एक परिणाम यह है कि खेल अनुभूति के पहलुओं में नल है जहां मनुष्य मजबूत (पैटर्न मान्यता, अंतर्ज्ञान, नियोजन) और जहां कंप्यूटर पारंपरिक रूप से संघर्ष कर रहे हैं। इसके विपरीत, खेल कंप्यूटर की परंपरागत शक्तियों के अनुरूप नहीं है, सबसे विशेष रूप से जानवर बल द्वारा व्यवस्थित रूप से बड़ी संख्या में राज्यों की खोज करने की क्षमता।

इस प्रकार, जबकि कंप्यूटर लंबे समय से शतरंज, ओथेलो और चेकर्स जैसे खेलों में इंसानों की तुलना में मजबूत रहे हैं, वे हमेशा एक अच्छा शौकिया स्तर के स्तर से परे प्रगति करने में असमर्थ रहे, गो जाने में गरीब थे। एक बड़ी सफलता 2006 में हुई, जब कंप्यूटर प्रोग्राम ने अपनी ताकत बढ़ाकर मोंटे कार्लो ट्री सर्च (ली एट अल।, 2009) नामक एक साधारण लेकिन आश्चर्यजनक तकनीक के साथ बढ़ा दी। व्यवस्थित तरीके से संभव चाल के पेड़ को खोजने के बजाय, यह विधि दो खिलाड़ियों के लिए यादृच्छिक रूप से चालें चुनकर गेम तैयार करता है अंतर्ज्ञान यह है कि, अगर वर्तमान स्थिति में कोई कदम विकल्प के मुकाबले बेहतर होता है, तो इस कदम से औसत पर अच्छे परिणाम हो सकते हैं, जब कई ऐसे गेम खेला जाता है, भले ही प्रत्येक व्यक्ति का चाल अनियमित रूप से चुना गया हो। इस तकनीक के अधिक परिष्कृत विविधताओं के साथ, चाल का चुनाव पिछले अनुभव से पूर्वाग्रहित है।

अल्फागो के साथ सफलता

पिछले जनवरी के आखिर में नेचर ने एक अन्य सफलता (रजत एट अल।, 2016) की सूचना दी। Google DeepMind द्वारा विकसित कार्यक्रम AphaGo, न केवल सभी बेहतरीन कार्यक्रमों (99.8% जीत) को ट्रैश किए गए, लेकिन यह भी एक पेशेवर गो खिलाड़ी, जो यूरोपीय चैंपियनशिप को तीन बार जीता था, फैन हुई को हराया। परिणाम बेरहमी से स्पष्ट था: पांच शून्य से

अल्फागो तीन कृत्रिम-खुफिया तकनीकों का एक संयोजन का उपयोग करता है: मोंटे कार्लो पेड़ खोज, जिसे हमने अभी चर्चा की है, डीप लर्निंग और सुदृढीकरण सीखना है। दीप लर्निंग में हाल ही में विकसित तकनीक (लेकुन, बेंगो, और हिंटन, 2015) का उपयोग करते हुए एक कृत्रिम तंत्रिका नेटवर्क के वजन को समायोजित करना शामिल है। अल्फागो दो नेटवर्क का उपयोग करता है: पहले किसी दिए गए स्थिति में एक कदम का सुझाव देता है, और दूसरा एक संपूर्ण स्थिति का मूल्यांकन करता है। कार्यक्रम को पहले बड़ी संख्या में मास्टर गेम्स (30 मिलियन पदों) स्कैन करके सीखता है। फिर, यह स्वयं के विरुद्ध बड़ी संख्या में खेलता है, जो एक तकनीक का उपयोग करके अपने नेटवर्क के वजन को ट्यूनिंग करता है जिसे सुदृढीकरण सीखने कहा जाता है। यह तकनीक आगे सीखने के लिए खेल के परिणाम से प्राप्त फीबैक का उपयोग करता है। सुदृढीकरण सीखने के लिए पहले से ही कई बोर्ड गेमों में बैकगैमौन (टेसौरो, 1 99 5) सहित शीर्ष स्तर के कार्यक्रमों का उत्पादन करने के लिए सफलतापूर्वक इस्तेमाल किया जा चुका है। संपूर्ण सीखना कम्प्यूटेशनल रूप से बहुत महंगा है और शक्तिशाली कंप्यूटरों की आवश्यकता है

प्रतिद्वंद्वी खेलते समय, अल्मोगो अपने दो नेटवर्क का उपयोग करके स्थिति का मूल्यांकन करता है और चाल का चयन पूर्वाग्रह करता है, जैसे कि वह चालें जो अतीत में उपयोगी साबित करती है। कार्यक्रम मोंटे कार्लो पेड़ खोज के साथ कुछ योजना बना रहा है इस दृष्टिकोण की खूबसूरती यह है कि अल्मोगो केवल उस ज्ञान का उपयोग करता है जिसे उसने खुद ही सीखा है यह विरोधाभास, उदाहरण के लिए, दीप ब्लू के साथ, जो अपने प्रोग्रामर (कैम्पबेल, होेन, और एसयू, 2002) द्वारा हाथ से कोडित बहुत सारे ज्ञान का उपयोग करता है।

मानव विशेषज्ञता के लिए सबक

अल्फागो हमें मानव विशेषज्ञता के बारे में बताता है? जाओ की दुनिया के लिए क्या निहितार्थ हैं? एक पहला महत्वपूर्ण परिणाम यह है कि अल्मोगो बोर्ड गेम में पैटर्न मान्यता और अंतर्ज्ञान के महत्व की पुष्टि करता है और शायद विशेषज्ञता के अन्य डोमेन में। केवल इसकी पैटर्न पहचान क्षमता का उपयोग करना, और किसी भी खोज के बिना, अल्मोगो अभी भी अधिकांश कंप्यूटर प्रोग्राम को धड़कता है। यह आश्चर्यजनक नहीं है, यह देखते हुए कि गो एक सामरिक गेम है, लेकिन जिस तरह से अल्मोगो मानव विशेषज्ञता के इस पहलू को हासिल करने में सक्षम है, वह बहुत प्रभावशाली है। मानव विशेषज्ञों में पैटर्न की मान्यता के महत्व को कई शोधकर्ताओं (जैसे एड्रियान डी ग्रूट, हर्बर्ट ए। साइमन और ह्यूबर्ट ड्रेफस) ने लंबे समय तक जोर दिया है, भले ही उनके सिद्धांतों के विशेषताओं में महत्वपूर्ण मतभेद (विवरण के लिए, गोबेट और देखें, चैसी, 200 9)

इसके विपरीत, यह परियोजना मानव नियोजन और खोज के बारे में बहुत कुछ नहीं बताती मोंटे कार्लो पेड़ खोज बहुत ही मानवीय नहीं है: यहां तक कि विशेषज्ञों ने हजारों (छद्म) यादृच्छिक खेलों को उत्पन्न नहीं किया है, जिस तरह से आंकड़े इकट्ठा किए हैं। वे और अधिक सूक्ष्म और चयनात्मक खोज करते हैं, जहां पैटर्न-मान्यता की खोज के साथ मिलकर आगे बढ़ता है (गोबेट, 1 99 7)। अल्फा-गो चुनिंदा खोज करने के लिए इसका ज्ञान का उपयोग करता है, लेकिन यह इंसानों की तुलना में बहुत कम है

कंप्यूटर ने शीर्ष स्तर पर शतरंज खेलने का तरीका बदल दिया है उन्होंने नए वैचारिक रास्ते खोल दिए हैं और विशेषज्ञ खेल में चौंकाने वाली सीमाएं उजागर की हैं। कंप्यूटरीज़ के खिलाफ खेलने के लिए, कंप्यूटर के अभ्यास के लिए कंप्यूटर का उपयोग करने और कम्प्यूटरीकृत डाटाबेस का उपयोग करने के परिणामस्वरूप, पिछले दो दशकों में नाटक की गुणवत्ता में सुधार हुआ है। खुलने वाली विविधताएं जिन्हें अब तक प्लेबैक करने के लिए सोचा गया था, अब कार्यरत हैं, और जो दूसरों को संतोषजनक माना गया है उन्हें कंप्यूटर विश्लेषण द्वारा खारिज कर दिया गया है। एक और परिणाम, इस बार एक अनचाहे, कंप्यूटर का उपयोग कर धोखाधड़ी का उद्भव है। यह देखने के लिए दिलचस्प होगा कि क्या ऐसी ही घटनाएँ गो के साथ होंगी।

यह अत्यधिक संभावना नहीं है कि कृत्रिम बुद्धि की सार्वभौमिक स्वीकृति मानव बुद्धि से बेहतर होगी। लोग कंप्यूटर पर मानव प्रभुत्व को बनाए रखने के लिए नए खेल और गतिविधियों का विकास करेंगे। इससे बेहतर कंप्यूटर तकनीक भी हो जाएगी मानव बुद्धि और कंप्यूटर इंटेलिजेंस के बीच इस हथियार की दौड़ दोनों के लाभ के लिए, मानव और कृत्रिम बुद्धि की बढ़ती समझ को जन्म देगी।

अगली चुनौती

जबकि अल्मोगो का प्रदर्शन उल्लेखनीय है, उसे याद रखना चाहिए कि उसने विश्व चैंपियन (अभी तक) को नहीं मारा है। यद्यपि यूरोपीय चैंपियन, फैन हुई "केवल" एक 2 डैन पेशेवर है, और इस तरह से शीर्ष स्तर वाले पेशेवर की तुलना में कमजोर है, जो 9 वें स्थान पर हैं यह मोटे तौर पर शतरंज में, मास्टर और विश्व स्तरीय ग्रैंडमास्टर के बीच अंतर के बराबर है। दूसरे शब्दों में, एक 9-डैन पेशेवर 2-डैन पेशेवर के खिलाफ 95% से अधिक समय तक जीतने की संभावना है।

तो, अल्फागो की असली ताकत क्या है? हम जल्द ही जान लेंगे, क्योंकि एक अल्फागो और ली से-डोल के बीच एक मैच आयोजित किया गया है, जो 9-दन दक्षिण कोरियाई पेशेवर माना जाता है जो दुनिया के सर्वश्रेष्ठ खिलाड़ियों में से एक है। जबकि अल्मोगो के पीछे टीम आशावादी है कि वह जीत जाएगी, जाओ स्वामी विश्वास करते हैं कि मानव मन प्रबल होगा तो जोनाथन शैफ़र, एक कंप्यूटर वैज्ञानिक, जिन्होंने कंप्यूटर गेम में कई सफलताओं के लिए योगदान दिया है: "अल्मोगो के बारे में सोचो एक बच्चे की महानता के रूप में अचानक वह बहुत अच्छी तरह से खेलने के लिए सीखा है, बहुत जल्दी लेकिन इसमें बहुत अनुभव नहीं है हमने शतरंज और चेकर्स में क्या देखा, यह अनुभव बहुत अधिक है। "

फर्नांड गोबेट और मॉर्गन एरेकु

संदर्भ

कैंपबेल, एम।, होने, ए जे, और एसयू, एफएच (2002)। गहरा नीला। आर्टिफिशियल इंटेलिजेंस, 134, 57-83

गोबेट, एफ। (1 99 7) विशेषज्ञ समस्या को सुलझाने में खोज के एक पैटर्न-मान्यता सिद्धांत सोच और तर्क, 3, 291-313

गोबेट, एफ।, और चैसी, पी। (200 9)। विशेषज्ञता और अंतर्ज्ञान: तीन सिद्धांतों की एक कहानी दिमाग और मशीनें, 1 9, 151-180

गोबेट, एफ।, डी व्होगट, ए जे, और रिट्स्चिट्स्की, जे। (2004)। ध्यान में ले जाता है हॉव, यूके: मनोविज्ञान प्रेस

लेकुन, वाई।, बेंगियो, वाई।, और हिंटन, जी (2015)। ध्यान लगा के पढ़ना या सीखना। प्रकृति, 521, 436-444

ली, सी.- एस, वांग, एम-एच, चास्लोट, जी।, होक, जे.बी., रिमेल, ए, टेयटौड, ओ।, एट अल (2009)। मोजो की कम्प्यूटेशनल इंटेलीज ने ताइवान के कंप्यूटर गो टूर्नामेंट में खुलासा किया। कम्प्यूटेशनल इंटेलिजेंस और खेलों में एआई में आईईईई लेनदेन, 1, 73-8 9

रजत, डी।, हुआंग, ए, मैडिसन, सीजे, ग्वेज, ए, सिफ्रे, एल।, वान डेनिस ड्रिसस्च, जी, एट अल (2016)। गहरी तंत्रिका नेटवर्क और पेड़ खोज के साथ जाओ का खेल माहिर। प्रकृति, 52 9, 484-48 9

टेसौरो, जी (1 99 5)। अस्थायी अंतर सीखना और टीडी-गैमन एसीएम के संचार, 38, 58-68

Intereting Posts

क्या हम एक लस-डिटेक्टिंग सर्विसेज डॉग बना सकते हैं? क्या आपकी चहचहाना उपयोग खुशी का रहस्य प्रकट कर सकता है? प्यार लत को जीत जाएगा? "यह मनोविज्ञान, बेवकूफ है!" ढोंगी और नकारात्मक साक्ष्य के साथ आराम से रहना कैसे अपने पेरेंटिंग तनाव स्तर को मापने के लिए कौन डोनाल्ड ट्रम्प का समर्थन करता है? कैसे एथलीट जोखिम उठाने के लिए कर सकते हैं कि बंद वेतन ईसाई धर्म क्या है? निक लेइकटर का अर्थ "भयंकर" मस्तिष्क के मोहक आकर्षण, और अनुनय के विज्ञान बिकनी निकायों की पर्याप्त बातचीत लगातार अपने पाठ के लिए अच्छा या बुरा texting है? एडीएचडी और माइकल फेल्प्स: दवा एक क्रच नहीं है क्या अधिक पुरुष आज "विवाह" कर रहे हैं?