इम्प्रूव शतरंज

सट्टा सोच को बढ़ावा देने का एक तरीका

“इम्प्रूव चेस” गेम टूर्नामेंट के लिए एक विचार है जो प्रतिभागियों को सट्टा सोच पर भरोसा करने के लिए प्रोत्साहित करेगा और जो कि स्नेदिरमैन सामने वाले की सोच को बुलाता है। याद किए गए क्रमों पर ध्यान देने या सावधानी से काम करने और पूर्व-विश्लेषण करने के बजाय, इस प्रारूप में आपको अपने ज्ञान और अपने विचारों को फैलाने और निहितार्थों और खर्चों की खोज करने की आवश्यकता है।

जिस तरह से यह एक शतरंज टूर्नामेंट में काम करता है (या आप गो, या बैकगैमौन, या चेकर्स या किसी अन्य प्रकार के गेम को स्थानापन्न कर सकते हैं) यह है कि आप शतरंज खेलने के लिए तैयार दिखते हैं, लेकिन एक छोटे से ट्वीक के साथ।

टूर्नामेंट के आयोजक पहले से मिलते हैं और एक ट्वीक का चयन करते हैं। वे नियमों में एक छोटे से बदलाव की पहचान करते हैं लेकिन वे उस बदलाव की घोषणा नहीं करते हैं जब तक कि टूर्नामेंट शुरू होने वाला नहीं है।

किस तरह का बदलाव? यह हो सकता है कि प्यादे अब दो स्थानों को कूदकर शुरू नहीं कर सकते हैं – वे केवल एक चाल कूद सकते हैं। या अतिरिक्त बदमाश शूरवीरों की जगह लेंगे। या राजा गायब हो जाता है, एक खाली वर्ग को छोड़कर, और रानी अब और भी अधिक केंद्रीय है – आप प्रतिद्वंद्वी की रानी पर कब्जा करके जीतते हैं। या बीच में एक वर्ग है, डी 4 कहते हैं, कि किसी भी टुकड़े पर कब्जा करने की अनुमति नहीं है।

बस। अंतिम मिनट का नियम बदल जाता है। और अचानक, लाखों खेल जो मशीन लर्निंग सिस्टम खुद के खिलाफ खेलते हैं, अप्रासंगिक हो जाते हैं। क्या मायने रखता है सीमाओं, अवसरों और नई रणनीतियों की तत्काल सराहना। प्रारूप पूर्व मामलों के संकलन पर अनुकूलन और खोज का पक्षधर है।

दरअसल, बॉबी फिशर ने अपना खुद का इनोवेटिव चेस गेम, फिशर रैंडम चेस विकसित किया, जो उसी लक्ष्य को हासिल करता है, जिसका मैं लक्ष्य बना रहा हूं। फिशर की योजना बहुत सारे और बहुत से शतरंज के उद्घाटन को याद करने की आवश्यकता को समाप्त करने के लिए डिज़ाइन की गई है।

फिशर रैंडम शतरंज प्यादों को छोड़ देता है जहां वे आमतौर पर होते हैं। शेष सफेद टुकड़े अभी भी पहली रैंक पर हैं, लेकिन उन्हें कुछ बाधाओं के साथ यादृच्छिक रूप से रखा गया है: बिशप अभी भी विपरीत रंग के वर्गों पर हैं। सफेद राजा को दो सफेद बदमाशों के बीच कहीं जाना होता है। काले टुकड़े सफेद टुकड़ों को दर्पण करते हैं।

फिशर रैंडम शतरंज इम्प्रूव चेस के समान उसी तरह की स्क्रैचिंग को प्राप्त करता है, और इसे लागू करना बहुत आसान है। हालांकि, फिशर रैंडम शतरंज मुख्य रूप से उद्घाटन से संबंधित है, जबकि इंप्रूव शतरंज पूरे खेल के दौरान प्रतिध्वनित हो सकता है, उदाहरण के लिए, डी 4 वर्ग को कभी भी कब्जा नहीं किया जा सकता है या राजा को खेल से बाहर निकाल दिया जाता है।

इंप्रूव प्रारूप का एक और लाभ यह है कि इसका उपयोग अन्य खेलों के साथ किया जा सकता है, जिसमें गो और बैकगैमौन जैसे खेल शामिल हैं, जिनमें प्रारंभिक स्थिति नहीं है। इंप्रूव प्रारूप डिजिटल कौतुक जैसे कि अल्फाज़ेरो (कैंपबेल, 2018; सिल्वर एट अल।, 2018) के पूरक के रूप में काम कर सकता है जो खुद को किसी भी खेल (जैसे, शतरंज, शोगी, और गो) के बारे में सिखा सकता है।

बेन स्नेनीरमैन ने बोर्ड के खेलों को अधिक अस्पष्ट प्रदान करने के लिए कुछ प्रारूप सुझाए हैं, जिनके बजाय प्रत्येक टुकड़े की पहचान और स्थान स्पष्ट रूप से टैग किए गए हैं। उदाहरण के लिए, यादृच्छिक क्षणों में आप किसी एक टुकड़े को किसी अन्य टुकड़े में बेतरतीब ढंग से बदल सकते हैं। मुझे यह विचार पसंद है, खेल में यादृच्छिक बिंदुओं पर टुकड़ा प्रतिस्थापन बनाने के लिए एक प्रबंधन कंप्यूटर का उपयोग करना। निश्चित रूप से टुकड़ा प्रतिस्थापन कानूनी होगा। वे सममित भी होंगे- दोनों खिलाड़ियों के लिए एक ही बिंदु-स्तरीय प्रतिस्थापन एक साथ बनाया जाएगा। इस तरह की प्रक्रिया एक गेम को एक असली हाथापाई में बदल देती है, जो त्वरित-फिट के पक्ष में है, जो पूरे गेम में सबसे अच्छा अनुकूलन कर सकता है।

बेन ने प्रत्येक खिलाड़ी के लिए बोर्ड के एक चौथाई हिस्से को कवर करने का सुझाव दिया ताकि दूसरे को अधूरा ज्ञान हो। यह प्रक्रिया खेल में अनिश्चितता को इंजेक्ट करेगी। यह खेल क्रिस्पस्पिल जैसा दिखता है, जो शतरंज का एक प्रकार है। क्रिस्पस्पिल में, मैं एक विरोधी खेलता हूं लेकिन हम में से कोई भी यह नहीं देखता है कि दूसरा व्यक्ति कहां चला गया है। हम सभी के सामने एक शतरंज बोर्ड है, और हम अपने स्वयं के टुकड़े करते हैं। एक रेफरी हम दोनों को देखता है और एक मास्टर बोर्ड पर प्रत्येक चाल में प्रवेश करता है; रेफरी खिलाड़ियों को सूचित करता है कि क्या उन्होंने गैरकानूनी कदम उठाया है या कब्जा कर लिया है। खेल तब तक जारी रहता है जब तक कोई चेकमेट द्वारा जीत नहीं जाता। खेल कुछ दशक पहले रैंड कॉर्पोरेशन में कुछ लोकप्रिय था। कुछ लोग निराश थे और कहा कि यह सिर्फ यादृच्छिक था। अन्य लोगों ने कहा कि वास्तविक रणनीतियाँ थीं – वे वे थीं जो आमतौर पर अपने मैच जीतती थीं। क्रिस्पिएल की लॉजिस्टिक सीमाएं हैं: इसके लिए अधिक जगह और उपकरण (तीन बोर्ड) और एक रेफरी की सेवाएं चाहिए।

एक इंप्रूव टूर्नामेंट नियम की आवश्यकता होगी कि प्रतिभागियों को लैपटॉप में लाया जा सकता है, लेकिन सुपर कंप्यूटर से लिंक नहीं किया जा सकता है जो नए, सुव्यवस्थित नियमों को सीखने के लिए तेजी से खुद को एक लाख बार खेल सकते हैं; लैपटॉप स्वयं इस प्रकार की मशीन लर्निंग में संलग्न होने से मना किया जाएगा।

इस वजीफा का कारण यह है कि मैं इंप्रूव प्रारूप चाहता हूं कि वर्तमान में प्रतिपादित मशीन लर्निंग के सहसंबद्ध तर्क के बजाय वैचारिक समझ और कारण तर्क पर जोर दिया जाए।

कुछ सबसे शक्तिशाली मशीन लर्निंग दृष्टिकोण कई परतों वाले तंत्रिका नेटवर्क का उपयोग करके पैटर्न को वर्गीकृत करने के लिए सांख्यिकीय तकनीकों पर निर्भर करते हैं – जिन्हें आमतौर पर डीप लर्निंग के रूप में वर्णित किया जाता है। ये भाषण मान्यता, छवि मान्यता, भाषा अनुवाद और गो और अन्य गतिविधियों के लिए खेल खेलने में नाटकीय प्रगति के लिए जिम्मेदार दृष्टिकोण हैं। इसलिए उनकी उपलब्धियों से कोई इनकार नहीं करता है। लेकिन जैसा कि मार्कस (2018) बताता है, “गहरी” परतों की बड़ी संख्या को संदर्भित करता है, न कि अधिक से अधिक अमूर्तता को। मार्कस अटारी खेल “ब्रेकआउट” के उदाहरण का उपयोग करता है, जो लगभग चार घंटे के प्रशिक्षण में एक प्रणाली द्वारा हल किया जाता है – प्रणाली ईंटों की दीवार के माध्यम से एक सुरंग खोदना सीखती है। हालांकि, सिस्टम को यह पता नहीं है कि सुरंग क्या है या दीवार क्या है। और जब एआई शोधकर्ता थोड़ी गड़बड़ी करते हैं जैसे कि पैडल की ऊंचाई बढ़ाना या दीवार के मध्य स्क्रीन को सम्मिलित करना, एआई सिस्टम विफल हो जाते हैं। वे अनुकूल नहीं हैं। वर्तमान अत्याधुनिक इम्प्रूव शतरंज को संभालने में सक्षम नहीं है।

शायद इंप्रूव प्रारूपों का उपयोग मनुष्य को एक फायदा देगा; शायद यह कंप्यूटर वैज्ञानिकों को अपने सिस्टम में सामान्य ज्ञान तर्क और वैचारिक निदान जोड़ने के लिए अपनी खोज में और आगे बढ़ने के लिए प्रोत्साहित करेगा। भले ही, मैं इम्प्रूव सोच और सीमांत सोच जैसी बुद्धिमान क्षमताओं को मनाने और उन्हें मजबूत करने के साधन के रूप में इंप्रूव प्रारूप की कल्पना करता हूं, जिनकी वर्तमान में अनदेखी है।

संदर्भ

कैंपबेल, एम। (2018)। बोर्ड खेल में माहिर। विज्ञान, 362, 1118।

मार्कस, जी। (2018)। गहन शिक्षा: एक महत्वपूर्ण मूल्यांकन। arXiv preprint arXiv: 1801,00631, 2018 – arxiv.org

सिल्वर, डी।, ह्यूबर्ट, टी।, श्रिटविस्सर, जे।, एंटोनोग्लू, आई।, लाइ, एम।, ग्यूज़, ए।, लैनक्टोट, एम।, सिफ्र्रे, एल।, कुमारन, डी।, ग्रेपेल, टी। लिलीक्रैप, टी।, सिमोनियन, के।, और हसबिस, डी। (2018)। एक सामान्य सुदृढीकरण शिक्षण एल्गोरिथ्म जो शतरंज, शोगी, और गो-सेल्फ-प्ले के माध्यम से महारत हासिल करता है। विज्ञान, 362, 1140-1144।

Intereting Posts
जहरीले कर्मचारी: इसे रोकें या छोड़ दें सह-पत्नी संघर्ष: "दूसरी महिला" क्यों नफरत करना आसान है कैसे आप अपनी भावनाओं को साझा करने के लिए जिम्मेदारी लेना आपका व्यक्तिगत ब्रांड जोड़े कैसे दूसरे जोड़े के साथ मित्र बन सकते हैं? फॉरेंसिक आर्ट थेरेपी में नैतिकता: परिभाषित और विजय प्राप्त आप क्या करेंगे? हम क्या भविष्यवाणी करेंगे? कैसे एक विरोधी irrelationship बनाने के लिए क्या आपका साथी एक इश्कबाज है? क्लच के नील फ़ॉलन के सार्वभौमिक सत्य दोस्तों- वास्तव में यह जटिल नहीं हैं क्या आप बहुत ग्रिट हो सकते हैं? एक अपराधी कौन बदलना चाहता है: ईमानदारी v। गवाही? डार्लोड ट्रेफर्ट के साथ रचनात्मकता पर बातचीत, भाग III: और अधिक लचीला बनने के लिए 6 युक्तियाँ