खुशी की ऑफ-पॉलिसी थ्योरी

दार्शनिक इस बात पर सहमत क्यों हैं कि खुश होने के लिए क्या होता है।

Wikimedia commons.

स्रोत: विकिमीडिया कॉमन्स।

मैं कॉलेज में एक उपहास था जब मुझे पहली बार एहसास हुआ कि मेरे माता-पिता ने मुझे कभी नहीं बताया था, “बेटा, हम सिर्फ आपको खुश होना चाहते हैं।” ऐसा लगता है कि हर किसी के माता-पिता ने उन्हें बताया था कि जो भी उन्होंने किया था, यह ठीक था यह उन्हें खुश कर दिया। क्यों, मैंने सोचा, क्या मेरे माता-पिता ने मुझसे यह कभी नहीं कहा था?

जब मैं जॉन स्टुअर्ट मिल की आत्मकथा से पारित हुआ, तो मुझे तुरंत समझ में आया।

मिल दिलचस्प लड़का था। उनके पास मानव इतिहास में उच्चतम आईक्यू में से एक था (उस समय उनके पास खुफिया परीक्षण नहीं थे, लेकिन मनोवैज्ञानिक इतिहासकारों ने अन्य साक्ष्य से अपने आईक्यू का पुनर्निर्माण करने का प्रयास किया है)। उनके पिता, आदरणीय इतिहासकार जेम्स मिल ने उन्हें तीन साल की उम्र में प्राचीन ग्रीक पढ़ाना शुरू किया। आठ से, उन्होंने मूल में पूरे हेरोदोटस के इतिहास पढ़े थे। तो मैंने सोचा कि उसकी जिंदगी की कहानी एक आकर्षक पढ़ाई कर सकती है। लेकिन ऐसा नहीं है। उनकी आत्मकथा कुल स्नूज़-उत्सव है। जैसा कि मुझे याद है, यह काम कम से कम दिलचस्प चीजों का एक संपूर्ण संकलन है जिसे मिल ने कभी पढ़ा, देखा, या चिंतित किया। एक प्रतिनिधि मार्ग: “जब हमारे पास पर्याप्त राजनीतिक अर्थव्यवस्था थी, तो हमने समान तरीके से शब्दावली तर्क लिया, ग्रोटे अब हमसे जुड़ रहे हैं। हमारी पहली पाठ्य पुस्तक एल्ड्रिच थी, लेकिन इसकी सतहीता से घृणित होने के कारण, हमने स्कूल तर्क के कई मैनुअलों में से एक को फिर से मुद्रित किया, जिसमें मेरे पिता, ऐसी पुस्तकों का एक महान संग्राहक, पास था, मैनडक्टियो विज्ञापन लॉजिकम जेसुइट डु ट्रीयू। इसे खत्म करने के बाद, हमने व्हाटलीज लॉजिक को लिया, फिर पहले एनसाइक्लोपीडिया मेट्रोपॉलिटन से पुन: प्रकाशित किया गया, और आखिरकार कम्प्यूटेटियो ने लॉबिका ऑफ होब्स को बुलाया। “भगवान के प्यार के लिए, जॉन। किसे पड़ी है?

हालांकि मुझे बिल्कुल यकीन नहीं है कि क्यों, मैं इसके माध्यम से उलझ गया। और मुझे खुशी है कि मैंने किया था।

लेकिन समझने के लिए कि मिल खुशी के बारे में क्या कहता है, आपको सबसे पहले कृत्रिम बुद्धि से अवधारणा को समझने की आवश्यकता है। इसे मजबूती सीखने कहा जाता है।

मजबूती सीखने का मूल विचार सरल है। यह एक एजेंट को डिजाइन करने का एक तरीका है-चाहे वह व्यक्ति हो, एक रोबोट, एक कंप्यूटर प्रोग्राम-बुद्धिमानी से व्यवहार करें। यहां बुद्धिमानी की परिभाषा यह है कि कंप्यूटर वैज्ञानिकों ने “इनाम अधिकतमता” कहा है। बस शब्दों में कहें, आप चाहते हैं कि कुछ ऐसा हो, और बुद्धिमान व्यवहार जितना संभव हो उतना प्राप्त करने में शामिल हो। उदाहरण के लिए, यदि आपका एजेंट एक रोबोट है जो बास्केटबाल बजाता है, तो इसका इनाम अंक के रूप में आता है। रोबोट जितना अधिक टोकरी बनाता है, वह जितनी अधिक अंक प्राप्त करती है और वह समझदारी से व्यवहार करती है। सुदृढीकरण सीखना गणितीय समाधान है जिस तरह से रोबोट अधिक से अधिक अंक हासिल करना सीखेंगे।

मजबूती सीखने के दिल में “नीति” के रूप में जाना जाता है। यह रोबोट की प्लेबुक है। एक नीति कहती है, गणितीय अमूर्तता में, “यह वह जगह है जहां मैं अभी हूं। मेरे इनाम को अधिकतम करने के लिए मुझे यही करना है। “बास्केटबाल में, गेंद को पाने के लिए एक अच्छी नीति हो सकती है, इसे टोकरी की तरफ खींचा जा सकता है, और एक लेट-अप में टॉस कर सकता है। जब भी रोबोट ऐसा करता है, वह देखती है कि वह अंक प्राप्त करने में कितनी प्रभावी थी, और अगली बार बेहतर करने के लिए उसके व्यवहार को समायोजित करती है। रोबोट खराब हो सकता है, लेकिन मजबूती सीखने का उपयोग करके वह समय के साथ बेहतर हो सकती है। यही वह बुद्धि है जिसका अर्थ है-समय के साथ आप अपने लक्ष्य को प्राप्त करने में बेहतर और बेहतर हो जाते हैं।

विचार सरल हो सकता है, लेकिन मजबूती सीखने में सभी बारीकियों से यह पता चलता है कि आप नीति को कैसे सीखते हैं। उदाहरण के लिए, टोकरी की ओर ड्राइव करने के लिए सबसे अच्छी नीति है? या आप वापस बैठना चाहिए और कूदने वालों को गोली मारनी चाहिए? आप कैसे जानते हैं कि अगली बार बेहतर काम करने जा रहा है? क्या एक ही नीति एक अलग प्रतिद्वंद्वी के खिलाफ काम करेगी?

पॉलिसी सीखने के लिए दो सामान्य रणनीतियां हैं। पहले पॉलिसी कहा जाता है। यह दो रणनीतियों का अधिक सरल है। ऑन-पॉलिसी का मतलब है कि रोबोट निर्णय लेने और मूल्यांकन करने के लिए समान जानकारी का उपयोग करता है कि वे अच्छे निर्णय थे या नहीं। यदि उसकी नीति टोकरी की ओर बढ़ने के लिए कहती है और इसके परिणामस्वरूप बहुत सारे अंक होते हैं, तो भविष्य में वह उसी नीति के साथ आगे बढ़ने की अधिक संभावना होगी। दूसरी रणनीति को ऑफ-पॉलिसी कहा जाता है । इसका मतलब है कि रोबोट उनको मूल्यांकन करने के लिए निर्णय लेने के लिए अलग-अलग जानकारी का उपयोग कर रहा है। उदाहरण के लिए, गेंद के कब्जे के समय के आधार पर एजेंट निर्णय ले सकता था। फिर वह उस नीति के आधार पर अपने खेल पर वापस देख सकती थी और देख सकती थी कि क्या किसी और चीज पर ध्यान केंद्रित करने से अंत में उसकी टोकरी की संख्या बढ़ गई है।

सबसे पहले, ऐसा लगता है कि बेहतर रणनीति हमेशा नीति पर होगी। पूरी तरह से अप्रासंगिक कुछ पर ध्यान केंद्रित करके आप अधिक अंक कैसे प्राप्त कर सकते हैं? लेकिन यह जरूरी नहीं है। कृत्रिम बुद्धि अनुसंधान में अनुभवजन्य तथ्य यह है कि कुछ समस्याएं ऑफ-पॉलिसी विधियों द्वारा बेहतर हल की जाती हैं। कभी-कभी लक्ष्य प्राप्त करने का सबसे अच्छा तरीका अप्रत्यक्ष रूप से होता है।

यह ठीक है जो मिल खुशी के बारे में बहस करता है। अपनी खुशी को अधिकतम करने का तरीका, बोलने के लिए, किसी और चीज का लक्ष्य रखना है। अपने आप को अपनी खुशी से बड़ा कुछ समर्पित करें। उस पर कड़ी मेहनत करें। फिर आप वापस देखेंगे और महसूस करेंगे कि आप पूरे समय खुशी अर्जित कर रहे हैं। मिल लिखता है,

“जीवन के आनंद एक सुखद चीज बनाने के लिए पर्याप्त हैं जब उन्हें मुख्य उद्देश्य के बिना पास किया जाता है। एक बार जब आप उन्हें बनाते हैं, तो आप तुरंत उन्हें अपर्याप्त महसूस करेंगे। वे एक जांच जांच नहीं करेंगे। खुद से पूछें कि क्या आप खुश हैं, और आप ऐसा ही बंद कर देते हैं। एकमात्र मौका यह है कि आपके जीवन में आपका उद्देश्य खुशी के रूप में नहीं बल्कि कुछ बाहरी है। अपनी आत्म-चेतना, अपनी जांच, अपनी आत्म-पूछताछ करने दें, उस पर खुद को निकालें; और यदि आप अन्यथा सौभाग्य से परिस्थिति में हैं, तो आप उस श्वास के साथ खुशी को श्वास लेंगे, उस पर रहने के बिना या इसके बारे में सोचने, कल्पना में इसे जंगल बनाने, या घातक पूछताछ से उड़ान भरने के लिए। ”

दूसरे शब्दों में, नीति नीति रणनीति खुशी के लिए काम नहीं करती है। यदि आप इसके लिए सीधे अधिकतम करने का प्रयास करते हैं, तो यदि आप एक अलग दृष्टिकोण ले चुके हैं तो आप इससे भी बदतर हो जाएंगे। खुशी उन समस्याओं में से एक है जो ऑफ-पॉलिसी रणनीति के साथ बेहतर काम करती हैं। कार्रवाई और मूल्यांकन के बीच एक अलगाव होना है। यदि आप अपने अगले निर्णय का मूल्यांकन करने के लिए एक मीट्रिक के रूप में अपनी खुशी का उपयोग कर रहे हैं, तो आपकी चिंता का दायरा आपकी भावनाओं से पहले नहीं बढ़ा सकता है। इसके बजाय, मिल का तर्क है, अपने आप से बड़ा कुछ पर ध्यान केंद्रित करें और आप यह महसूस करने के लिए एक दिन जाग जाएंगे कि आप जिस श्वास को सांस लेते हैं उसके साथ खुशी को श्वास लेते हैं

तब, मेरे माता-पिता ने मुझे खुशी का पीछा करने के लिए कभी नहीं बताया था कि वे मिल की तरह, खुशी के लिए ऑफ-पॉलिसी दृष्टिकोण में विश्वास करते हैं। जब कोई आपको बताता है कि आपको “जो आपको खुश करता है,” करना चाहिए, वे खुशहाली निर्णय लेने के लिए नीति नीति के लिए वकालत कर रहे हैं और उसी मीट्रिक द्वारा उनका मूल्यांकन कर रहे हैं। यही वही है जो मेरे माता-पिता मुझे नहीं करना चाहते थे। और जब मेरे माता-पिता मिल को पढ़ने से नहीं सीखते थे, तो इस स्थिति के बारे में आश्चर्यजनक बात यह है कि इसे साझा किया गया है- कुछ संस्करणों में या किसी अन्य रूप में – व्यावहारिक रूप से हर दूसरे दार्शनिक ने जो इस मामले में वजन कम किया है।

इन खातों में से मेरे पसंदीदा में से एक बर्ट्रेंड रसेल से संबंधित है। वह मिल के समान चीज़ कहता है, लेकिन मिल की गंभीर भार के विपरीत नॉनचलन की एक निश्चित फ्लेयर के साथ। रसेल ने विजय की विजय में लिखा है, “मौलिक खुशी किसी और चीज़ से अधिक निर्भर करती है जिसे व्यक्तियों और चीज़ों में मित्रवत रूचि कहा जा सकता है।” वह आगे बढ़ता है, “अपनी रुचियों को जितना संभव हो उतना चौड़ा होना चाहिए, और चीजों पर आपकी प्रतिक्रियाएं दें और जो लोग आपसे रूचि रखते हैं, वे शत्रुता के बजाए जितना संभव हो सके दोस्ताना हो। ”

खुशी, दूसरे शब्दों में, अवलोकन का प्राकृतिक परिणाम है कि दुनिया में बहुत से लोग और चीजें हैं जो एक दोस्ताना रूचि लेने के लायक हैं, और उनमें से केवल एक ही है। इस विचार को ध्यान में रखते हुए कि मैं इस ब्लॉग को लिखना चाहता हूं।

संदर्भ

मिल, जेएस (1873/2003)। आत्मकथा। प्रोजेक्ट गुटेनबर्ग।

रसेल, बी। (1 9 30)। खुशी की विजय। न्यूयॉर्क, एनवाई: लिवरइट पब्लिशिंग कार्पोरेशन

Intereting Posts
मॉनिटरिंग कर्मचारी के बजाय, उन्हें प्रेरित करने की कोशिश करें शुरुआती बर्ड स्पेशल क्या वजन घटाने की कुंजी है? पीएच.डी. के साथ आप एक फैट वुमन को क्या कहते हैं? क्यों बुल्लियों के लिए महिलाएं गिरावट आती हैं? आपराधिक न्याय प्रणाली में कोई भेदभाव नहीं है? व्यस्त करने के लिए आदी: 4 रणनीतियाँ अपराध और बर्बादी को आसान करने के लिए स्थायी प्यार क्या है? कार्ल सागन की गुप्त सॉस: हमारी धार्मिक भावनाओं में दोहन? शावर के बारे में आप क्या सोचते हैं? ऑस्कर और रैज़ीज़ – एकल श्रेणी 10 चीजें जो मैं करूँगा अगर मैं अपने स्वास्थ्य के साथ जाग गया गर्भवती माताओं के लिए अवकाश युक्तियाँ हमेशा देर? पुरानी लत पर काबू पाने के लिए 9 युक्तियाँ क्या धार्मिकता का अनुमान है: सहयोग या सेक्स? मेल से एक सबक