ए आई मशीन लर्निंग पर एक प्राइमर

एक नज़र में मशीन सीखने के बारे में आपको क्या जानने की जरूरत है

coffee/pixabay

स्रोत: कॉफी / पिक्साबे

संभावना है कि आप पहले से ही हर दिन कृत्रिम बुद्धिमत्ता (एआई) द्वारा संचालित सेवाओं का उपयोग कर रहे हैं। लेकिन क्या वास्तव में शक्तियों को सीखने की मशीन? आइए AI मशीन लर्निंग के हुड के तहत इंजन पर एक नज़र डालें।

मशीन लर्निंग कृत्रिम बुद्धिमत्ता का एक सबसेट है जिसमें कार्यों को करने के लिए स्पष्ट हार्ड-कोडिंग (प्रोग्रामिंग) की आवश्यकता नहीं होती है। यह मशीन लर्निंग एल्गोरिदम को बड़ी मात्रा में डेटा प्रदान करने और प्रक्रिया से “सीखने” के लिए प्राप्त किया जाता है। मशीन लर्निंग को ऐसे तरीके से किया जाता है जो या तो पर्यवेक्षित, अनसुनी, अर्ध-पर्यवेक्षित, या सुदृढीकरण विधियों द्वारा किया जाता है।

पर्यवेक्षित मशीन लर्निंग लेबलिंग डेटा का उपयोग करता है – प्रत्येक इनपुट के लिए, एक ज्ञात और संबंधित आउटपुट मान है। पर्यवेक्षित सीखने का लक्ष्य एक फ़ंक्शन सीखना है जो इनपुट और आउटपुट डेटा के बीच संबंध का सबसे अच्छा अनुमान लगाता है। जबकि अनुपयोगी शिक्षण में, इनपुट डेटा से जुड़े कोई लेबल आउटपुट प्रशिक्षण डेटा नहीं होते हैं, इसलिए मशीन द्वारा दिए गए इनपुट प्रशिक्षण डेटा से अनुमान लगाने के लिए उद्देश्य है – डेटा बिंदुओं के बीच समानता और अंतर की पहचान करना। अर्ध-पर्यवेक्षित मशीन लर्निंग कुछ लेबल प्रशिक्षण डेटा का उपयोग करता है।

सुदृढीकरण अधिगम (RL) वह विधि है जहाँ अधिगम को अधिकतम करने के लक्ष्य के साथ अपने वातावरण के साथ बातचीत करने वाले सॉफ़्टवेयर एजेंटों के माध्यम से प्राप्त किया जाता है। मार्कोव निर्णय प्रक्रियाएं (एमडीपी) आमतौर पर सुदृढीकरण सीखने के लिए उपयोग की जाती हैं। अनिश्चित वातावरण में एमडीपी गणितीय रूप से निर्णय लेता है।

आर्टिफिशियल इंटेलिजेंस के केंद्र में कंप्यूटर एल्गोरिदम में प्रयुक्त गणित और आँकड़े हैं, जो किसी समस्या को हल करने की प्रक्रियाएँ हैं। प्रतिगमन, वर्गीकरण या क्लस्टरिंग करने वाले एल्गोरिदम सामान्य मशीन सीखने के कार्यों के उदाहरण हैं।

प्रतिगमन की अवधारणा को पॉलीमथ सर फ्रांसिस गैल्टन (चार्ल्स डार्विन के चचेरे भाई) ने अपने आनुवांशिकी शोध पत्रों “क्रमशः वंशानुगत कद में औसत दर्जे की ओर प्रतिगमन” और “प्राकृतिक विरासत” क्रमशः 1886 और 1889 में प्रकाशित किया था। “माध्य की ओर प्रतिगमन” डेटा आउटलेर के लिए घटना है जो कि मापी जाने वाली अगली बार औसत के करीब होने के लिए आदर्श से बाहर है। वैज्ञानिक शब्दों में, डेटा सैंपलिंग में त्रुटियों के कारण आम तौर पर प्रतिगमन होता है। यह तब उत्पन्न हो सकता है जब नमूना आकार बहुत छोटा हो या यदि नमूने यादृच्छिक रूप से चयनित न हों।

यह सोचने का एक तरीका है कि आप एक कैसीनो में आगे हैं, क्योंकि जीत एक यादृच्छिक अव्यवस्था है, और समय के साथ परिणाम, “तालिका से दूर चलने” के लिए परिचित कहावत के संदर्भ में है। जीत की लकीरें असामान्य परिणाम हैं और संभावनाएं अधिक हैं कि समय के साथ आप अंततः हारना शुरू कर देंगे यदि आप खेलते रहेंगे।

रेखीय प्रतिगमन प्रतिगमन का सबसे सरल रूप है जो मशीन लर्निंग एल्गोरिदम में भविष्य कहनेवाला विश्लेषण के लिए उपयोग किया जाता है। लक्ष्य एल्गोरिथ्म के वास्तविक मूल्य और अनुमानित मूल्य के बीच त्रुटि को कम करना है। एक लागत फ़ंक्शन, जिसे मीन स्क्वेर्ड एरर (MSE) फ़ंक्शन के रूप में भी जाना जाता है, भविष्यवाणी त्रुटियों को मापता है।

ग्रैडिएंट डिसेंट एक फ़ंक्शन के गुणांक (पैरामीटर) के मूल्यों की पहचान करने के लिए उपयोग किए जाने वाले मशीन लर्निंग के लिए एक अनुकूलन एल्गोरिथ्म है जो एक लागत फ़ंक्शन को कम करेगा।

रैखिक प्रतिगमन अपेक्षाकृत सरल और सीधा है। हालाँकि, किसी भी डाटासेट में, दो चर के बीच का संबंध सीधे आनुपातिक नहीं होता है, और इसलिए इसे रैखिक प्रतिगमन द्वारा प्राप्त नहीं किया जा सकता है। मशीन लर्निंग में, आमतौर पर गैर-रेखीय प्रतिगमन तकनीकों का उपयोग किया जाता है। Nonlinear प्रतिगमन एल्गोरिदम के उदाहरणों में ढाल वंश, गॉस-न्यूटन और लेवेनबर्ग-मार्क्वार्ड तरीके शामिल हैं।

एक और सामान्य मशीन लर्निंग कार्य वर्गीकरण है। वर्गीकरण की देखरेख मशीन सीखने से होती है जहाँ कंप्यूटर लेबल प्रशिक्षण डेटा से सीखता है और डेटा के लिए कक्षा की सटीक भविष्यवाणी करने के लक्ष्य के साथ सीखने को लागू करता है। उदाहरण के लिए, एचबीओ की कॉमेडी “सिलिकॉन वैली” में, उद्यमी पात्रों में से एक, श्री जियान-यांग, ने एक एआई ऐप बनाया, जिसे “नॉट हॉटडॉग” कहा जाता है ताकि छवियों को हॉट डॉग या हॉट डॉग के रूप में वर्गीकृत किया जा सके। वास्तविक जीवन में, शो के प्रमुख तकनीकी सलाहकार टिम एंगलेड ने एक नॉट हॉटडॉग ऐप बनाया। किसी भी मशीन सीखने के साथ, प्रशिक्षण की मात्रा और गुणवत्ता महत्वपूर्ण है। इस मामले में, एंगलेड ने मीडियम पर अपने ब्लॉग पोस्ट में लिखा है कि इस्तेमाल किए गए शुरुआती डेटासेट में पूर्वाग्रह के कारण, ऐप “फ्रांसीसी शैली के हॉटडॉग, एशियाई हॉटडॉग और अधिक विषमताओं को पहचानने में असमर्थ था, हमारे पास तत्काल व्यक्तिगत अनुभव नहीं था,” और एआई प्रभावित होता है “उसी मानव पूर्वाग्रह द्वारा हम मानव द्वारा प्रदान किए गए प्रशिक्षण सेटों के माध्यम से शिकार करते हैं।”

तीसरे प्रमुख प्रकार का मशीन लर्निंग टास्क क्लस्टरिंग है- अनप्लिज्ड मशीन लर्निंग के माध्यम से समान समूहों को अनलिस्टेड डेटा का संगठन। क्लस्टरिंग की अवधारणा को स्पष्ट करने के लिए, आइए मानव-आधारित सांख्यिकीय क्लस्टर विश्लेषण का एक उदाहरण देखें- जॉन स्नो, एमडी द्वारा किया गया कार्य, पहले महामारी विज्ञानियों में से एक था। डॉ। स्नो ने हैजा के मामलों की मैपिंग की, और देखा कि प्रकोप के गुच्छे एक पानी के पंप के पास थे। जैसा कि यह पता चला है, उस पंप के पानी को हैजे के साथ एक बच्चे के गंदे डायपर से प्रदूषित किया गया था। डॉ। स्नो ने कहा कि 1854 में सोहो के लंदन पड़ोस में एक बड़े प्रकोप के दौरान हैजा एक जल जनित बीमारी थी। अपने विस्तृत विश्लेषण के आधार पर, उन्होंने निष्कर्ष निकाला कि हैजा “मिस्मा” (“खराब हवा”) के कारण नहीं था जैसा कि उस समय प्रमुख विचार था।

कई उद्योग क्षेत्रों में कृत्रिम बुद्धिमत्ता (एआई) निवेशों में हालिया उछाल बड़े पैमाने पर गहरी सीखने से पैटर्न-मान्यता क्षमताओं, तंत्रिका नेटवर्क की दो से अधिक परतों की मशीन सीखने की विधि के कारण है। डीप लर्निंग तंत्रिका नेटवर्क है जिसमें दो या अधिक परतें होती हैं जो नॉनलाइनियर प्रोसेसिंग का उपयोग करती हैं। डीप लर्निंग छवि और भाषण मान्यता के लिए उपयोग किए जाने वाले पैटर्न-मान्यता के लिए अत्याधुनिक है। यह तकनीक इष्टतम है जब प्रशिक्षण के लिए बड़े डेटा सेट उपलब्ध हैं।

AI को सोशल मीडिया ऐप, इंटरनेट सर्च, ऑनलाइन शॉपिंग सुझाव, कस्टमर सर्विस बॉट्स, पर्सनैलिटी मेडिसिन, फाइनेंशियल ट्रेडिंग, इंडस्ट्रियल मैन्युफैक्चरिंग मैनेजमेंट, मेडिकल ड्रग डिस्कवरी, फ्रॉड से बचाव, बिजनेस इंटेलिजेंस एनालिटिक्स, ह्यूमन रिसोर्स, वर्चुअल असिस्टेंट, ऑटोबासी व्हीकल्स में भर्ती किया गया , अनुवाद इंजन, चेहरे की पहचान, छवियों को रंग में परिवर्तित करना और यहां तक ​​कि परिवहन भी। गणित, सांख्यिकी, डेटा विज्ञान और कंप्यूटर विज्ञान के अंतःविषय क्षेत्र मशीन सीखने में परिवर्तित होते हैं, जो बदले में, तेजी से बदल रहा है कि हम कैसे रहते हैं, काम करते हैं और खेलते हैं।

कॉपीराइट © 2019 केमी रोसो सभी अधिकार सुरक्षित।

संदर्भ

गैल्टन, फ्रांसिस। “वंशानुगत कद में औसत दर्जे की ओर झुकाव।” मैकमिलन । 1886. http://galton.org/books/natural-inheritance/pdf/galton-nat-inh-1up-clean.pdf से 2-4-2019 को लिया गया।

गैल्टन, फ्रांसिस। “प्राकृतिक वंशानुक्रम।” मैकमिलन । 1889. http://galton.org/books/natural-inheritance/pdf/galton-nat-inh-1up-clean.pdf से 2-4-2019 को लिया गया।

GeegksforGeeks। “मशीन लर्निंग में क्लस्टरिंग।” https://www.geeksforgeeks.org/ से 2/4/2019 को लिया गया।

एंगल्ड, टिम। “कैसे HBO की सिलिकॉन वैली ने मोबाइल TensorFlow, Keras & React Native के साथ” Not Hotdog “बनाया। मध्यम । 26 जून 2017।

रोजर्स, साइमन। “जॉन स्नो की डेटा पत्रकारिता: हैजा का नक्शा जिसने दुनिया को बदल दिया।” गार्जियन 15 मार्च 2013।