मतदाता प्रभाव के लिए कैसे कैम्ब्रिज विश्लेषणात्मक खनन डेटा

गलत जानकारी के साथ व्यक्तिगत डेटा की मांग क्यों करना एक बड़ा सौदा है।

अगर हम ओबामा के चुनावों में सोशल मीडिया एनालिटिक्स के इस्तेमाल पर नजर रखते हैं, तो हम शायद पूछ सकते हैं कि ट्रम्प अभियान ने रिसर्च फर्म कैम्ब्रिज एनालिटिका के साथ क्या करने की कोशिश की है? क्या यह कैम्ब्रिज एनालिटिका के फेसबुक नीति का उल्लंघन है या यह उससे बड़ा सौदा है?

जनवरी 2013 में, मैंने इस बारे में लिखा था कि राष्ट्रपति ओबामा ने 2008 और 2012 के राष्ट्रपति अभियानों में सोशल मीडिया का प्रभावी ढंग से उपयोग किया था, जिसमें उनकी टीम के सोशल मीडिया की तुलना में केनेडी की टेलीविजन का उपयोग करने की क्षमता थी। जहां केनेडी में करिश्मा और अच्छे बाल जैसे कई सहज प्रतिभाएं थीं, जिसने उन्हें घर पर टीवी स्क्रीन पर लेंस में अच्छी तरह से प्रोजेक्ट करने की इजाजत दी, ओबामा की टीम ने सोशल मीडिया का उपयोग करके काम करने के लिए सामाजिक मनोविज्ञान रखा। 2016 में, ट्रम्प के लोग डेटा बदल गए।

Pamela Rutledge/Shutterstock

स्रोत: पामेला रूटलेज / शटरस्टॉक

अब हम डेटा विज्ञान की उम्र में हैं। कई सोशल मीडिया प्लेटफ़ॉर्म से डेटा को स्क्रैप करने की क्षमता, उपयोगकर्ता व्यवहार पैटर्न और टिप्पणियों को कैप्चर करना अभूतपूर्व है। इसने उच्चतम आंकड़ों के वैज्ञानिकों की भारी मांग पैदा की है, जो आंकड़ों की विशाल मात्रा में फसल और विश्लेषण करने के बारे में सोच रहे हैं, जो एल्गोरिदम बनाते हैं और जवाब देते हैं, और अनुमानित मॉडल बनाते हैं। उनका टूलबॉक्स मशीन लर्निंग, आंकड़े, मजबूत प्रोग्रामिंग कौशल और कृत्रिम और प्राकृतिक खुफिया दोनों का एक प्रभावशाली मिश्रण है- और वे सभी मानव व्यवहार को हमेशा प्रभावित और लक्षित तरीकों से पकड़ने और प्रभावित करने की कोशिश कर रहे हैं।

ओबामा और ट्रम्प के बीच जो भी तुलना हो सकती है, वे लाल बालियां हैं। यह इस सार्वजनिक बहस के केंद्र में मौजूद डेटा तक पहुंच और उपयोग है। यह सामान दूर नहीं जा रहा है। यह केवल अधिक परिष्कृत और सर्वव्यापी होगा। यह न तो सभी बुरा है, न ही सब अच्छा है। यह एक महत्वपूर्ण शिक्षण क्षण है- डेटा खनन के आसपास कुछ महत्वपूर्ण नैतिक और कानूनी मुद्दों को बेहतर ढंग से समझने का अवसर- यदि हम राजनीतिक उंगली-बिंदु के खरगोश छेद में नहीं आते हैं।

फिर भी, कई तुलना करना चाहते हैं। डेटा विज्ञान के विकास में चार साल सचमुच जीवन भर है। 2008 और निश्चित रूप से 2012 में क्या हो रहा था, इसकी तुलना में क्षमताओं और सामाजिक वातावरण दोनों अलग-अलग हैं। डेटा और स्क्रैप और डेटा का मूल्यांकन करने की क्षमता अब और अधिक परिष्कृत है – दोनों तकनीकी और सैद्धांतिक आधार से-ओबामा की टीम क्या करने में सक्षम थी उपयोग।

    लेकिन सबसे महत्वपूर्ण बात यह है कि सामाजिक वातावरण बदल गया है और इसके साथ-साथ डेटा उल्लंघनों की जागरूकता और गोपनीयता का उल्लंघन करने के लिए डेटा का उपयोग करके समझ, नैतिक दिशानिर्देशों और विनियमों में वृद्धि शामिल है। लोग अमेज़ॅन अनुशंसाओं से साइट पर साइट पर आने वाले लक्षित विज्ञापनों तक, हमारे ऑनलाइन व्यवहारों के आधार पर डेटा एल्गोरिदम का उपयोग कैसे करते हैं, इस बारे में लोगों को तेजी से पता है। पारदर्शिता, अनुमति और गोपनीयता बनाए रखने के लिए – सुरक्षा के लिए और हेरफेर से बचने के लिए- सभी सीटी-उड़ने वालों और सामाजिक प्रवचन के प्रमुख विषय हैं।

    कैम्ब्रिज विश्लेषणात्मक विवाद के साथ बड़े मुद्दों में से एक डेटा को एकत्रित करने के तरीके पर केंद्रित है। रिपोर्ट के मुताबिक न्यूयॉर्क टाइम्स और अन्य जगहों पर, कैम्ब्रिज ने उद्देश्य और मंशा के रूप में भ्रामक प्रकटीकरण के साथ एक ऐप के माध्यम से व्यक्तिगत जानकारी की मांग की। विभिन्न प्रकार की जानकारी की मांग की गई, जिनमें से कुछ कॉलेज के प्रमुख और राजनीतिक संबद्धता जैसे निर्दोष लगते हैं, लेकिन ऐप में व्यक्तित्व प्रोफाइल बनाने के लिए व्यक्तित्व मूल्यांकन प्रश्न भी शामिल थे।

    अब, यह एक बड़ा सौदा क्यों है? हम पहले से ही जानते हैं कि टेक्स्ट डेटा के समूह से व्यक्तित्व प्रोफ़ाइल का अनुमान लगाना संभव है या किसी के फेसबुक प्रोफाइल को कोडिंग करके, शोधकर्ताओं ने दिखाया है। समस्या यह है कि इसे पैमाने पर करना मुश्किल है। आपके पास प्रत्येक प्रतिभागी से महत्वपूर्ण मात्रा में टेक्स्ट होना चाहिए, जो कि किसी भी आकार के समूह के लिए बेहद महंगा और श्रम-केंद्रित हो जाता है। जहां मनोवैज्ञानिक शोधकर्ता 200 के प्रतिभागियों के समूह को देख सकते हैं और अपनी सामान्यता के साथ क्लैम्स के रूप में खुश रह सकते हैं, यह मतदाता दृढ़ता के लिए इसे काट नहीं देता है। हालांकि मनोवैज्ञानिक रूप से लक्ष्य दर्शकों की प्रोफ़ाइल की इच्छा बहुत बड़ी अपील है क्योंकि यह मूल्यवान जानकारी प्रदान करती है जो वर्तमान में सार्वजनिक रूप से उपलब्ध नहीं है। विभिन्न शोध फर्म प्राकृतिक भाषा प्रसंस्करण जैसे विश्लेषणात्मक तकनीकों का उपयोग करके या आईबीएम के वाटसन की शक्ति का उपयोग करके समाधान पर काम कर रहे हैं, लेकिन वर्तमान में यह या तो मानव संसाधन उद्देश्यों (प्रतिभागी अनुमति के साथ) के लिए छोटे समूहों में उपयोग किया जाता है या कुल मिलाकर “अंधे” व्यक्तिगत पहचान के लिए। सबसे महत्वपूर्ण बात यह है कि, ये अनुमान हैं-माना जाता है कि कुछ दूसरों की तुलना में बेहतर हैं-लेकिन वे व्यक्तित्व प्रोफ़ाइल के समान नहीं हैं जो आपको लोगों को मान्यता प्राप्त मनोवैज्ञानिक परीक्षण उपायों से प्राप्त करने से मिलता है। (एफवाईआई – कुछ तर्क देते हैं कि चूंकि व्यक्तित्व परीक्षण आत्म-रिपोर्ट हैं, इसलिए वे डेटा से अनुमानित प्रोफाइल की तुलना में वास्तव में कम सटीक हैं, लेकिन मैं उन लोगों को छोड़ देता हूं जिनके मूल्यांकन के लिए आकलन के लिए अधिक अनुभव होते हैं।)

    कहने की जरूरत नहीं है, अगर एक कंपनी खुद को व्यक्तित्व परीक्षण लेने के लिए लोगों को प्राप्त कर सकती है तो बहुत सारे लोगों के व्यक्तित्व प्रोफाइल प्राप्त करना बहुत आसान है। अगर वे लोगों को यह नहीं बताते कि यह क्या है, तो कंपनी को अपने उद्देश्यों के लिए “अच्छे दिखने” के जवाब देने वाले प्रतिभागियों के बारे में चिंता करने की ज़रूरत नहीं है। सोशल मीडिया हैंडल के कुछ और महत्वपूर्ण प्रश्न और पहुंच से ऐप डेवलपर सोशल मीडिया अकाउंट्स से डेटा को स्क्रैप कर सकता है (जिसे ऐप ने ऐप का उपयोग करने के लिए इसमें प्रवेश करने के बाद से ऐप किया है), क्रैक डेटा वैज्ञानिक को लिंक करना आसान है पसंद, नापसंद, नीति की स्थिति, दोस्तों की पहचान, और भविष्यवाणी मॉडल बनाने के लिए व्यक्तित्व प्रोफाइल।

    अब उनके पास मूवी वरीयताओं जैसे “लाइफस्टाइल वैरिएबल” न केवल मनोवैज्ञानिक लक्षणों के आधार पर व्यक्तियों को लक्षित करने की क्षमता है। सभी ईमानदारी में, विपणक ऐसा करना पसंद करेंगे, लेकिन वे नहीं करते हैं। सामाजिक मीडिया कंपनियों से गोपनीयता नियमों और नैतिक मानकों का उल्लंघन किए बिना लक्षित उपयोगकर्ता डेटा से जुड़े निजी वरीयता डेटा को न केवल मुश्किल है, बल्कि उनके पास वैध व्यक्तित्व परीक्षणों का आउटपुट भी नहीं है। उदाहरण के लिए, ट्विटर जैसी कंपनियां विपणन और राजनीतिक अभियानों से डेटा मिलान अनुरोधों में उत्साहपूर्वक व्यक्तिगत उपयोगकर्ता पहचान की रक्षा करती हैं। कैम्ब्रिज विश्लेषणात्मक ने इस तथ्य का लाभ उठाया कि हम में से अधिकांश एक ऐप में साइन इन करेंगे और अगर हम सुरक्षित महसूस करते हैं तो निजी जानकारी दे देंगे। फेसबुक पर सॉलिसिटिंग और लोगों को यह बताते हुए कि अकादमिक शोध के लिए उन्हें सुरक्षित महसूस किया गया। इस प्रकार कानूनी सवाल: क्या झूठी झगड़े के तहत अनुमति दी गई है तो क्या यह गिनती है?

    ओबामा के अभियान के दौरान 2008 और 2012 में, उनकी टीम सार्वजनिक रूप से उपलब्ध प्रोफाइल का उपयोग कर रही थी। अगर आपने फेसबुक पर ओबामा से मित्रता की है, तो आपने उसे अपना डेटा दिया और उसे दिखाया कि आपके दोस्त कौन थे। यह ठीक प्रिंट में है। इसे कुछ समय पढ़ें। उपयोगकर्ता द्वारा प्रदत्त डेटा ने उन्हें पॉलिसी की ओर संभावित पूर्वाग्रहों की पहचान करने की अनुमति दी, जो कि ज़िप कोड जैसे अन्य उपलब्ध डेटा के साथ मेल खाते हैं।

    लोग हर समय जानकारी से भविष्यवाणियां करते हैं। जब हम अपने अनुभव का उपयोग कर रहे हैं, तो इसे एक ह्युरिस्टिक कहा जाता है। सूचना और गणित के समूह के साथ, इसे डेटा विज्ञान कहा जाता है। सवाल सटीकता है। कैम्ब्रिज के आंकड़ों को एकत्रित करने के साथ ही, लोगों को प्रभावित करने की उनकी क्षमता निश्चित बात नहीं है या कुछ लोगों ने दावा किया है कि संस्कृति को बाधित करने की क्षमता है। लेकिन निजी लक्ष्यीकरण दृढ़ता से अधिक संभावना और अनुमति के बिना लक्ष्यीकरण बनाता है, चलिए इसका सामना करते हैं, डरावना। ओबामा की टीम उस समय काफी परिष्कृत थी, लेकिन Google, अमेज़ॅन या किसी अन्य डेटा-संचालित वाणिज्यिक चिंता से कहीं ज्यादा नहीं थी। ओबामा का अभियान पहली बार था जब सोशल मीडिया मार्केटिंग तकनीकों को राजनीति में लागू किया गया था। ध्यान उनके लक्ष्यीकरण के परिष्कार से नहीं आया, जितना ओबामा की सोशल नेटवर्क्स पर अपने व्यक्तित्व का उपयोग करने के लिए एक जमीनी उत्साह को सक्रिय करने और प्रभावी रूप से अभियान खजाने को भी बढ़ावा देने के लिए।

    जो हम अभी भी नहीं जानते हैं, ट्रम्प अभियान ने कैम्ब्रिज से अपने डेटा के साथ क्या करने को कहा? यह कहानी सामने आएगी। हालांकि, लोगों को छेड़छाड़ नहीं करना पसंद है। आप सकारात्मक और नकारात्मक समाचार फ़ीड के साथ प्रयोग करने के लिए फेसबुक पर सार्वजनिक प्रतिक्रिया को याद कर सकते हैं यह देखने के लिए कि सामग्री की वैलेंस ने समग्र स्वर और “मूड” बदल दिया है – और यह काफी हद तक कुल मिलाकर व्यक्तिगत लक्ष्यीकरण के लिए नहीं था। यह देखना दिलचस्प होगा कि क्या लोगों को समान रूप से छेड़छाड़ की संभावना मिलती है या यदि पार्टी की लाइनों के साथ अलग-अलग चीजें लेबल की जाती हैं।

    प्रत्येक राजनेता यह देखता है कि मतदाताओं के साथ क्या गूंज जाएगा। 2012 के चुनाव में सोशल मीडिया डेटा और मतदाता प्रोफाइलिंग का उपयोग कैम्ब्रिज एनालिटिका के डेटा शोषण के मुकाबले लगभग काफी अच्छा लगता है। लेकिन यह पहली बार है (जिसे हम जानते हैं) कि लोगों को प्रकटीकरण में लोगों को धोखा देने के लिए गलत जानकारी का उपयोग करके राजनीतिक उद्देश्यों के लिए डेटा की मांग की गई है। यह ट्रम्प-क्लिंटन चुनाव के दौरान और उसके बाद घूमने वाली गलत जानकारी की मात्रा के कारण कई लोगों के लिए एक गंभीर गर्म बटन ट्रिगर करता है। नकली खबरों के लिए हर कोई अति संवेदनशील है, इससे कोई फर्क नहीं पड़ता कि उनके राजनीतिक दृढ़ संकल्प। यह जानकर कि गलत जानकारी इस डेटा एकत्रण की जड़ पर थी, उल्लंघन कई लोगों के लिए और अधिक आक्रामक प्रतीत होता है, विशेष रूप से संज्ञानात्मक पूर्वाग्रह जो हमें पिछले अनुभव के आधार पर व्यवहार या इरादों को विशेषता देता है। (अगर वे ए पर धोखा दे रहे हैं, तो वे बी पर धोखा दे सकते हैं या यदि उन्होंने बी पर धोखा दिया है, तो उन्होंने ए पर धोखा दिया होगा।) यह तर्कसंगत नहीं है लेकिन छेड़छाड़ की जा रही है, जो लोगों को स्वाभाविक रूप से एक रक्षात्मक और संदिग्ध स्थिति में विश्वास करती है।

    अफसोस की बात है, यह सब बहुत उंगली-पॉइंटिंग में प्रकट होता है और हम हमेशा किसी को दोषी मानना ​​पसंद करते हैं। इस मामले में, ऐसा लगता है कि फेसबुक के पैर कैम्ब्रिज एनालिटिका के साथ लौ में होंगे। मुझे गंभीरता से संदेह है कि अगर किसी संगठन को अपने इरादे को गलत तरीके से प्रस्तुत करने से रोकने के लिए फेसबुक कुछ भी कर सकता है। हालांकि, विडंबना यह है कि फेसबुक के लिए, उनके ब्रांड की ताकत ने ऐप को स्पष्ट रूप से मान्य किया।

      Intereting Posts
      तलाकशुदा 50 से अधिक? डेटिंग के बारे में सोच रहे हैं? यहाँ कुछ युक्तियाँ हैं गुस्सा व्यक्ति के साथ घनिष्ठ संबंध बहुत पतली मॉडल: क्या वे भोजन विकारों के मॉडल हैं? आनंद लें और आनंद लें … या कम से कम इसे एक शॉट दें मुझे बीमार क्यों मिला? एथलीट्स और भोजन विकार द चार आर – पढ़ना, 'राइटिंग,', राथैटिक एंड रेज़ोनेंस 5 अच्छे और बुरे तरीके प्राकृतिक प्रभाव आपकी भावनात्मक स्वास्थ्य तनाव के तहत एक राष्ट्र मशीन एम्पाथ बच्चों को निराशा का प्रबंधन करने के लिए 7 सकारात्मक उपाय एंथोनी वीनर के दिमाग में क्या हो रहा था? डिस्लेक्सिया जागरूकता की आयु में आपका स्वागत है आपके बच्चे को संबंधित और इंटरैक्टिंग के लिए प्रोग्राम किया गया है असली अभिनय