क्या "बड़ा डेटा" नहीं कर सकता

कभी-कभी "चीज़ों का इंटरनेट" कहा जाता है, बिग डेटा आ गया है। यह हाल के सम्मेलन में एमआईटी के सेंटर फॉर डिजिटल बिज़नेस के निदेशक प्रोफेसर ब्रायनजल्फ्ससन ने कहा, "विचारों, मानदंडों, संगठनों और दुनिया के बारे में सोचने के तरीके की जगह" होगा। शायद हो सकता है। लेकिन यह क्या करने में सक्षम नहीं हो सकता है, इसके बारे में सोचने योग्य है।

जैसा कि स्टीव लोहर ने द न्यूयॉर्क टाइम्स में अपने साल के अंत की समीक्षा में रखा था, ऐसे दावे का आधार "इस आधार पर निर्भर करता है कि वेब ब्राउज़िंग ट्रेल्स, सेंसर सिग्नल, जीपीएस ट्रैकिंग और सोशल नेटवर्क संदेश जैसे डेटा खुलेगा लोगों और मशीनों को मापने और उनकी निगरानी करना जैसे कि पहले कभी नहीं। "कंप्यूटर एल्गोरिदम, उस डेटा का उपयोग करते हुए, हमें" सभी प्रकार के व्यवहार: खरीदारी, डेटिंग और वोटिंग, उदाहरण के लिए अनुमान लगाएगा। "

यह सब सच है, और हम इसे काम पर देखते हैं क्योंकि इंटरनेट पहले से ही हमारे कंप्यूटर पर किए गए हर खोज को ट्रैक करता है हम असंख्य संकेतों और सुझावों से बच नहीं सकते हैं कि हम क्या खरीदना चाहते हैं। कुछ भी नहीं भूल गया है या अनदेखा कर दिया है। और ये हम कैसे पता लगाए जा रहे हैं की अधिक पता लगाने योग्य संकेत हैं।

लेकिन जैसा कि लोहर ने इस तरह की भविष्यवाणियां बताई हैं, वे गणितीय मॉडल पर आधारित हैं और हमारे मॉडल मानवीय खुफिया द्वारा बनाए गए हैं। एक बार स्थापित होने पर, मॉडल जल्दी और कुशलता से आंकड़ों की कमी करता है, लेकिन, मनुष्य द्वारा तैयार किए जा रहे हैं, वे स्वयं न केवल दोषपूर्ण हैं बल्कि दुरुपयोग के लिए भी कमजोर हैं।

ऐसे मॉडल में निहित गोपनीयता के आक्रमण के लिए बहुत ध्यान दिया गया है। हम अनजाने में अपने बारे में क्या खुलासा करते हैं? और वह जानकारी का उपयोग करने के लिए हमें हेरफेर करने और नियंत्रित करने के लिए कौन करेगा? यह अब हो रहा है, ज़ाहिर है, लेकिन यह केवल बदतर हो जाएगा और हम कैसे जानते होंगे?

किसी अन्य प्रकार का खतरा है इस्तेमाल किए जाने वाले मॉडल में परिष्कार और सटीकता की कमी। अच्छे कार्यक्रमों में गणित और कंप्यूटर कौशल की आवश्यकता होती है, लेकिन यह भी अभिनव और विचारशील होने की क्षमता है। लोहर ने नोट किया कि मैककिन्से ग्लोबल इंस्टीट्यूट ने अनुमान लगाया है कि अमेरिका को 140,000 से 190,000 अधिक श्रमिकों की "गहरी विश्लेषणात्मक विशेषज्ञता" की आवश्यकता होगी। उन्होंने न्यूयार्क में ऑनलाइन ऐड-टार्गेटिंग स्टार्टअप के मुख्य वैज्ञानिक क्लौडिया पेर्लिच का हवाला दिया: "हम तेजी से कौशल विकसित नहीं कर सकते पर्याप्त।"

यह सिर्फ कंप्यूटर और गणित कौशल नहीं है जो आवश्यक हैं लोहर कहते हैं: "डेटा सुनना महत्वपूर्ण है, लेकिन ऐसा अनुभव और अंतर्ज्ञान है। आखिरकार, किसी भी गणित मॉडल के बजाय मानव मस्तिष्क के माध्यम से फ़िल्टर किए गए सभी प्रकार के आंकड़ों की सबसे अच्छी लेकिन बड़ी मात्रा में आंकड़ों का क्या अंतर्ज्ञान है? "(देखें," ज़रूर, बिग डेटा महान है। "लेकिन इतनी अंतर्ज्ञान है।)

स्पष्ट होने के लिए, जिसमें बेहोश जानकारी शामिल है, जिसमें हम अनावश्यक हैं क्योंकि यह कभी-कभी अप्रासंगिक लगता है, कभी-कभी अफैशनशील और कभी-कभी अवांछित होता है मुद्दा यह है कि यह अक्सर ठीक है कि जानकारी – बिना सोचे, अप्रत्याशित, शायद स्वीकार करना या समझना भी कठिन – यह पता चलता है कि हमें क्या अक्सर पता होना चाहिए

एमआईटी के हालिया सम्मेलन में, लोहर ने रिपोर्ट किया कि एक बिग डेटा में बड़ी विफलताओं के बारे में एक पैनल से पूछा कि कोई उदाहरण नहीं है। बाद में, हालांकि, दर्शकों में से किसी ने टिप्पणी की है कि बिग डेटा क्रेडिट संकट और 2008 की वित्तीय दुर्घटना की भविष्यवाणी करने में विफल रहा है। ओह!

क्या यह हो सकता है कि इसकी क्षमता का भूत अपने अनुयायियों को मानव कारक की उपेक्षा या निराश करने के लिए ले जाता है? क्या बिग डेटा लोगों को अति-आत्मविश्वास या तस्करी कर देता है? यदि हां, तो यह ऐसी समस्या है कि बिग डेटा हल नहीं कर सकता है?

Intereting Posts