डाटा
प्रोसेसिंग क्या है?
डेटा
प्रोसेसिंग तब होती है जब डेटा को एकत्र किया जाता है और उपयोग करने योग्य जानकारी
में अनुवाद किया जाता है। आमतौर पर डेटा वैज्ञानिक या डेटा वैज्ञानिकों की टीम }kjk प्रदर्शन
किया जाता है, डेटा प्रोसेसिंग के लिए सही तरीके
से काम करना महत्वपूर्ण है क्योंकि अंत उत्पाद, या डेटा
आउटपुट को नकारात्मक रूप से प्रभावित नहीं करता है।
डेटा
प्रसंस्करण अपने कच्चे रूप में डेटा के साथ शुरू होता है और इसे एक अधिक पठनीय
प्रारूप (ग्राफ़, दस्तावेज़, आदि)
में परिवर्तित करता है, यह कंप्यूटर द्वारा व्याख्या किए जाने
के लिए आवश्यक रूप और संदर्भ देता है और पूरे संगठन में कर्मचारियों द्वारा उपयोग
किया जाता है।
डेटा
प्रोसेसिंग के छह चरण
1. डेटा संग्रह (Data Collection)
डेटा
एकत्र करना डाटा प्रोसेसिंग में पहला कदम है। डेटा उपलब्ध झीलों और डेटा वेयरहाउस
सहित उपलब्ध स्रोतों से खींचा जाता है। यह महत्वपूर्ण है कि उपलब्ध डेटा स्रोत
भरोसेमंद और अच्छी तरह से निर्मित हों, इसलिए एकत्र किए
गए डेटा (और बाद में जानकारी के रूप में उपयोग किए जाने वाले) उच्चतम संभव
गुणवत्ता के हैं।
2. डेटा की तैयारी (Preparation of Data)
एक
बार डेटा एकत्र करने के बाद, यह डेटा तैयारी
चरण में प्रवेश करता है। डेटा तैयारी, जिसे अक्सर
"प्री-प्रोसेसिंग" के रूप में संदर्भित किया जाता है, वह चरण होता है जिस पर डेटा प्रोसेसिंग के निम्न चरण के लिए कच्चे डेटा को
साफ और व्यवस्थित किया जाता है। तैयारी के दौरान, किसी भी
त्रुटि के लिए कच्चे डेटा की जांच की जाती है। इस कदम का उद्देश्य खराब डेटा
(अनावश्यक, या गलत डेटा) को खत्म करना है और सबसे अच्छी
व्यावसायिक बुद्धि के लिए उच्च-गुणवत्ता वाला डेटा बनाना शुरू करना है।
3. डेटा इनपुट (Data Input)
फिर
स्वच्छ डेटा को अपने गंतव्य (शायद एक CRM जैसे Salesforce
या Redshift जैसे डेटा वेयरहाउस) में प्रवेश
किया जाता है, और एक ऐसी भाषा में अनुवादित किया जाता है
जिसे वह समझ सकता है। डेटा इनपुट पहला चरण है जिसमें कच्चे डेटा को उपयोगी जानकारी
के रूप में लेना शुरू किया जाता है।
4. प्रसंस्करण
इस
चरण के दौरान, पिछले चरण में कंप्यूटर को इनपुट किया
गया डेटा वास्तव में व्याख्या के लिए संसाधित होता है। मशीन लर्निंग एल्गोरिदम का
उपयोग करके प्रसंस्करण किया जाता है, हालांकि प्रक्रिया
स्वयं डेटा के स्रोत (डेटा झीलों, सामाजिक नेटवर्क, जुड़े उपकरणों आदि) के आधार पर थोड़ा भिन्न हो सकती है और इसके इच्छित उपयोग
(विज्ञापन के पैटर्न की जांच, जुड़े उपकरणों से चिकित्सा
निदान,) ग्राहक की जरूरतों का निर्धारण, आदि)।
5. डेटा आउटपुट / व्याख्या ( Data output/interpretation)
आउटपुट
/ व्याख्या चरण वह चरण है जिस पर डेटा गैर-डेटा वैज्ञानिकों के लिए आखिरकार उपयोग
करने योग्य है। इसका अनुवाद, पठनीय और अक्सर
रेखांकन, वीडियो, चित्र, सादे पाठ, आदि के रूप में किया जाता है)। कंपनी या
संस्थान के सदस्य अब अपनी डेटा एनालिटिक्स परियोजनाओं के लिए डेटा को स्वयं सेवा
देना शुरू कर सकते हैं।
6. डेटा भंडारण (Data Storage)
डेटा
प्रोसेसिंग का अंतिम चरण स्टोरेज है। डेटा के सभी संसाधित होने के बाद, इसे भविष्य के उपयोग के लिए संग्रहीत किया जाता है। हालांकि कुछ सूचनाओं
को तुरंत उपयोग करने के लिए रखा जा सकता है, लेकिन इसका
अधिकांश हिस्सा बाद में एक उद्देश्य की पूर्ति करेगा। इसके अलावा, ठीक से संग्रहीत डेटा GDPR जैसे डेटा सुरक्षा कानून
के अनुपालन के लिए एक आवश्यकता है। जब डेटा को ठीक से संग्रहीत किया जाता है,
तो इसे आवश्यक होने पर संगठन के सदस्यों द्वारा जल्दी और आसानी से
एक्सेस किया जा सकता है।