आज-काल डेटा सायन्स रिलेटेड कोर्सेस खूप मार्केटमध्ये येत आहेत आणि त्याचे मार्केटिंग असे केले जात आहे की कोणीही डेटा सायंटिस्ट बनवू शकते त्यासाठी कुठलीही पात्रता असण्याची गरज नाही, कुठल्याही प्रकारची डिग्री असण्याची गरज नाही, आणि तुम्ही एक चांगल्या प्रकारचे डेटा सायंटिस्ट बनवू शकाल पण या वाक्यामध्ये किती तथ्य आहे हे आपण या आर्टिकल मध्ये बघूया.
सर्वप्रथम डेटा सायन्स म्हणजे प्रोग्रामिंग नव्हे फक्त पायथन शिकले म्हणजे डेटा सायन्स शिकणे सोपे होईल असे नव्हे. डेटा सायन्स मध्ये पायथन हा एक महत्वाचा भाग आहे पण फक्त एकच भाग नाहीये.
त्यामुळे डेटा सायन्स म्हणजे फक्त पायथॉन प्रोग्रामिंग नव्हे हे लक्षात ठेवणे महत्त्वाचे आहे.
याचे सोपे उदाहरण असे म्हणजे की एखाद्याला मराठी किंवा इंग्रजी खूप चांगले येत असेल तर त्याचा अर्थ असा नव्हे की तो एक उत्तम लेखक बनू शकेल तसेच फक्त पायथॉन येत आहे म्हणून डेटा सायंटिस्ट होईल असे नाही.
डेटा सायन्स हे मल्टी डिसिप्लनरी फिल्ड आहे म्हणजे काय तर ह्याच्यामध्ये अनेक विषय एकत्र आलेले आहेत डेटा सायन्स मध्ये जसे पायथन आहे म्हणजेच थोडक्यात प्रोग्रामिंग आहे तसेच खूप मोठा भाग हा गणिताचा आणि स्टॅटिस्टिक्स चा आहे.
तसेच डेटा सायन्स हे कुठल्यातरी ऍक्चुअल एखाद्या फिल्डमध्येे वापरले जाते.
जसे की उदाहरणार्थ क्रिकेटमध्ये अनेक वेगवेगळ्या प्रकारच्या डेटा तयार होतो त्याच्यामध्ये तुम्हाला काही डेटा अनालिसिस करायचं असेल किंवा तुम्हाला काही पॅटर्न शोधायचे असतील किंवा तुम्हाला काही तर्क मांडायचे असतील तर तुम्ही डेटा सायन्स वापरू शकता पण मुळात क्रिकेटचे ज्ञान असणे या ठिकाणी गरजेचे आहे.
यालाच आपण डोमेन नॉलेज असे म्हणतो म्हणजे डेटा सायन्स वापरून जर तुम्हाला काही प्रेडिक्ट करायचे असेल की हे गाणे कुठल्या प्रकाराचे आहे पॉप आहे जॅझ आहे का अजून कुठल्या प्रकारचे आहे पण त्यासाठी पॉप आणि जॅझ कुठल्या नोट्स वापरल्या जातात हे माहीत असणं गरजेचं आहे.
आणि ते कुणाला माहीत असेल ते एखाद्या संगीतकाराला किंवा गायकाला किंवा संगीत या विषयांमध्ये ज्याने काम केलेला आहे त्यालाच माहीत असेल.
म्हणूनच डोमेन नॉलेज शिवाय डेटा सायन्सचा काही उपयोग नाहीये.
अजून एक गोष्ट म्हणजे डेटा सायन्स मध्ये आपण पायथन प्रोग्रामिंग वापरतो.
तर आपण मुळात पायथन कशासाठी वापरतो?
तर वेगवेगळे जे डेटा सायन्सचे अल्गोरिथम की जसं की डिसिजन ट्री आहे.
डिसिजन ट्रीने आपण काहीतरी आउटटमची प्रोबॅबिलिटी काढू शकतो आणि त्याचा अल्गोरिदम हा पायथॉन मध्ये रेडी अवेलेबल आहे पण जर आपल्याला डिसिजन ट्री काय आहे ती कधी वापरायची ती कुठे वापरायची त्याचे लिमिटेशन्स काय आहे त्याच्या ऍडव्हान्टेजेस काय आहेत हेच जर माहीत नसेल तर उपयोग होणार नाही.
म्हणजेच थोडक्यात काय तर डेटा सायन्स हा कुठला ब्लॅक बॉक्स नाही आहे की ज्याला इनपुट दिला की काहीतरी आउटपुट येईल. पण त्या ब्लॅक बॉक्समध्ये काय घडत आहे काय होत आहे कशाप्रकारे डेटा प्रोसेस केला जात आहे हेही माहित करून घेणे तेवढेच महत्त्वाचे आहे.
त्यासाठी तुम्हाला फक्त पायथन प्रोग्रामिंग येऊन उपयोगाचे नाही तर तुम्हाला स्टॅटिस्टिक्स मधले वेगवेगळे जे कन्सेप्ट आहेत ते आणि त्याबरोबर अल्गोरिदम्स ही माहीत पाहिजेत.
तर मग अशाप्रकारे आपण असे म्हणू शकतो की चार गोष्टी माहित असणं खूप महत्त्वाचा आहे जर तुम्हाला एक डेटा सायन्स प्रोफेशनल बनायचं असेल तर
१. पायथॉन प्रोग्रामिंग
२. स्टॅटिस्टिक्स
३. अल्गोरिदम आणि
४. डोमेन नॉलेज
या जर चार गोष्टी तुम्ही शिकला असाल किंवा या चार गोष्टी शिकण्याची तयारी असेल तर तुम्ही एक डेटा सायन्स प्रोफेशनल बनू शकता नाहीतर फक्त डेटा सायन्सचा कुठलाही कोर्स करून उपयोगाचा नाही कारण बहुतेक कोर्समध्ये स्टॅटिस्टिक्स वगळले जाते आणि फक्त पायथनचे प्रोग्रामिंग शिकवले जाते आणि तिथं जे रेडी टू युज अल्गोरिदम आहे ते कसे वापरायचे एवढेच शिकवले जाते.
म्हणजे जर आपल्याला मिसळ बनवायचे असेल तर जर आपल्याला कोणी मिसळचा रस्सा बनवून दिला असेल आपल्याला किती फरसाण टाकायचं हे काढून दिल असेल त्याच्यामध्ये किती कांदा टाकायचा हे काढून दिल असेल आणि आता आपल्याला म्हणाले मिसळ बनवा तर काय अवघड नाहीये त्यात आपल्याला फक्त मिक्स करायचा आहे.
पण जर मिसळीचा रस्सा बनवायचा कसा हे जर आपल्याला माहित असेल तर आपण त्याच्यामध्ये वेगवेगळ्या गोष्टी चांगल्या पद्धतीने करू शकतो आणि हेच डेटा सायन्स शिकण्यामागचा गमक आहे.
तुम्हाला वेगवेगळ्या ज्या डेटा सायन्स रिलेटेड गोष्टी आहेत त्या तुम्हाला पक्क्या समजल्या तरच तुम्ही एक चांगले डेटा सायन्स प्रोफेशनल बनू शकता.
म्हणून स्वतःला एक गोष्ट नक्कीच विचारा की माझं स्टॅटिस्टिक्स किंवा गणित चांगलं आहे का आणि ते माझे शिकण्याची तयारी आहे का?
जर असेल तर तुम्ही एक डेटा सायन्स प्रोफेशनल नक्की बनवू शकाल.
आणि सगळ्यात महत्वाची गोष्ट. फक्त काहीतरी नवीन आहे आहे. सगळे शिकताय म्हणून मी पण शिकतो असे करू नका.
त्या गोष्टीची आवड निर्माण होणार आहे का किंवा आवड आहे का हे बघा मगच काही नवीन शिकायला चालू करा.