डाटा साइंटिस्ट बनने के लिए क्या करे ?
* level 1
1 ) Python एंड R लैंग्वेज सीखना पड़ेगा।
R लैंग्वेज static से related calculation करने के लिए लैंग्वेज है।
Python कोर से शुरुवात करे , SQL भी सीखना पड़ेगा तब ही आगे बढ़ेंगे।
Relational Data base में Oracle ,MySQL ,etc इनको access करने के लिए SQL जरूरी है।
python, C, C + +, etc... किसी भी language से SQL command के इस्तेमाल से database को access कर सकते हैं | Data वो प्लेस है जहा आप data रख रहे है अब जहा आप DATA रख रहे है उसको मैनेज करने के लिए Coding करनी पड़ती है और coding करने के लिए SQL की जरुरत होती है। ताकि आप communicate कर सको DATA server से ताकि वहाँ से DATA retrieve कर सको उसके बाद ही DATA science का काम शुरू होता है।
2 ) Static पढ़ना पड़ेगा Static DATA analytic करने के लिए ही बना हुआ है।
Eg :-Mean ,median ,mode ,linear algebra आना चाहिए।
आप ये मत सोचिये की मैथ में weak है अब क्या करे? या ये सुब चीजे पढ़ेंगे तब ही आगे बढ़ पाएंगे बल्कि actual में आपको सिर्फ Concept पता होना चाहिए। आपको भरी भरकम calculation करने की जरुरत नहीं है। आपको बस पता होना चाहिए की mean निकलते है तो mean होता क्या है आपको बस purpose पता होना चाहिए।
:- जब आप actual में project में काम करेंगे न तो सब predefined function है , predefined classes है ,library बने हुए है सारे कैलक्यूलेशन कर देते है लेकिन जो हो रहा है behind the screen कैसे हो रही है ,यहाँ पर यही वाला formulla क्यों लगा ,यही सब समझ के लिए Static पढ़ना जरूरी है और इसके बिना आप अच्छा DATA scientist बन नहीं पाएंगे।
Static पढ़ने के लिए one week sufficient है,आप कोई बुक लेकर के 10 -20 प्रॉब्लम मत बनाने लग जाइएगा आप हरेक topic से 1 -1 प्रॉब्लम बना कर concept समझ जाइये बस।
:- आपका Math weak है इससे कोई फर्क नहीं पड़ेगा आपको कांसेप्ट समझ में आ गया बस,आपके पास library है आप इम्प्लीमेंट कर सकते है।
* Level 2
* version control system -Git
जैसे आप किसी प्रोजेक्ट पे काम कर रहे है तो कुछ न कुछ चेंज तो करते रहेंगे तो उस case में version control system -Git जरुरी होता है।
* Machine learning
इसमें हम एक ऐसी एप्लीकेशन बनाते है जो हमारे पास डाटा है इसको use कर के फ्यूचर में प्रिडिक्ट कर सके ,इसमें 2-4 अल्गोरिथम पढ़ ले ताकि आपलो आईडिया हो जाये की मशीन अल्गोरिथम होता क्या है।
:-Django भी सिख लीजिये एडवांस के लिए
:-बिग डाटा - unstructured form of DATA
जैसे :-कोई कस्टमर है वो एक वेबसाइट पे कितना देर टाइम spend कर रहा है ,क्या देख रहा है ,कहा click कर रहा है ये सब unstructured information है इसी unstructured information को बिग डाटा कहते है।
visual intelligence ये भी सीखना है।
Comments
Post a Comment