Skip to main content

डाटा साइंटिस्ट बनने के लिए क्या करे ?

 डाटा साइंटिस्ट बनने के लिए क्या करे ?

* level 1 
1 ) Python एंड R लैंग्वेज सीखना पड़ेगा। 
R लैंग्वेज static से related calculation करने के लिए लैंग्वेज है। 
Python कोर से शुरुवात करे , SQL भी सीखना पड़ेगा तब ही आगे बढ़ेंगे। 
Relational Data base में Oracle ,MySQL ,etc इनको access करने के लिए SQL जरूरी है।
 python, C, C + +, etc...  किसी भी language से SQL  command के इस्तेमाल से database को  access कर सकते हैं | Data वो प्लेस है जहा आप data रख रहे है अब जहा आप DATA रख रहे है उसको मैनेज करने के लिए Coding करनी पड़ती है और coding करने के लिए SQL की जरुरत होती है। ताकि आप communicate कर सको DATA server से ताकि वहाँ से DATA retrieve कर सको उसके बाद ही DATA science का काम शुरू होता है।
2 ) Static पढ़ना पड़ेगा Static DATA analytic करने के लिए ही बना हुआ है। 
Eg :-Mean ,median ,mode ,linear algebra आना चाहिए। 
आप ये मत सोचिये की मैथ में weak है अब क्या करे? या ये सुब चीजे पढ़ेंगे तब ही आगे बढ़ पाएंगे बल्कि actual में आपको सिर्फ Concept पता होना चाहिए। आपको भरी भरकम calculation करने की जरुरत नहीं है। आपको बस पता होना चाहिए की mean निकलते है तो mean होता क्या है आपको बस purpose पता होना चाहिए।
:- जब आप actual में project में काम करेंगे न तो सब predefined function है , predefined classes है ,library बने हुए है सारे कैलक्यूलेशन कर देते है लेकिन जो हो रहा है behind the screen कैसे हो रही है ,यहाँ पर यही वाला formulla क्यों लगा ,यही सब समझ के लिए Static पढ़ना जरूरी है और इसके बिना आप अच्छा DATA scientist बन नहीं पाएंगे। 
Static पढ़ने के लिए one week sufficient है,आप कोई बुक लेकर के 10 -20 प्रॉब्लम मत बनाने लग जाइएगा आप हरेक topic से 1 -1 प्रॉब्लम बना कर concept समझ जाइये बस। 
:- आपका Math weak है इससे कोई फर्क नहीं पड़ेगा आपको कांसेप्ट समझ में आ गया बस,आपके पास library है आप इम्प्लीमेंट कर सकते है। 
* Level 2
* version control system -Git 
जैसे आप किसी प्रोजेक्ट पे काम कर रहे है तो कुछ न कुछ चेंज तो करते रहेंगे तो उस case में version control system -Git जरुरी होता है। 
* Machine learning 
इसमें हम एक ऐसी एप्लीकेशन बनाते है जो हमारे पास डाटा है इसको use कर के फ्यूचर में प्रिडिक्ट कर सके ,इसमें 2-4 अल्गोरिथम पढ़ ले ताकि आपलो आईडिया हो जाये की मशीन अल्गोरिथम होता क्या है। 
:-Django भी सिख लीजिये एडवांस के लिए
:-बिग डाटा - unstructured form of DATA 
जैसे :-कोई कस्टमर है वो एक वेबसाइट पे कितना देर टाइम spend कर रहा है ,क्या देख रहा है ,कहा click कर रहा है ये सब unstructured information है इसी unstructured information को बिग डाटा कहते है। 
visual intelligence ये भी सीखना है। 

Comments

Popular posts from this blog

Important links

  Software Drive https://drive.google.com/drive/folders/1siws7oga-10wdlPhOdcjamlDH6wm0iE_?usp=sharing PPT Drive https://drive.google.com/drive/folders/1lNHhZ4_qlsyHrWA862DyBSvkF_J4YVp8 https://docs.google.com/document/d/1fo_4gFB4sgWfTBfZvK7qf0LP0y9ge1dH/edit

Python Practice questions

Reverse  Check substring in string  Armstrong no or not Palindrome  Table print  Power of the no Factorial