मजबूत डेटा वैज्ञानिक कौशल्य संचाचे मुख्य घटक काय आहेत? आणि जेव्हा आपण त्यांना शोधता तेव्हा आपण डेटा वैज्ञानिक उमेदवाराचे मूल्यांकन कसे करावे? या वाढत्या भूमिकेचे मूळ आणि अपवर्जन जाणून घेण्यासाठी हॅकरॅरँकचे मुख्य कार्यकारी अधिकारी आणि सह-संस्थापक, विवेक रविशंकर, केगलचे मुख्य कार्यकारी अधिकारी आणि सह-संस्थापक, अॅगोनी गोल्डब्लूमसमवेत बसले. उत्तर अमेरिकेच्या रेडिओलॉजिकल सोसायटी आणि बूज lenलन हॅमिल्टनचे काय आहे? तिघेही त्यांच्या काही सर्वात मोठ्या डेटा विज्ञान आणि मशीन प्रश्नांची उत्तरे देण्यासाठी कागदावर अवलंबून असतात.
3.8 मिमी पेक्षा जास्त वापरकर्त्यांसह, कागल हा जगातील सर्वात मोठा डेटा विज्ञान आणि मशीन लर्निंग समुदाय आहे. येथे 25,000+ सार्वजनिक डेटासेट, अंदाजे 300,000 सार्वजनिक नोटबुक आणि डेटा विज्ञान मायक्रोकॉसम अभ्यासक्रमांची एक लायब्ररी आहे.
2012 आणि 2018 हे या क्षेत्रासाठी निश्चित वर्ष होते
अँथनीच्या मते, गहन शिक्षणासाठी २०१२ हे वार्षिक मीराबिलिस (किंवा, "चमत्कार वर्ष") होते. न्यूरल नेटवर्कच्या स्थापनेनंतर मशीन लर्निंग आणि आर्टिफिशियल इंटेलिजेंस (एआय) ने उड्डाण घेतले. हे नैसर्गिक भाषा प्रक्रिया, भाषण आणि संगणक दृष्टीक्षेपातील प्रगतीची भूखंडी आहे. म्हणून आम्ही स्वत: ची वाहन चालविणारी वाहने, रेडिओलॉजी आणि सुरक्षा कॅमेरे यासारख्या संगणकाच्या दृष्टीकोनातून पाहिले आहे.
त्या प्रगतीबद्दल धन्यवाद, न्यूरो नेटवर्क आणि ग्रेडियंट-बूस्टिंग आता डेटा सायंटिस्टचे दैनंदिन जीवन परिभाषित करण्यात मोठी भूमिका बजावते.
परंतु २०१ in मध्ये अॅडव्हान्समध्ये बदल होऊ शकतात जे अँथनीच्या मते पुढे जाण्यावर लक्ष केंद्रित करतात. "आपण असा युक्तिवाद करू शकता की नैसर्गिक भाषा प्रक्रियेसाठी 2018 एनरस मीराबिलिस होता." नैसर्गिक भाषा प्रक्रियेच्या नवीन प्रगतीमुळे, आम्ही वापर प्रकरणांमध्ये वाढ पाहण्यास बांधील आहोत.
डेटा विज्ञानामध्ये डेटा विश्लेषकांपासून डेटा अभियंता, डेटा शास्त्रज्ञ आणि बरेच काही भिन्न भिन्न भूमिका आहेत. परंतु त्यांच्यामधील नियोक्तेमधील फरक नेहमीच स्पष्ट नसतो.
मुलाखती दरम्यान अँथनी गोल्डब्लूम आणि विवेक रविशंकर
जेव्हा डेटा विश्लेषकांकडून डेटा वैज्ञानिकांना वेगळे करण्याचा विचार केला जातो तेव्हा hंथोनीचे निकष सोपे आहेत. "मी कोणताही डेटा वैज्ञानिक लेखन कोड इनपुट म्हणून वर्गीकृत करतो." दुसरीकडे डेटा विश्लेषक किंवा व्यवसाय विश्लेषक मुख्यत: झांज किंवा एक्सेल सारख्या साधनांवर झुकत असतात. डेटा सायंटिस्टची भूमिकादेखील विस्तृत जबाबदा .्या पूर्ण करू शकते.
टाइप करा डेटा वैज्ञानिक
टाइप प्रथम डेटा शास्त्रज्ञ उत्पादनात येणार्या अल्गोरिदम तयार करण्यावर लक्ष केंद्रित करतात. फेसबुकची न्यूजफीड आणि नेटफ्लिक्स सामग्रीच्या शिफारसींना सामर्थ्य देणारी अल्गोरिदम चांगली उदाहरणे आहेत.
त्यांच्या कार्याचा एक भाग म्हणून, बहुतेक प्रकार I डेटा शास्त्रज्ञ त्यांचे दिवस मशीन लर्निंग अल्गोरिदम (अनेकदा, न्यूरोल नेटवर्क किंवा ग्रेडियंट-बूस्टिंग मशीन) प्रशिक्षण देतात.
प्रकार II डेटा वैज्ञानिक
दुसरीकडे, टाइप II डेटा वैज्ञानिकांचे काम सामान्यत: उत्पादनासाठी नसते. त्याऐवजी, या प्रकारचा डेटा विज्ञान व्यवसाय अखेरीस तयार करू शकणार्या माहितीचे अधिग्रहण आणि विश्लेषण करण्यावर लक्ष केंद्रित करतो.
एक प्रकार II डेटा सायन्स मशीन लर्निंग अल्गोरिदम सारख्या डेटा सायंटिस्टच्या प्रकारासारखीच साधने वापरू शकतो. परंतु ते एका अक्ष टेबल सारख्या सोप्या गोष्टीवर देखील कार्य करू शकतात.
एक मजबूत डेटा वैज्ञानिक कौशल्य सेट तांत्रिक ज्ञानाबद्दल नाही
डेटा सायंटिस्टचा उपप्रकार असला तरी एक गोष्ट स्पष्ट आहे: केवळ तांत्रिक कौशल्ये प्रभावी डेटा वैज्ञानिक नाहीत. त्याऐवजी, एक गोल गोल डेटा वैज्ञानिक तांत्रिक कौशल्य, व्यवसाय कौशल्य, सर्जनशीलता आणि संप्रेषण (परंतु मर्यादित नाही) यासह कठोर आणि मऊ दोन्ही कौशल्यांचे संयोजन आहे. म्हणून, भाड्याने देणा teams्या संघांना तांत्रिक कौशल्यापेक्षा बरेच काही पाहण्याची गरज आहे.
व्यवसाय जाणकाराचे महत्त्व अधोरेखित करणे
कागलवरील स्पर्धांमधून अँथनीने हे प्रथमच पाहिले आहे. "लोक [समस्येवर] आश्चर्यकारक अल्गोरिदम तयार करतात," अँथनीने स्पष्ट केले. "परंतु जर मूल्यमापन मेट्रिक चुकीचे असेल किंवा लक्ष्य व्हेरिएबल हे बदल करण्यास योग्य नसतील तर भविष्यवाणी करण्यासाठी उपयुक्त ठरेल तर अल्गोरिदम पूर्णपणे निरुपयोगी आहे." अल्गोरिदमचा शेवटचा अनुप्रयोग समजून घेणे म्हणजे कार्यशील, परंतु अकार्यक्षम अल्गोरिदम आणि एक वास्तविक समस्या सोडवित आहे.
3.8 मिमी पेक्षा जास्त वापरकर्त्यांसह, कागल हा जगातील सर्वात मोठा डेटा विज्ञान आणि मशीन लर्निंग समुदाय आहे. येथे 25,000+ सार्वजनिक डेटासेट, अंदाजे 300,000 सार्वजनिक नोटबुक आणि डेटा विज्ञान मायक्रोकॉसम अभ्यासक्रमांची एक लायब्ररी आहे.
2012 आणि 2018 हे या क्षेत्रासाठी निश्चित वर्ष होते
अँथनीच्या मते, गहन शिक्षणासाठी २०१२ हे वार्षिक मीराबिलिस (किंवा, "चमत्कार वर्ष") होते. न्यूरल नेटवर्कच्या स्थापनेनंतर मशीन लर्निंग आणि आर्टिफिशियल इंटेलिजेंस (एआय) ने उड्डाण घेतले. हे नैसर्गिक भाषा प्रक्रिया, भाषण आणि संगणक दृष्टीक्षेपातील प्रगतीची भूखंडी आहे. म्हणून आम्ही स्वत: ची वाहन चालविणारी वाहने, रेडिओलॉजी आणि सुरक्षा कॅमेरे यासारख्या संगणकाच्या दृष्टीकोनातून पाहिले आहे.
त्या प्रगतीबद्दल धन्यवाद, न्यूरो नेटवर्क आणि ग्रेडियंट-बूस्टिंग आता डेटा सायंटिस्टचे दैनंदिन जीवन परिभाषित करण्यात मोठी भूमिका बजावते.
परंतु २०१ in मध्ये अॅडव्हान्समध्ये बदल होऊ शकतात जे अँथनीच्या मते पुढे जाण्यावर लक्ष केंद्रित करतात. "आपण असा युक्तिवाद करू शकता की नैसर्गिक भाषा प्रक्रियेसाठी 2018 एनरस मीराबिलिस होता." नैसर्गिक भाषा प्रक्रियेच्या नवीन प्रगतीमुळे, आम्ही वापर प्रकरणांमध्ये वाढ पाहण्यास बांधील आहोत.
डेटा विज्ञानामध्ये डेटा विश्लेषकांपासून डेटा अभियंता, डेटा शास्त्रज्ञ आणि बरेच काही भिन्न भिन्न भूमिका आहेत. परंतु त्यांच्यामधील नियोक्तेमधील फरक नेहमीच स्पष्ट नसतो.
मुलाखती दरम्यान अँथनी गोल्डब्लूम आणि विवेक रविशंकर
जेव्हा डेटा विश्लेषकांकडून डेटा वैज्ञानिकांना वेगळे करण्याचा विचार केला जातो तेव्हा hंथोनीचे निकष सोपे आहेत. "मी कोणताही डेटा वैज्ञानिक लेखन कोड इनपुट म्हणून वर्गीकृत करतो." दुसरीकडे डेटा विश्लेषक किंवा व्यवसाय विश्लेषक मुख्यत: झांज किंवा एक्सेल सारख्या साधनांवर झुकत असतात. डेटा सायंटिस्टची भूमिकादेखील विस्तृत जबाबदा .्या पूर्ण करू शकते.
टाइप करा डेटा वैज्ञानिक
टाइप प्रथम डेटा शास्त्रज्ञ उत्पादनात येणार्या अल्गोरिदम तयार करण्यावर लक्ष केंद्रित करतात. फेसबुकची न्यूजफीड आणि नेटफ्लिक्स सामग्रीच्या शिफारसींना सामर्थ्य देणारी अल्गोरिदम चांगली उदाहरणे आहेत.
त्यांच्या कार्याचा एक भाग म्हणून, बहुतेक प्रकार I डेटा शास्त्रज्ञ त्यांचे दिवस मशीन लर्निंग अल्गोरिदम (अनेकदा, न्यूरोल नेटवर्क किंवा ग्रेडियंट-बूस्टिंग मशीन) प्रशिक्षण देतात.
प्रकार II डेटा वैज्ञानिक
दुसरीकडे, टाइप II डेटा वैज्ञानिकांचे काम सामान्यत: उत्पादनासाठी नसते. त्याऐवजी, या प्रकारचा डेटा विज्ञान व्यवसाय अखेरीस तयार करू शकणार्या माहितीचे अधिग्रहण आणि विश्लेषण करण्यावर लक्ष केंद्रित करतो.
एक प्रकार II डेटा सायन्स मशीन लर्निंग अल्गोरिदम सारख्या डेटा सायंटिस्टच्या प्रकारासारखीच साधने वापरू शकतो. परंतु ते एका अक्ष टेबल सारख्या सोप्या गोष्टीवर देखील कार्य करू शकतात.
एक मजबूत डेटा वैज्ञानिक कौशल्य सेट तांत्रिक ज्ञानाबद्दल नाही
डेटा सायंटिस्टचा उपप्रकार असला तरी एक गोष्ट स्पष्ट आहे: केवळ तांत्रिक कौशल्ये प्रभावी डेटा वैज्ञानिक नाहीत. त्याऐवजी, एक गोल गोल डेटा वैज्ञानिक तांत्रिक कौशल्य, व्यवसाय कौशल्य, सर्जनशीलता आणि संप्रेषण (परंतु मर्यादित नाही) यासह कठोर आणि मऊ दोन्ही कौशल्यांचे संयोजन आहे. म्हणून, भाड्याने देणा teams्या संघांना तांत्रिक कौशल्यापेक्षा बरेच काही पाहण्याची गरज आहे.
व्यवसाय जाणकाराचे महत्त्व अधोरेखित करणे
कागलवरील स्पर्धांमधून अँथनीने हे प्रथमच पाहिले आहे. "लोक [समस्येवर] आश्चर्यकारक अल्गोरिदम तयार करतात," अँथनीने स्पष्ट केले. "परंतु जर मूल्यमापन मेट्रिक चुकीचे असेल किंवा लक्ष्य व्हेरिएबल हे बदल करण्यास योग्य नसतील तर भविष्यवाणी करण्यासाठी उपयुक्त ठरेल तर अल्गोरिदम पूर्णपणे निरुपयोगी आहे." अल्गोरिदमचा शेवटचा अनुप्रयोग समजून घेणे म्हणजे कार्यशील, परंतु अकार्यक्षम अल्गोरिदम आणि एक वास्तविक समस्या सोडवित आहे.
Tags:
tricks