Beyond Technology: Kagal CEO on Key Elements of Data Scientist Skill Set

मजबूत डेटा वैज्ञानिक कौशल्य संचाचे मुख्य घटक काय आहेत? आणि जेव्हा आपण त्यांना शोधता तेव्हा आपण डेटा वैज्ञानिक उमेदवाराचे मूल्यांकन कसे करावे? या वाढत्या भूमिकेचे मूळ आणि अपवर्जन जाणून घेण्यासाठी हॅकरॅरँकचे मुख्य कार्यकारी अधिकारी आणि सह-संस्थापक, विवेक रविशंकर, केगलचे मुख्य कार्यकारी अधिकारी आणि सह-संस्थापक, अ‍ॅगोनी गोल्डब्लूमसमवेत बसले. उत्तर अमेरिकेच्या रेडिओलॉजिकल सोसायटी आणि बूज lenलन हॅमिल्टनचे काय आहे? तिघेही त्यांच्या काही सर्वात मोठ्या डेटा विज्ञान आणि मशीन प्रश्नांची उत्तरे देण्यासाठी कागदावर अवलंबून असतात.

3.8 मिमी पेक्षा जास्त वापरकर्त्यांसह, कागल हा जगातील सर्वात मोठा डेटा विज्ञान आणि मशीन लर्निंग समुदाय आहे. येथे 25,000+ सार्वजनिक डेटासेट, अंदाजे 300,000 सार्वजनिक नोटबुक आणि डेटा विज्ञान मायक्रोकॉसम अभ्यासक्रमांची एक लायब्ररी आहे.

Beyond Technology: Kagal CEO on Key Elements of Data Scientist Skill Set



2012 आणि 2018 हे या क्षेत्रासाठी निश्चित वर्ष होते

अँथनीच्या मते, गहन शिक्षणासाठी २०१२ हे वार्षिक मीराबिलिस (किंवा, "चमत्कार वर्ष") होते. न्यूरल नेटवर्कच्या स्थापनेनंतर मशीन लर्निंग आणि आर्टिफिशियल इंटेलिजेंस (एआय) ने उड्डाण घेतले. हे नैसर्गिक भाषा प्रक्रिया, भाषण आणि संगणक दृष्टीक्षेपातील प्रगतीची भूखंडी आहे. म्हणून आम्ही स्वत: ची वाहन चालविणारी वाहने, रेडिओलॉजी आणि सुरक्षा कॅमेरे यासारख्या संगणकाच्या दृष्टीकोनातून पाहिले आहे.

त्या प्रगतीबद्दल धन्यवाद, न्यूरो नेटवर्क आणि ग्रेडियंट-बूस्टिंग आता डेटा सायंटिस्टचे दैनंदिन जीवन परिभाषित करण्यात मोठी भूमिका बजावते.
परंतु २०१ in मध्ये अ‍ॅडव्हान्समध्ये बदल होऊ शकतात जे अँथनीच्या मते पुढे जाण्यावर लक्ष केंद्रित करतात. "आपण असा युक्तिवाद करू शकता की नैसर्गिक भाषा प्रक्रियेसाठी 2018 एनरस मीराबिलिस होता." नैसर्गिक भाषा प्रक्रियेच्या नवीन प्रगतीमुळे, आम्ही वापर प्रकरणांमध्ये वाढ पाहण्यास बांधील आहोत.

डेटा विज्ञानामध्ये डेटा विश्लेषकांपासून डेटा अभियंता, डेटा शास्त्रज्ञ आणि बरेच काही भिन्न भिन्न भूमिका आहेत. परंतु त्यांच्यामधील नियोक्तेमधील फरक नेहमीच स्पष्ट नसतो.

मुलाखती दरम्यान अँथनी गोल्डब्लूम आणि विवेक रविशंकर

जेव्हा डेटा विश्लेषकांकडून डेटा वैज्ञानिकांना वेगळे करण्याचा विचार केला जातो तेव्हा hंथोनीचे निकष सोपे आहेत. "मी कोणताही डेटा वैज्ञानिक लेखन कोड इनपुट म्हणून वर्गीकृत करतो." दुसरीकडे डेटा विश्लेषक किंवा व्यवसाय विश्लेषक मुख्यत: झांज किंवा एक्सेल सारख्या साधनांवर झुकत असतात. डेटा सायंटिस्टची भूमिकादेखील विस्तृत जबाबदा .्या पूर्ण करू शकते.

टाइप करा डेटा वैज्ञानिक

टाइप प्रथम डेटा शास्त्रज्ञ उत्पादनात येणार्‍या अल्गोरिदम तयार करण्यावर लक्ष केंद्रित करतात. फेसबुकची न्यूजफीड आणि नेटफ्लिक्स सामग्रीच्या शिफारसींना सामर्थ्य देणारी अल्गोरिदम चांगली उदाहरणे आहेत.

त्यांच्या कार्याचा एक भाग म्हणून, बहुतेक प्रकार I डेटा शास्त्रज्ञ त्यांचे दिवस मशीन लर्निंग अल्गोरिदम (अनेकदा, न्यूरोल नेटवर्क किंवा ग्रेडियंट-बूस्टिंग मशीन) प्रशिक्षण देतात.

प्रकार II डेटा वैज्ञानिक

दुसरीकडे, टाइप II डेटा वैज्ञानिकांचे काम सामान्यत: उत्पादनासाठी नसते. त्याऐवजी, या प्रकारचा डेटा विज्ञान व्यवसाय अखेरीस तयार करू शकणार्‍या माहितीचे अधिग्रहण आणि विश्लेषण करण्यावर लक्ष केंद्रित करतो.

एक प्रकार II डेटा सायन्स मशीन लर्निंग अल्गोरिदम सारख्या डेटा सायंटिस्टच्या प्रकारासारखीच साधने वापरू शकतो. परंतु ते एका अक्ष टेबल सारख्या सोप्या गोष्टीवर देखील कार्य करू शकतात.

एक मजबूत डेटा वैज्ञानिक कौशल्य सेट तांत्रिक ज्ञानाबद्दल नाही

डेटा सायंटिस्टचा उपप्रकार असला तरी एक गोष्ट स्पष्ट आहे: केवळ तांत्रिक कौशल्ये प्रभावी डेटा वैज्ञानिक नाहीत. त्याऐवजी, एक गोल गोल डेटा वैज्ञानिक तांत्रिक कौशल्य, व्यवसाय कौशल्य, सर्जनशीलता आणि संप्रेषण (परंतु मर्यादित नाही) यासह कठोर आणि मऊ दोन्ही कौशल्यांचे संयोजन आहे. म्हणून, भाड्याने देणा teams्या संघांना तांत्रिक कौशल्यापेक्षा बरेच काही पाहण्याची गरज आहे.

व्यवसाय जाणकाराचे महत्त्व अधोरेखित करणे

कागलवरील स्पर्धांमधून अँथनीने हे प्रथमच पाहिले आहे. "लोक [समस्येवर] आश्चर्यकारक अल्गोरिदम तयार करतात," अँथनीने स्पष्ट केले. "परंतु जर मूल्यमापन मेट्रिक चुकीचे असेल किंवा लक्ष्य व्हेरिएबल हे बदल करण्यास योग्य नसतील तर भविष्यवाणी करण्यासाठी उपयुक्त ठरेल तर अल्गोरिदम पूर्णपणे निरुपयोगी आहे." अल्गोरिदमचा शेवटचा अनुप्रयोग समजून घेणे म्हणजे कार्यशील, परंतु अकार्यक्षम अल्गोरिदम आणि एक वास्तविक समस्या सोडवित आहे.

Post a Comment

Previous Post Next Post

Reviews