Rumah It-Business Bagaimana untuk memupuk seorang saintis data

Bagaimana untuk memupuk seorang saintis data

Anonim

Di antara startup teknologi, saintis data adalah istilah yang semakin umum digunakan untuk merujuk kepada geeks data yang mampu menjembatani secara fizikal bidang fungsional kecerdasan data secara tradisional. Seorang saintis data adalah seseorang yang selesa melakukan beberapa aspek (jika tidak semua) aspek projek risikan data:

  1. Pengambilalihan Data: Ini mungkin melibatkan penulisan adat dan crawler web atau skrip yang menyasarkan perkhidmatan web tertentu atau API untuk sumber data bukan tradisional.
  2. Pengurusan Data: ETL, memanipulasi, menanyakan dan mengekalkan data dalam pangkalan data, kedai nilai utama, atau Hadoop.
  3. Visualisasi Maklumat: Meninjau corak melalui penggunaan alat visualisasi statik dan / atau platform interaktif berdasarkan Flash, JavaScript atau Pemprosesan.
  4. Analitis: Ini boleh terdiri daripada teknik mudah ke kompleks dalam statistik multivarian, pembelajaran mesin dan NLP.
  5. Insight: Ekstrak, diringkaskan dan tunjukkan penemuan utama kepada khalayak luas.

Terdapat banyak alat, kemahiran dan butiran teknikal, dan seseorang boleh membelanjakan masa untuk menguasai setiap item yang disenaraikan di atas. Walaupun seorang saintis data mungkin tidak mempunyai pengetahuan pakar yang benar di mana-mana kawasan, dia selesa melompat-lompat ke belakang dan melaksanakan tugas-tugas asas dalam kesemuanya. Hasilnya adalah data geek lincah yang cukup untuk menyiasat dengan cepat projek data dan menghasilkan jawapan kepada (peringkat tinggi) soalan dari pengurusan. (kira-kira ahli sains data dalam Data Saintis: Bintang-bintang New Rock dari Tech World.)

Untuk memupuk saintis data, syarikat perlu memberi tumpuan lebih kepada struktur budaya dan organisasi. Banyak pekerja data mempunyai kemahiran dan latihan yang mencukupi untuk menjadi cepat produktif dalam pelbagai bidang kecerdasan data. Masalahnya ialah kebanyakannya tidak berfungsi dalam persekitaran yang mendorong mereka untuk menjadi saintis data. Mereka terjebak dalam silo dan terhad kepada satu atau dua bidang kecerdasan data. Selalunya, mereka terhad untuk menggunakan alat "diluluskan" oleh pengurus mereka.

Bagaimana untuk memupuk seorang saintis data