Rumah Audio Menyematkan analisis di mana-mana: membolehkan saintis data warganegara

Menyematkan analisis di mana-mana: membolehkan saintis data warganegara

Anonim

Dengan Staff Techopedia, 25 Ogos 2016

Takeaway: Tuan Rumah Rebecca Jozwiak membincangkan fenomena analisis tertanam dan saintis data warga negara dengan Dr Robin Bloor, Dez Blanchfield dan David Sweenor.

Anda mesti mendaftar untuk acara ini untuk melihat video. Daftar untuk melihat video.

Rebecca Jozwiak: Tuan-tuan dan puan-puan, hello dan selamat datang ke Hot Technologies. "Benarkan Mana-mana: Mengaktifkan Saintis Data Citizen" adalah topik kami hari ini. Saya mengisi untuk tuan rumah biasa anda, ini adalah pengisian Rebecca Jozwiak untuk Eric Kavanagh. Ya, tahun ini panas. Terutamanya istilah "saintis data" telah mendapat banyak perhatian walaupun kami biasa menyebutnya nama-nama yang membosankan seperti "ahli statistik" atau "ahli analitik, " cukup banyak menangani jenis aktiviti yang sama tetapi ia mendapat nama baru yang seksi dan ia mendapat banyak perhatian. Mereka sangat diingini untuk berada di tempat kerja, memberi manfaat kepada organisasi, dan semua orang mahu satu. Tetapi mereka adalah: 1) mahal, 2) sukar dicari. Anda tahu, berita mengenai kemahiran keterampilan saintis data, ya, tetapi masih mereka menawarkan nilai yang luar biasa kepada organisasi dan orang-orang semacam berani untuk memikirkan bagaimana untuk mendapatkan nilai itu tanpa perlu menurunkan harga, jadi bercakap.

Tetapi berita baiknya ialah kita melihat alat dan perisian yang keluar yang mengimbangi kekurangan itu. Kami mempunyai automasi, pembelajaran mesin, analitik tertanam, yang mana yang akan kita pelajari hari ini, dan ia sememangnya diberikan kepada istilah baru ini, "saintis data warganegara", dan apakah maksudnya? Tidak, itu bukan saintis data terlatih, ia boleh menjadi pengguna perniagaan anda, ahli BI anda, seseorang dari IT, seseorang yang mempunyai latar belakang tetapi mungkin tidak semestinya kepakaran. Tetapi apa yang dilakukannya, alat dan perisian ini, ia memberi lebih ramai orang akses kepada penyelesaian pintar ini walaupun mereka mungkin tidak mengetahui pengekodan yang mendalam. Tetapi ia hanya membantu meningkatkan prestasi keseluruhan apabila anda memberikan semua orang akses yang lebih sedikit kepada pemikiran analitik itu. Anda tidak perlu menjalani latihan semestinya untuk mempunyai jenis rasa ingin tahu yang boleh membawa kepada wawasan yang baik untuk syarikat anda.

Membincangkan bahawa dengan kami hari ini adalah Robin Bloor, ketua penganalisis di Bloor Group, salah seorang saintis data sukar difahami sendiri, Dez Blanchfield menelefon, dan kemudian kami mempunyai David Sweenor dari Dell Statistica akan memberikan presentasi kepada kami hari ini. Dan dengan itu saya akan menyerahkannya kepada Robin Bloor.

Robin Boor: Baiklah, terima kasih atas pengenalan itu. Saya berfikir tentang perkara ini dalam konteks sejarah. Apa yang sebenarnya kita lihat di sini adalah salah satu reka bentuk Leonardo da Vinci untuk jenis glider yang seorang lelaki boleh meletakkan di belakangnya. Saya tidak tahu sama ada ia berfungsi. Saya tidak akan masuk ke dalamnya, saya katakan. Walau bagaimanapun, da Vinci, apabila saya berfikir tentang da Vinci, saya fikir dia sebagai salah satu daripada orang yang paling ingin tahu dan analitikal yang pernah wujud. Dan ia agak jelas jika anda melihat glider itu bahawa ia direka berdasarkan sayap burung dan dia dalam satu cara atau yang lain mengkaji penerbangan burung untuk membinanya.

Jika kita mengambil perspektif sejarah - saya benar-benar melihat ini - analitik mungkin aplikasi tertua matematik. Terdapat banci yang berlaku sekurang-kurangnya pada zaman Babilon. Kami tahu tentang ini kerana pada dasarnya terdapat beberapa tablet cuneiform yang mempunyai data seperti itu pada mereka. Ia tidak diketahui sama ada terdapat apa-apa yang kembali semula sebelum ini. Tetapi perkara yang jelas adalah anda mempunyai tamadun sendiri dengan penduduk yang besar, ia sebenarnya memerlukan perancangan dan ia bernilai mengetahui apa yang anda sedang merancang dan apa keperluan orang-orang sebenarnya.

Dan semacam itu bermula dan ia juga di mana pengkomputeran bermula kerana komputer awal, komputer mekanikal awal, sebenarnya, saya fikir yang pertama adalah banci yang dibuat oleh Hollerith, yang menjadi IBM, saya percaya. Semua ini telah bergerak ke hadapan. Terdapat beberapa jenis interval antara mungkin tahun 1970-an dan hari ini, di mana terdapat sejumlah besar aplikasi dan analisis lain, anda boleh mengatakan, mengambil tempat duduk belakang. Ya, ada analitik yang terjadi - ia berlaku dalam organisasi besar, khususnya bank dan syarikat insurans, dan sebenarnya General Electric dan telco dan perkara-perkara seperti itu - tetapi ia tidak digunakan secara umum di seluruh perniagaan dan sekarang ia mula digunakan secara umum sepanjang perniagaan. Dan ia berubah permainan, betul-betul. Perkara pertama yang saya fikir saya menarik perhatian ialah piramid data, yang saya sukai. Inilah, saya maksudkan, saya menarik satu daripada 20 tahun yang lalu - sekurang-kurangnya 20 tahun yang lalu - untuk cuba dan memahami, pada masa itu, saya cuba memahami BI dan beberapa perlombongan data awal yang sedang dilakukan. Apa yang saya didefinisikan di sini adalah idea data dan contohnya adalah isyarat, pengukuran, rakaman, peristiwa, transaksi, pengiraan, pengagregatan, maklumat maklumat individu. Anda mungkin memikirkannya sebagai molekul maklumat, tetapi ia adalah titik individu. Ia menjadi maklumat sebaik sahaja ia mendapat konteks. Data yang berkaitan, data berstruktur, pangkalan data, visualisasi data, plotters, schemers, dan ontologies - mereka semua memenuhi syarat dalam fikiran saya sebagai maklumat kerana apa yang anda lakukan adalah mengagregat banyak variasi bersama dan mencipta sesuatu yang lebih daripada titik data, sesuatu yang sebenarnya mempunyai bentuk, bentuk matematik.

Di atas itu kita mempunyai pengetahuan. Kita boleh, dengan memeriksa maklumat, kita dapat mengetahui bahawa terdapat pelbagai corak dan kita boleh memanfaatkan corak-corak tersebut dengan merumuskan peraturan, dasar, garis panduan, prosedur, dan kemudian ia mengambil bentuk pengetahuan. Dan hampir semua program komputer, apa sahaja yang mereka lakukan, adalah pengetahuan sejenis, kerana mereka bekerja melawan data dan menerapkan peraturan kepada mereka. Kami mempunyai tiga lapisan ini dan terdapat perbaikan yang semakin meningkat antara lapisan. Dan di sebelah kiri gambarajah ini, anda menunjukkan data baru masuk, jadi banyak perkara ini statik. Data itu terkumpul, maklumat terkumpul dan pengetahuan berpotensi berkembang. Di bahagian atas, kita mempunyai "Memahami" dan saya akan mengekalkan, walaupun itu adalah argumen falsafah, bahawa pemahaman hanya tinggal di manusia. Sekiranya saya salah mengenainya, maka kita semua akan diganti oleh komputer pada satu ketika. Tetapi daripada mempunyai perdebatan, saya akan pergi ke slaid seterusnya.

Apabila saya melihat ini, perkara yang menarik, ini adalah sesuatu yang baru-baru ini, perkara yang menarik adalah untuk mencuba dan mengetahui apa sebenarnya analitik itu. Dan akhirnya dengan menarik pelbagai gambar rajah dan berakhir dengan satu yang kelihatan seperti ini, saya sampai pada kesimpulannya, sebenarnya, perkembangan analisis adalah benar-benar perkembangan perisian dengan jumlah formula matematik yang amat besar. Penjelajahan analitik sedikit berbeza dengan perkembangan perisian dalam arti bahawa anda sebenarnya akan mengambil banyak, banyak model yang berbeza dan menyelidikinya untuk menghasilkan pengetahuan baru tentang data. Tetapi sebaik sahaja anda menghasilkannya, ia akan dilaksanakan sama ada dalam apa yang saya fikirkan sebagai sokongan keputusan pasif, yang mana maklumat hanya diberikan kepada pengguna; sokongan keputusan interaktif, yang merupakan perkara seperti OLAP, di mana pengguna diberikan satu set data berstruktur yang mereka boleh menyiasat dan menyimpulkan perkara untuk diri mereka menggunakan pelbagai alat yang tersedia. Banyak visualisasi seperti itu. Dan kemudian kami mempunyai automasi jika anda hanya boleh mengubah beberapa pandangan analitik bahawa anda telah mengumpulkan satu set peraturan yang dapat dilaksanakan, anda tidak semestinya memerlukan manusia untuk terlibat. Itulah cara saya melihatnya apabila saya melakukan semua itu. Dan pelbagai perkara mula berlaku kepada saya. Sebaik sahaja kawasan aktiviti, kita harus mengatakan, sekali domain data sebenarnya dilombong, ditambang dengan teliti, diterokai dengan teliti melalui setiap arah yang mungkin, akhirnya ia hanya menjadi crystallized BI. Pengetahuan yang dicipta bermula menjadi pengetahuan yang memberitahu pelbagai pengguna dalam pelbagai cara, dan meningkatkan keupayaan mereka, semoga dengan semestinya melakukan kerja yang mereka lakukan.

Salah satu perkara yang saya perhatikan dan saya telah melihat analitik ramalan selama kira-kira lima tahun, tetapi analisis ramalan menjadi BI, dalam erti kata ia hanya bertukar menjadi maklumat yang berguna untuk memberi makan kepada orang ramai dan seperti yang telah saya katakan, ada pelaporan BI automatik, explorative BI, BI, penggredan yang sangat berbeza dan analitik ramalan sebenarnya dalam ketiga-tiga arah. Dan proses analisis seperti yang saya katakan bukanlah berbeza dengan pembangunan perisian, hanya dilakukan oleh orang yang berbeza dengan kemahiran yang sedikit berbeza. Saya rasa saya harus menekankan bahawa kemahiran yang diperlukan untuk membuat saintis data yang benar-benar baik mengambil masa beberapa tahun untuk memperoleh. Mereka tidak mudah diperoleh dan tidak ramai orang boleh melakukannya, tetapi itu kerana ia melibatkan pemahaman matematik di peringkat yang sangat canggih untuk mengetahui apa yang sah dan apa yang tidak sah. Perkembangan analytics, penemuan pengetahuan baru, implan analytics, tentang membuat pengetahuan beroperasi. Itulah latar belakang yang saya lihat kepada keseluruhan analisis. Ia adalah kawasan yang besar dan terdapat banyak dimensi, tetapi saya fikir bahawa generalisasi terpakai kepada segala-galanya.

Kemudian ada gangguan perniagaan, seperti yang saya nyatakan terdapat beberapa organisasi, syarikat farmaseutikal adalah satu lagi, yang ada dalam DNA mereka yang telah mendapat analitik. Tetapi terdapat banyak organisasi yang benar-benar tidak ada dalam DNA mereka, dan sekarang mereka mempunyai keupayaan, sekarang perisian dan perkakasan jauh lebih murah daripada dulu, kini mereka mempunyai keupayaan untuk mengeksploitasi. Saya akan mengatakan beberapa perkara. Perkara pertama ialah analisis adalah, dalam banyak keadaan, ia adalah R & D. Anda hanya boleh menggunakan analitik ke kawasan tertentu organisasi dan mungkin kelihatan biasa bahawa anda berada dalam satu cara atau menganalisis pesanan pelanggan lagi dari berbagai perspektif, bergabung dengan data lain. Tetapi analisis benar-benar mewujudkan kemungkinan untuk melihat organisasi secara keseluruhan dan menganalisis apa-apa aktiviti tertentu yang berlaku dalam organisasi dan rangkaian aktiviti. Tetapi apabila anda benar-benar berpindah ke kawasan itu, saya akan mengekalkan bahawa ia penyelidikan dan pembangunan. Dan ada soalan yang saya telah ditanya beberapa kali, iaitu, "Berapa banyak syarikat perlu menghabiskan analisis?" Dan saya fikir cara terbaik untuk berfikir tentang memberikan jawapan kepada itu ialah memikirkan analitik sebagai R & D, dan hanya bertanya, "Nah berapa banyak yang anda akan habiskan untuk R & D dalam bidang kecekapan perniagaan?"

Dan perniagaan yang tidak dengan analisis, ada banyak perkara yang mereka tidak tahu. Pertama sekali, mereka tidak tahu bagaimana untuk melakukannya. Biasanya jika mereka benar-benar pergi ke satu cara atau menggunakan analisis lain dalam organisasi - mereka benar-benar tidak mempunyai pilihan tetapi pergi ke perundingan yang boleh membantu mereka melakukannya kerana, ia tidak mungkin atau benar-benar sangat sukar untuk kebanyakan perniagaan untuk benar-benar menyewa seorang saintis data, mencari satu, membayar untuk satu, dan benar-benar mempercayai mereka untuk melakukan apa yang anda mahu mereka lakukan. Sangat susah. Kebanyakan perniagaan tidak tahu bagaimana untuk menyewa atau mendidik kakitangan untuk melakukan kerja ini, dan alasannya adalah bahawa ia tidak dalam DNA mereka, jadi itu bukan sebahagian daripada proses perniagaan semula jadi mereka. Ini menyumbang ke titik seterusnya. Mereka tidak tahu bagaimana untuk menjadikannya proses perniagaan. Cara terbaik untuk melakukannya adalah dengan menyalin apa syarikat farmaseutikal dan syarikat insurans, lihat sahaja, dan beberapa syarikat di pusat penjagaan kesihatan, cuma melihat cara mereka menggunakan analisis dan menyalinnya. Kerana ia adalah proses perniagaan. Tidak tahu bagaimana untuk mengawalnya atau mengauditnya. Itu benar-benar, terutama sekarang bahawa banyak syarikat perisian yang hebat telah mencipta produk yang mengautomasikan banyak analitik yang banyak. Titik mengenai pengauditan adalah penting, apabila anda mempunyai perundingan atau orang di tapak yang boleh dipercayai untuk memahami apa hasil pengiraan analitik, itulah sejenis pilihan yang perlu anda buat, tetapi jika anda meletakkan alat analisis yang sangat kuat ke dalam tangan orang yang tidak memahami analisis dengan betul, mereka mungkin akan membuat kesimpulan yang mungkin tidak betul. Dan seperti yang saya katakan, syarikat tidak tahu bagaimana anggaran untuknya.

Ini adalah rasa analytics, saya akan lari melalui mereka. Analisa statistik dan pemodelan statistik sangat berbeza dengan analisis ramalan, yang kebanyakannya dengan cara adalah penguat lengkung. Pembelajaran mesin adalah berbeza dengan perkara-perkara tersebut, analisis laluan dan siri masa, yang pada dasarnya dilakukan pada aliran status adalah berbeza lagi. Analisis grafik berbeza lagi, dan analisis teks dan analisis semantik berbeza sekali lagi. Ini hanya menunjukkan bahawa ini adalah perkara yang sangat pelbagai genre. Tidak, anda tidak mula melakukan analisis, anda mula melihat masalah yang anda miliki dan mencari pelbagai alat dan pelbagai perisa analitik yang sesuai dengannya. Dan akhirnya, bersih bersih. Kerana evolusi perkakasan dan perisian, pada pandangan saya, analisis adalah di peringkat awal. Ada banyak lagi yang akan datang dan kita akan melihatnya dibentangkan pada tahun-tahun akan datang. Saya fikir saya boleh lulus bola kepada Dez sekarang.

Dez Blanchfield: Ya, bercakap tentang perbuatan yang sukar untuk diikuti, Robin. Saya akan melawat topik ini secara ringkas dari salah satu sudut kegemaran saya, yang merupakan sudut manusia. Terdapat begitu banyak perubahan yang berlaku dalam kehidupan seharian kita. Salah satu gangguan terbesar dalam kehidupan seharian kita, pada masa ini, saya hanya bekerja sehari-hari. Beralih bekerja dan cuba untuk melakukan pekerjaan yang anda lakukan untuk bekerja, dan jangkaan yang semakin meningkat bahawa anda akan pergi dari orang ke sehari ke superhero dan jumlah maklumat yang mengalir di sekitar organisasi dan mengeluarkan sangat, sangat cepat, ia adalah cabaran penting dan semakin banyak kita perlu menyediakan alat yang lebih baik dan lebih baik kepada orang untuk mencuba dan mengatasi aliran pengetahuan dan maklumat dan jadi saya fikir saya akan cuba dan datang ini dari sedikit sudut yang menyeronokkan . Tetapi, ia selalu menyerang saya bagaimana kita mempunyai minda tinggi atau perompak kilat ini dan sebagainya, yang semacam memandu kita ke arah apa yang kita bincangkan sebagai analitik tetapi sebenarnya apa yang kita bicarakan ialah membuat maklumat yang tersedia kepada orang ramai, dan membolehkan mereka berinteraksi dengannya dan melakukannya dengan cara yang semulajadi dan ia berasa normal.

Dan sebenarnya, ia mengingatkan saya tentang video YouTube seorang anak kecil, bayi kecil, duduk di atas lantai dan ia duduk di sana bermain dengan iPad dan ia mengepak di sekeliling dan mencubit dan memerah dan menggerakkan imej dan bermain dengan skrin, data di sana. Dan kemudian ibu bapa mengambil iPad itu dan meletakkan majalah, majalah bercetak di pangkuan kanak-kanak. Dan kanak-kanak ini mungkin tidak lebih daripada dua tahun. Kanak-kanak mula mencuba dan sapu dengan skrin majalah, dan mencubit dan memerah dan majalah itu tidak bertindak balas. Anak itu mengangkat jarinya dan melihatnya dan berfikir, "Hmm, saya tidak fikir jari saya bekerja, " dan ia berputar di lengan dan berfikir, "Ah tidak, kerja jari saya boleh merasakan lengan saya dan itu kelihatan baik, "dan ia meremukkan jari, dan jari itu menggelupas dan bertindak balas. Ya. Kemudian ia cuba berinteraksi dengan majalah lagi, dan rendah dan lihatlah ia tidak mencubit dan memerah dan tatal. Kemudian mereka mengambil majalah itu dan meletakkan kembali iPad di pangkuannya, dan tiba-tiba perkara itu berfungsi. Dan jadi inilah bayi yang datang dan telah dilatih untuk menggunakan alat analisis atau alat penstriman langsung untuk hiburan dan tidak dapat menjelaskan bagaimana majalah harus berfungsi dan bagaimana untuk membalik laman.

Dan itu satu konsep yang menarik dalam dirinya sendiri. Tetapi apabila saya berfikir tentang pengetahuan yang bergerak di sekitar organisasi, dan cara mengalir data dan cara orang berkelakuan, saya sering memikirkan konsep ini tentang apa yang telah dipelajari oleh orang-orang sebagai kumpulan kilat, yang merupakan peristiwa di mana dan media sosial yang mana ini lebih mudah dilakukan, satu idea seperti yang pergi ke tempat ini pada masa ini dan tarikh dan tindakan, atau video dan belajar tarian ini, atau memakai topi berwarna ini dan titik utara pada pukul satu. Dan anda menolak ini melalui rangkaian anda, dan secara keseluruhan beban orang ramai, beratus-ratus orang, muncul di tempat yang sama pada masa yang sama melakukan perkara yang sama dan ada faktor wow ini, seperti ini, "Lembu Kudus, itu benar-benar mengagumkan! "Tetapi sebenarnya ia adalah idea yang sangat mudah, dan konsep mudah hanya ditolak melalui rangkaian kami dan kami mendapat hasil ini yang merupakan perkara yang menakjubkan dan mengesankan. Dan apabila anda berfikir tentang sesuatu organisasi, cara kita mahu orang berkelakuan dan cara kita mahu mereka berurusan dengan sistem maklumat dan pelanggan, sering kali itu mudah, itu idea atau konsep atau sifat budaya atau tingkah laku yang kita cuba lulus melalui dan memperkuatkan alatan dan maklumat.

Dan saya menyokong semua mantra ini yang telah saya lakukan selama lebih kurang dua setengah tahun dan jika itu, jika kakitangan anda tidak dapat mencari apa yang mereka perlukan untuk melakukan tugas mereka, sama ada alat atau maklumat, mereka akan mencipta semula roda. Oleh itu, ini adalah satu cabaran yang semakin meningkat sekarang, di mana kita mempunyai banyak pengetahuan dan banyak maklumat dan perkara yang bergerak dengan cepat, yang kita mahu menghentikan orang mencipta semula roda. Dan apabila kita berfikir tentang persekitaran kerja kita, kembali kepada sudut masyarakat, yang merupakan salah satu kegemaran saya, saya kagum apabila kita terkejut bahawa bilik-bilik tidak persekitaran yang kondusif untuk hasil yang baik, atau kita berbaris seperti ini mengerikan gambar di sini, dan ia tidak banyak berubah, hanya menurunkan dinding dan memanggil mereka ruang kerja terbuka. Tetapi di tengah-tengah dengan gelung kuning di sekeliling mereka, ada dua orang bertukar pengetahuan. Namun, jika anda melihat ke seluruh bilik, mereka semua duduk di sana dengan penuh keriuhan di sana, meletakkan maklumat ke dalam skrin. Dan lebih kerap daripada tidak, tidak benar-benar bertukar pengetahuan dan data, dan ada pelbagai sebab untuk itu. Tetapi interaksi di tengah-tengah lantai di sebelah kiri di dalam lingkaran kuning, ada dua orang yang berbual di sana, bertukar pengetahuan, dan mungkin cuba mencari sesuatu, cuba berkata, "Adakah anda tahu di mana laporan ini, di mana saya boleh mencari data ini, alat apa yang saya gunakan untuk melakukan perkara ini? "Dan ia mungkin tidak berfungsi sehingga mereka tidak dapat apa-apa, dan berjalan di seberang lantai, melanggar peraturan ruang pejabat cubicle dan melakukannya secara peribadi.

Dan kami mempunyai persekitaran yang sama di sekitar pejabat yang kami bercanda dengan keseronokan, tetapi kenyataannya mereka cukup kuat dan berkesan. Dan salah satu daripada kegemaran saya ialah platform analisis mudah alih atau tetap yang dinamakan penyejuk air, di mana orang-orang bangun di sana dan berbual-bual di sana dan bertukar pengetahuan, dan membandingkan idea-idea dan melakukan analitik sambil berdiri di atas air sejuk, bertukar idea. Mereka adalah konsep yang sangat kuat apabila anda memikirkannya. Dan jika anda boleh menterjemahkannya ke sistem dan alat anda, anda mendapat hasil yang luar biasa. Dan kami mempunyai kegemaran sepanjang masa, yang pada asasnya adalah hub pengedaran data paling kuat di pejabat, atau dikenali sebagai meja resepsionis. Dan jika anda tidak dapat mencari sesuatu, ke manakah anda pergi? Baiklah anda berjalan ke hadapan pejabat dan pergi ke penerimaan dan berkata, "Adakah anda tahu di mana x, y, z?" Dan saya berani sesiapa sahaja untuk memberitahu saya bahawa mereka tidak pernah melakukan itu sekurang-kurangnya sekali dalam masa yang baru pekerjaan atau pada satu ketika ketika mereka tidak dapat mencari sesuatu. Dan anda perlu bertanya pada diri sendiri, kenapa mereka berlaku? Ia harus berada di tempat intranet atau beberapa alat atau apa sahaja. Ia harus mudah dicari.

Oleh itu, apabila terdapat data dan analisis dan alat yang kami berikan kepada kakitangan kami untuk melakukan tugas mereka dan cara mereka berinteraksi dengan pekerjaan, saya mendapat pandangan bahawa sebelum kemunculan alatan analisis dan platform data besar baru-baru ini, atau "pemprosesan data" serta memanggilnya di sekolah lama, pelaporan dan perkongsian pengetahuan adalah jauh dari dinamik atau kolaboratif atau terbuka, dan apabila anda berfikir tentang jenis sistem yang kami harapkan orang melakukan pekerjaan mereka, kami mempunyai klasik, apa orang memanggil warisan sekarang, tetapi kenyataannya adalah bahawa ia hanya warisan yang ada dan ia masih di sini hari ini, dan oleh itu ia tidak benar-benar warisan. Tetapi sistem HR tradisional dan sistem ERP - pengurusan sumber manusia, perancangan sumber perusahaan, pengurusan data perusahaan, dan sistem yang kami gunakan untuk menguruskan maklumat untuk menjalankan syarikat. Ia selalu siled. Dan dari hujung atas, platform mudah seperti intranet jabatan, cuba untuk berkomunikasi di mana segala sesuatu adalah dan bagaimana untuk mendapatkannya dan bagaimana untuk berinteraksi dengan pengetahuan di sekitar tempat itu. Kami pop itu pada intranet kami. Ia hanya sebagai baik sebagai orang yang membuat masa dan usaha untuk meletakkan itu di sana, jika tidak ia hanya akan ditinggalkan di kepala anda. Atau anda mendapat data yang duduk di bahagian bawah rantaian makanan, di SAN korporat dan segala yang ada di antara, jadi rangkaian kawasan penyimpanan penuh dengan fail dan data, tetapi siapa tahu di mana untuk mencarinya.

Lebih sering daripada tidak, kami telah membina platform data tertutup atau sistem tertutup, dan oleh itu orang telah kembali kepada orang seperti spreadsheet dan PowerPoints untuk menyampaikan maklumat di sekitar tempat itu. Tetapi ada satu perkara yang menarik yang berlaku baru-baru ini, dalam fikiran saya, dan itu adalah bahawa peranti mudah alih dan internet pada umumnya bekerja dalam gagasan bahawa perkara sebenarnya boleh menjadi lebih baik. Dan kebanyakannya dalam ruang pengguna. Dan itu satu perkara yang menarik bahawa kehidupan seharian kita mula mempunyai perkara seperti perbankan internet. Kami tidak perlu pergi ke bank yang sebenarnya untuk berinteraksi dengan mereka, kami boleh melakukannya melalui telefon. Pada asalnya yang kikuk tetapi kemudian internet datang dan kami mempunyai laman web. Anda tahu, dan berapa kali anda pernah ke bank anda kebelakangan ini? Saya benar-benar tidak boleh, saya mempunyai perbualan tentang perkara ini pada hari yang lain, dan saya sebenarnya tidak ingat kali terakhir saya pergi ke bank saya, yang saya agak terkejut dengannya, saya fikir saya mesti dapat ingat ini, tetapi ia begitu lama lalu saya sebenarnya tidak ingat ketika saya pergi ke sana. Oleh itu, kini kami mempunyai alat-alat ini di tangan kami dalam bentuk telefon bimbit, tablet dan komputer riba, kami mempunyai rangkaian dan akses kepada alat dan sistem, dan ruang pengguna kami telah mempelajari bahawa perkara boleh menjadi lebih baik, tetapi kerana perubahan pesat dalam ruang pengguna yang telah menjadi perubahan yang lebih letih dan glasiat di dalam perusahaan dan persekitaran, kita tidak selalu mengambil perubahan itu untuk kehidupan kerja sehari-hari.

Dan saya suka bersenang-senang pada fakta bahawa anda tidak boleh hidup data aliran ke hardcopy. Dalam imej ini di sini ada orang yang duduk melihat beberapa analitik yang telah dilakukan, dan ada graf yang indah yang dihasilkan oleh seseorang yang mungkin dibayar banyak wang sebagai ahli statistik atau aktuari, dan mereka sedang duduk di sana untuk melakukan analisis pada hardcopy dan mencubanya. Tetapi inilah perkara yang menakutkan bagi saya: Orang-orang di bilik mesyuarat ini, sebagai contoh, dan saya akan menggunakan ini sebagai contoh, mereka berinteraksi dengan data yang sekarang bersejarah. Dan ia sudah tua sejak ketika itu dihasilkan dan kemudian dicetak, jadi mungkin ia adalah laporan seminggu. Sekarang mereka membuat keputusan mengenai data tidak begitu buruk tetapi data lama, yang selalu boleh menjadi data buruk. Mereka membuat keputusan hari ini berdasarkan sesuatu yang bersejarah, yang merupakan tempat yang benar-benar buruk. Kami berjaya menggantikan hardcopy tersebut dengan orang-orang seperti tablet dan telefon kerana kami bekerja dengan sangat cepat dalam ruang pengguna, dan sekarang kami telah mengerjakannya dalam ruang perusahaan, yang real time adalah wawasan adalah nilai masa sebenar.

Dan kita semakin baik dan lebih baik pada itu. Dan ia membawa saya ke titik yang dibangkitkan oleh Robin sebelum ini, iaitu konsep saintis data warganegara dan pemacu konsep ini. Kepada saya, seorang saintis data warganegara hanya orang biasa dengan alat dan maklumat yang tepat mengenai orang seperti iPad. Mereka tidak perlu melakukan matematik, mereka tidak perlu tahu algoritma, mereka tidak perlu tahu bagaimana untuk menggunakan algoritma dan data peraturan, mereka hanya perlu tahu cara menggunakan antara muka. Dan itu membawa saya kembali kepada pengenalan saya dan konsep anak kecil yang duduk di sana dengan iPad berbanding majalah, berbanding iPad. Anak kecil itu dapat dengan cepat, secara intuitif belajar cara menggunakan antara muka iPad untuk menyelam maklumat dan berinteraksi dengannya, walaupun mungkin permainan atau media streaming atau video. Tetapi ia tidak dapat menerima tindak balas atau interaksi yang sama dari bar majalah dan hanya berkelip halaman selepas halaman, yang tidak begitu menarik, terutamanya jika anda seorang anak kecil yang dibesarkan dengan iPads. Selalunya, manusia dapat melihat dan belajar dengan cepat bagaimana memacu alat dan perkara yang jika kami hanya menyediakannya, dan jika kami menyediakan mereka dengan antara muka seperti peranti mudah alih dan terutamanya tablet dan telefon pintar dengan skrin yang cukup besar, dan terutamanya jika anda boleh berinteraksi mereka dalam sentuhan, dengan gerakan jari, tiba-tiba anda mendapatkan konsep ini seorang saintis data warganegara.

Seseorang yang boleh menggunakan sains data dengan alat yang betul, tetapi tanpa benar-benar perlu tahu bagaimana untuk melakukannya. Dan dalam fikiran saya banyak ini, seperti yang saya katakan, didorong oleh pengaruh pengguna, yang bergerak dan berubah menjadi permintaan dan perusahaan. Beberapa contoh yang sangat cepat. Kami, banyak daripada kita akan mula melakukan perkara dengan blog dan tapak web kami, seperti meletakkan iklan kecil atau melihat penjejakan dan pergerakan, kami menggunakan alat seperti Google Analytics dan kami bangun untuk fakta bahawa di blog kami dan laman web kecil, kita boleh meletakkan sedikit kod kecil di sana dan Google akan memberikan kita wawasan masa nyata ke siapa yang melawat laman web, bila dan di mana dan bagaimana. Dan dalam masa nyata kita benar-benar dapat melihat orang memukul laman web, pergi ke halaman dan kemudian lenyap. Dan ia agak mengagumkan. Saya masih suka melakukan itu, apabila saya cuba menerangkan analitik masa nyata kepada orang-orang yang saya bodoh untuk menunjukkan kepada mereka sebuah laman web dengan Google Analytics dipasang, dan sebenarnya melihat interaksi secara langsung dengan orang yang memukul tapak web dan bertanya kepada mereka, "Bayangkan jika anda mempunyai jenis pandangan tentang perniagaan anda dalam masa nyata. "

Ambil contoh runcit, dan mungkin farmaseutikal, saya fikir anda memanggilnya kedai ubat di Amerika, farmasi di mana anda berjalan masuk dan membeli segala-galanya dari tablet sakit kepala hingga krim dan topi matahari. Cuba untuk menjalankan organisasi tanpa maklumat masa nyata adalah satu konsep menakutkan sekarang kita tahu apa yang kita tahu. Sebagai contoh, anda boleh mengukur trafik kaki, anda boleh meletakkan peranti di sekitar kedai dengan wajah senyuman di satu sisi skrin kerana anda gembira, dan merah yang tidak bahagia di sebelah kanan dan beberapa warna yang berbeza di tengah. Dan ada platform yang dipanggil "Selamat atau Tidak" pada hari ini, di mana anda berjalan ke kedai dan anda boleh bang wajah gembira atau muka sedih, bergantung kepada maklum balas sentimen pelanggan anda. Dan itu boleh interaktif dengan masa nyata. Anda boleh mendapatkan harga berasaskan permintaan secara langsung. Jika banyak orang di sana, anda boleh memandu harga sedikit, dan anda boleh melakukan ketersediaan stok dan beritahu orang, contohnya - syarikat penerbangan, misalnya, akan memberitahu orang berapa kerusi yang tersedia sekarang di laman web semasa anda 'semula menempah penerbangan, anda tidak hanya mendail secara rawak dan berharap anda boleh muncul dan mendapatkan penerbangan. Data HR Live, anda boleh beritahu apabila orang sedang menunaikan waktu dan mematikannya. Perolehan, jika anda berada dalam perolehan dan anda memperoleh data secara langsung, anda boleh melakukan perkara-perkara seperti tunggu selama sejam dan lindung nilai terhadap harga dolar AS untuk membeli beban saham anda yang seterusnya dan mempunyai beban trak perkara muncul.

Ketika saya menunjukkan orang Google Analytics dan saya menyampaikan anekdot semacam itu, saat ini eureka, saat ini "a-ha!", Bola lampu ini padam dalam fikiran mereka seperti, "Hmm, saya dapat melihat banyak tempat di mana saya dapat melakukannya . Jika saya hanya mempunyai alat dan jika saya hanya mempunyai akses kepada pengetahuan itu. "Dan kita melihat ini sekarang dalam media sosial. Sesiapa sahaja yang pengguna media sosial yang bijak selain daripada hanya menunjukkan gambar sarapan mereka, cenderung untuk melihat berapa banyak suka yang mereka dapatkan dan berapa banyak lalu lintas yang mereka peroleh dan berapa banyak rakan yang mereka dapat, dan mereka melakukannya dengan suka, berkata, Twitter sebagai alat analisis. Anda boleh pergi ke Twitter.com untuk menggunakan alat ini, tetapi anda menaip ke dalam Google Twitter Analytics dot com, atau klik pada butang kanan atas dan tarik ke bawah menu dan melakukannya, anda akan mendapat graf cantik, hidup yang memberitahu anda berapa banyak tweet yang anda lakukan sendiri dan berapa banyak interaksi dengan mereka. Dan analisis masa nyata hanya pada media sosial peribadi anda. Bayangkan jika kami mempunyai orang seperti Google Analytics dan Facebook dan LinkedIn dan Twitter, statistik eBay datang kepada anda, tetapi dalam persekitaran kerja anda.

Sekarang kita mempunyai web dan mudah alih secara langsung di hujung jari kita, ia menjadi konsep kuasa. Dan untuk menarik saya ke kesimpulan saya, dan itulah yang selalu saya dapati bahawa organisasi yang memanfaatkan alat dan teknologi lebih awal, mereka memperoleh kelebihan yang ketara terhadap pesaing mereka yang sebenarnya tidak dapat mengejar pesaing. Dan kita melihat sekarang dengan konflik ahli sains data rakyat. Jika kita boleh mengambil orang dengan kemahiran, pengetahuan yang kita upah mereka, dan kita boleh memberi mereka alat yang betul, terutamanya keupayaan untuk melihat data masa nyata dan menemui data dan mengetahui di mana ia berada tanpa berjalan di sekeliling bilik dan bertanyakan soalan dengan kuat, harus pergi dan berdiri di pendingin air untuk melakukan beberapa analisis perbandingan dengan orang atau pergi dan minta penerimaan di mana indeks itu. Sekiranya mereka boleh melakukannya di hujung jari mereka dan mereka boleh membawanya ke mesyuarat dengan mereka dan duduk di dalam dewan lembaga yang menyelinap melalui skrin dalam masa nyata dan bukannya keras kepala, tiba-tiba kami telah memberi kuasa kepada kakitangan kami yang tidak perlu saintis data, tetapi sebenarnya menggunakan sains data dan mendorong hasil yang luar biasa untuk organisasi. Dan saya rasa titik tipu ini yang sebenarnya kita lalui sekarang di mana pengguna dipacu ke dalam perusahaan, cabarannya adalah bagaimana kita menyediakan perusahaan itu, dan itu tema yang saya rasa perbincangan hari ini. Dan dengan itu, saya akan membungkus sekeping saya dan menyerahkan untuk mendengar bagaimana kita dapat menyelesaikannya. Daud, kepada kamu.

David Sweenor: Baiklah, baik terima kasih banyak orang, dan terima kasih Robin. Awak tahu, Robin, saya setuju dengan penilaian asal awak. Proses analisis, ia tidak berbeza daripada pembangunan perisian. Saya fikir cabaran dalam sesebuah organisasi adalah benar-benar, anda tahu, mungkin perkara-perkara tidak jelas, mungkin terdapat komponen penerokaan kepadanya, dan komponen kreatif kepadanya. Dan Dez, anda tahu, saya bersetuju dengan anda, terdapat banyak mencipta roda, dan anda tahu, tidak ada organisasi yang saya pergi ke hari ini, anda bertanya, mengapa, mengapa anda melakukannya dengan cara ini? Mengapa perniagaan berjalan dengan cara ini? Dan mudah dipersoalkan, dan banyak kali apabila anda berada dalam organisasi, sukar untuk berubah. Saya suka analogi, pemakaian barangan. Dan tidak lagi apabila saya pergi ke lapangan terbang dan ingin menukar kerusi saya - saya melakukannya di telefon bimbit saya. Saya tidak perlu pergi ke ejen di gerai itu, dan menonton agen itu menaip sesuatu di monitor monochrome selama 15 minit untuk menukar tugasan kerusi saya. Saya lebih suka melakukannya pada telefon saya, dan ini merupakan perkembangan yang menarik.

Hari ini, kita akan bercakap sedikit tentang perisikan kolektif. Bagi mereka yang tidak menyedari, Statistica adalah platform analitik terdepan, yang sudah ada selama lebih dari 30 tahun. Sekiranya anda melihat mana-mana penerbitan yang terdapat di dalam industri penganalisis, ia sentiasa keluar sebagai salah satu pakej perisian analisis maju yang paling intuitif dan mudah digunakan. Oleh itu, kami telah menghabiskan beberapa tahun kebelakangan ini menggunakan konsep yang dikenali sebagai perisikan kolektif, dan kami mengambilnya ke peringkat seterusnya. Saya ingin memulakan perbualan ini dengan: bagaimana kerja dapat dilakukan di organisasi anda?

Dan ada dua gambar di sini. Yang di sebelah kiri adalah imej dari tahun 1960-an, dan saya tidak memulakan karier saya pada tahun 1960-an, tetapi imej di sebelah kanan adalah - itu kilang semikonduktor di mana saya mula bekerja. Dan saya bekerja di bangunan hitam itu, bumbung hitam di atas kiri. Tetapi mereka membuat barangan semikonduktor. Ini adalah gambar terbaru dari Google Images. Tetapi apabila anda kembali ke imej tahun 1960-an di sebelah kiri, ia sangat menarik. Anda mempunyai orang-orang ini duduk dalam barisan, dan mereka membuat, anda tahu, litar bersepadu dan semikonduktor. Tetapi terdapat penyeragaman, terdapat cara yang standard untuk melakukan sesuatu, dan terdapat proses yang jelas. Anda tahu, mungkin kerana orang-orang ini semua duduk di persekitaran terbuka, mungkin terdapat beberapa kerjasama. Saya fikir kita telah kehilangan sedikit itu dalam tenaga kerja pengetahuan.

Apabila saya duduk di bangunan itu di sebelah kiri atas, jika saya mahu bekerjasama dengan seseorang, ia tidak terbuka. Terdapat pejabat-pejabat ini, mungkin beberapa pasukannya jauh, atau mungkin saya terpaksa melintasi kampus ini; ia berjalan kaki selama 25 minit, dan saya perlu bercakap dengan seseorang di bangunan di sebelah kanan. Saya fikir kita kehilangan sesuatu di sepanjang jalan. Jadi, anda tahu, saya mempunyai pemikiran yang sama, mengapa orang - berapa ramai orang yang terus mencipta semula roda dalam organisasi anda? Saya fikir, anda tahu, organisasi secara keseluruhan melakukan pekerjaan yang baik pada tahun 1990-an dan 2000-an dengan CRM dan pergudangan data, dan setakat BI. Atas sebab tertentu, analisis telah tertinggal sedikit. Terdapat pelaburan yang besar dalam pergudangan data, dan menyeragamkan, dan menormalkan data anda, dan semua ini, dan CRM, tetapi analisis telah tertinggal dengan sebab tertentu. Dan saya tertanya-tanya mengapa. Mungkin ada yang kreatif - mungkin proses anda tidak jelas, mungkin anda tidak tahu apa keputusan atau tuil yang anda cuba belok, anda tahu, dalam perniagaan anda untuk mengubah sesuatu. Apabila kita pergi ke organisasi hari ini, terdapat banyak orang yang melakukan perkara-perkara secara manual dalam spreadsheet.

Dan anda tahu, saya melihat statistik pagi ini, saya fikir ia mengatakan 80, 90 peratus daripada spreadsheet mempunyai kesilapan, dan sesetengahnya boleh menjadi sangat penting. Seperti yang di Whale, di mana JPMorgan Chase kehilangan berbilion-bilion dan berbilion-bilion dolar kerana kesilapan spreadsheet. Jadi saya mempunyai premis yang saya fikir, mesti ada cara yang lebih baik untuk menyelesaikan sesuatu. Dan seperti yang telah kami sebutkan, kami mempunyai saintis data ini. Orang-orang ini mahal, dan mereka sukar dicari. Dan kadang-kadang mereka sedikit bebek ganjil. Tetapi saya fikir, anda tahu, jika saya perlu meringkaskan apa yang ahli sains data, mungkin seseorang yang memahami data. Saya fikir ia adalah seseorang yang memahami matematik, seseorang yang memahami masalah itu. Dan sesungguhnya, seseorang yang dapat menyampaikan hasilnya. Dan jika anda seorang saintis data, anda sangat bernasib baik sekarang ini, kerana gaji anda mungkin meningkat dua kali ganda dalam beberapa tahun kebelakangan ini.

Tetapi kebenaran diberitahu, banyak organisasi, mereka tidak mempunyai saintis data ini, tetapi organisasi anda mempunyai orang pintar. Anda mempunyai organisasi, anda mempunyai banyak orang pintar, dan mereka menggunakan spreadsheet. Anda tahu, statistik dan matematik bukan tugas utama mereka, tetapi mereka menggunakan data untuk memacu perniagaan ke hadapan. Benar, cabaran yang kita hadapi adalah, bagaimana anda mengambil, jika anda bernasib baik untuk mempunyai saintis data atau ahli statistik atau dua, bagaimana anda boleh membawanya, dan bagaimana anda dapat meningkatkan kerjasama antara orang-orang dan individu lain dalam organisasi anda? Sekiranya kita melihat bagaimana organisasi kita berstruktur, saya akan bermula, dan saya akan pergi dari kanan ke kiri. Dan saya tahu ini adalah mundur, tetapi kita mempunyai pengguna perniagaan ini.

Ini adalah sebahagian besar daripada populasi pekerja pengetahuan anda, dan bagi orang-orang ini, anda perlu memasukkan analitik dalam aplikasi perniagaan anda. Mungkin mereka melihat output analitik pada skrin pusat panggilan atau sesuatu, dan ia memberitahu mereka tawaran terbaik seterusnya untuk diberikan kepada pelanggan. Mungkin ia adalah pengguna atau pembekal di sebuah portal web, dan ia dengan serta-merta memberi mereka kredit, atau perkara-perkara seperti itu. Tetapi idea itu, mereka memakan analisis. Jika kita pergi ke pertengahan, ini adalah pekerja pengetahuan ini. Ini adalah orang yang melakukan perkara-perkara dengan spreadsheet hari ini, tetapi spreadsheet adalah rentan kesilapan dan pada satu ketika mereka kehabisan gas. Para saintis data warganegara, seperti yang kami panggil mereka, anda tahu, apa yang kami cuba lakukan untuk mereka benar-benar meningkatkan tahap automasi.

Dan anda mendengar dengan analitik bahawa 80 hingga 90 peratus kerja dalam sekeping persediaan data, dan bukan matematik sebenar, tetapi persediaan data itu. Kami cuba mengautomasikannya, sama ada anda melakukannya, dan kami mempunyai ahli-ahli sihir dan templat dan perkara-perkara yang boleh diguna semula, dan anda tidak perlu mengetahui tentang infrastruktur yang ada di dalam persekitaran anda. Dan jika kita melihat ke kiri, kita mempunyai saintis data ini. Dan seperti yang saya nyatakan, mereka tidak begitu. Dan apa yang kita cuba lakukan untuk menjadikannya lebih produktif, membolehkan mereka membuat perkara yang boleh dilakukan saintis data warganegara. Fikirkan ia seperti blok Lego, jadi para saintis data ini boleh membuat aset yang boleh diguna semula yang boleh digunakan seorang saintis data warganegara. Bina sekali, jadi kita tidak perlu terus mencipta roda.

Dan kemudian juga, orang-orang ini mungkin bimbang jika kita boleh melakukan perkara dalam pangkalan data, dan memanfaatkan pelaburan teknologi yang sedia ada yang telah dibuat oleh syarikat anda. Anda tahu, tidak masuk akal pada hari ini dan usia untuk mengocok data ke seluruh dunia. Oleh itu, jika kita melihat Statistica, seperti yang saya nyatakan, ia adalah platform yang telah lama wujud. Dan ia adalah produk yang sangat inovatif. Penggabungan data, belum ada sumber data yang tidak dapat kami akses. Kami mempunyai semua data penemuan dan visualisasi perkara yang anda harapkan; kita boleh melakukannya secara real time. Dan mungkin ada - saya fikir terdapat lebih daripada 16, 000 fungsi analisis dalam alat perisian, jadi lebih banyak matematik daripada yang saya boleh gunakan atau faham, tetapi ada di sana jika anda memerlukannya.

Kami mempunyai keupayaan untuk menggabungkan kedua-dua peraturan perniagaan dan aliran kerja analitik untuk benar-benar membuat keputusan perniagaan. Anda akan melampaui hakikatnya, inilah satu algoritma, inilah aliran kerja, tetapi anda mempunyai peraturan perniagaan yang selalu anda hadapi. Kami sangat selamat dalam tadbir urus. Kami digunakan dalam banyak pelanggan farmaseutikal, kerana FDA mempercayai kami. Anda tahu, hanya bukti dalam puding bahawa kita mempunyai kawalan dan keupayaan audit untuk diterima oleh mereka. Dan akhirnya, anda tahu, kami terbuka dan fleksibel dan boleh diperbaharui, jadi anda perlu membuat platform yang sama, anda mahu saintis data anda menjadi produktif, anda mahu saintis data warganegara anda menjadi produktif, anda mahu dapat untuk menggunakan output analitik ini kepada pekerja dalam organisasi anda.

Sekiranya kita melihatnya, inilah contoh beberapa visualisasi. Tetapi dapat mengedarkan output analitik anda kepada pengguna line-of-business, jadi contoh pertama di sebelah kiri, itulah diagram rajah analitik. Dan mungkin anda penyelidik penipuan, dan anda tidak tahu bagaimana sambungan ini dibuat, dan ini boleh menjadi orang, ini boleh menjadi entiti, ini boleh menjadi kontrak, apa-apa. Tetapi anda boleh memanipulasi ini dengan tetikus anda, dan berinteraksi dengannya untuk benar-benar faham - jika anda seorang penyiasat penipuan, untuk memahami senarai prioriti yang hendak disiasat, betul, kerana anda tidak boleh bercakap dengan semua orang, jadi anda mempunyai untuk mengutamakan.

Jika kita melihat imej di sebelah kanan di sana, untuk papan pemuka penyesuaian ramalan, ini adalah masalah yang sangat menarik. Mungkin anda seorang pemilik lapangan terbang, dan anda mempunyai pengimbas badan ini di sana. Pengimbas badan ini, jika anda pergi ke lapangan terbang, terdapat beberapa komponen di sana yang mempunyai kira-kira sembilan bulan kehidupan hayat. Dan perkara-perkara ini benar-benar mahal. Jika saya mempunyai beberapa pintu masuk, pelbagai pengimbas di lapangan terbang saya, nombor satu yang saya ingin memastikan saya dikemas dengan tepat di setiap pintu, dan bagi bahagian-bahagian yang ada di pengimbas, saya tidak mahu memerintahkan mereka juga awal, dan saya mahu memilikinya sebelum ia pecah. Kami mempunyai keupayaan, mungkin jika anda memiliki lapangan terbang, dapat meramalkan apabila perkara-perkara ini akan pecah dan meramalkan tahap kakitangan.

Jika kita melihat ke kanan bawah, ini adalah jika anda berada dalam persekitaran pembuatan, ini hanya representasi graf aliran pembuatan. Dan ia agak sukar untuk dilihat, tetapi terdapat lampu isyarat merah dan hijau pada pelbagai sektor proses ini, dan jika saya seorang jurutera, terdapat matematik yang sangat canggih di sana, tetapi saya boleh mengetuk dalam sektor proses tertentu dan melihat parameter, dan masukan yang, mungkin menyebabkannya berada di luar kawalan. Sekiranya kita melihat saintis data warganegara kita, matlamat kita adalah untuk memudahkan para saintis data warganegara. Kami mempunyai ahli-ahli sihir dan template, dan satu perkara yang saya fikir benar-benar menarik, adakah kita mempunyai nod pemeriksaan kesihatan data automatik ini. Dan sebenarnya apa yang dilakukannya, ia mempunyai pintar terbina dalam.

Saya menyebut data persediaan - ia mengambil masa yang penting, iaitu dalam pengagregatan data dan mempersiapkannya. Tetapi mari kita asumsikan saya mempunyai data saya, saya dapat menjalankannya melalui nod pemeriksaan kesihatan data ini, dan ia mencantumkan invariance, dan sparseness, dan outliers, dan semua perkara ini, ia mengisi nilai yang hilang dan ia melakukan banyak matematik saya Saya tidak faham, jadi saya boleh menerima mungkir, atau jika saya sedikit pandai, saya boleh mengubahnya. Tetapi intinya, kami mahu mengautomasikan proses itu. Perkara ini melibatkan kira-kira 15 pemeriksaan dan hasil yang berbeza pada set data yang dibersihkan. Apa yang kami lakukan adalah menjadikannya lebih mudah bagi orang untuk mencipta aliran kerja ini.

Di sinilah kita bercakap tentang kerjasama antara saintis data dan saintis data warganegara. Jika kita melihat imej-imej ini di sebelah kanan, kita melihat aliran kerja persediaan data ini. Dan mungkin ini sangat canggih, mungkin ini adalah rahsia syarikat anda, saya tidak tahu, tetapi kami tahu seseorang dalam organisasi anda boleh mengakses satu atau lebih silo data yang kami ada. Kami memerlukan satu cara, nombor satu, ambil mereka dan jahitan mereka bersama-sama, dan nombor dua, mungkin terdapat pemprosesan khas yang kami mahu lakukan, bahawa ia tidak melebihi pemeriksaan kesihatan data kami, dan itulah saus rahsia syarikat anda. Saya boleh membuat aliran kerja ini dalam organisasi kami, dan ia runtuh sebagai nod. Anda melihat anak panah menunjuk ke bawah, itu hanya nod, dan kita boleh mempunyai seratus perkara ini dalam organisasi. Ideanya ialah, kita mempunyai orang yang mengetahui sesuatu tentang ruang tertentu, mereka boleh membuat aliran kerja, dan orang lain boleh menggunakannya semula. Kami cuba meminimumkan penambahbaikan roda.

Dan kita boleh melakukan perkara yang sama dengan aliran kerja pemodelan analitik. Dalam kes ini di sebelah kanan, aliran kerja ini, mungkin terdapat 15 algoritma yang berbeza, dan saya ingin memilih yang terbaik untuk tugas itu. Dan saya tidak perlu faham sebagai seorang saintis data warganegara apa yang sedang berlaku di laman web labah-labah itu di sana, tetapi ia hanya runtuh ke dalam nod, dan mungkin nod itu hanya berkata, "hitung skor risiko kredit." "Kira peluang daripada jangkitan laman pembedahan, "apa yang ada padamu. "Kira kebarangkalian sesuatu yang menjadi transaksi penipuan." Sebagai ahli sains data warga negara, saya boleh menggunakan matematik yang sangat canggih ini yang telah dibina oleh orang lain, mungkin salah satu daripada saintis data ini telah dibina dalam organisasi saya.

Dari perspektif sains data, anda tahu, saya telah berbincang dengan saintis data yang suka menulis kod, dan saya telah berbincang dengan saintis data yang tidak suka menulis kod. Dan tidak mengapa, jadi kami mempunyai antara muka pengguna yang sangat visual dan grafik. Kami boleh mengambil data kami, kami boleh melakukan pemeriksaan kesihatan data automatik kami, dan mungkin saya ingin menulis kod. Saya suka Python, saya suka R, tetapi ideanya ialah, para saintis data ini, mereka kurang bekalan, dan mereka suka kod dalam bahasa tertentu. Kami tidak terutamanya mempunyai keutamaan untuk bahasa apa yang anda mahu kodkan, jadi jika anda mahu melakukan R, lakukan R; jika anda mahu melakukan Python, lakukan Python. Itu hebat. Jika anda ingin melepaskan analisis anda ke Azure, pecah analisis anda ke awan. Dan matlamat di sini adalah benar-benar untuk menawarkan kelenturan dan pilihan untuk menjadikan saintis data anda sebagai produktif kerana mereka boleh.

Kini saintis data, mereka orang pintar, tetapi mungkin mereka bukan pakar dalam segala-galanya, dan mungkin terdapat beberapa jurang dalam apa yang mereka boleh lakukan. Dan jika anda melihat di dalam industri, terdapat banyak pasaran analitik yang berbeza yang wujud di sana. Ini adalah contoh, mungkin saya perlu membuat pengiktirafan imej dan saya tidak mempunyai kemahiran itu, mungkin saya pergi ke Algorithmia dan mendapatkan algoritma pengiktirafan imej. Mungkin saya pergi ke Apervita dan mendapatkan algoritma penjagaan kesihatan yang sangat istimewa. Mungkin saya ingin menggunakan sesuatu di perpustakaan pembelajaran mesin Azure. Mungkin saya mahu menggunakan sesuatu dalam platform Statistika asli.

Sekali lagi, idea di sini adalah kami ingin memanfaatkan komuniti analisis global. Kerana anda tidak akan mempunyai semua kemahiran dalam empat dinding anda, jadi bagaimana kami boleh membuat perisian - dan inilah yang kami lakukan - yang membolehkan saintis data anda menggunakan algoritma dari pelbagai pasaran. Kami telah melakukannya dengan R dan Python untuk masa yang lama, tetapi ini memperluaskan ke pasaran aplikasi ini yang wujud di sana. Dan sama seperti yang anda lihat di bahagian atas ini, kami menggunakan H2O pada Spark, jadi terdapat banyak algoritma analitik di sana. Anda tidak perlu memberi tumpuan untuk mencipta ini dari awal, mari menggunakan semula ini yang hidup dalam komuniti sumber terbuka, dan kami mahu orang ini menjadi produktif yang mungkin.

Langkah seterusnya, setelah kami mempunyai saintis data warganegara kami dan saintis data kami, adakah anda benar-benar mempromosikan dan mengedarkan amalan terbaik ini? Kami mempunyai teknologi dalam perisian kami yang membolehkan anda mengedarkan analisis di mana sahaja. Dan ini lebih daripada pandangan pengurusan model, tetapi tidak lagi saya terikat dengan empat dinding atau pemasangan tertentu di Tulsa atau Taiwan atau California, atau apa yang ada pada anda. Ini adalah platform global, dan kami mempunyai banyak, banyak pelanggan yang digunakan dalam penggunaannya oleh pelbagai tapak.

Dan sebagainya, perkara utama adalah, jika anda melakukan sesuatu di Taiwan dan anda mahu meniru di Brazil, itu hebat. Pergi ke sana, ambil templat yang boleh diguna semula, ambil aliran kerja yang anda mahu. Ini cuba mewujudkan piawaian ini, dan cara biasa untuk melakukan sesuatu, jadi kami tidak melakukan perkara yang sama sekali berbeza di mana-mana. Dan komponen penting lain ini, sebenarnya kita mahu mengambil matematik di mana data itu hidup. Anda tidak perlu mengocok data antara, anda tahu, California dan Tulsa dan Taiwan dan Brazil. Kami mempunyai teknologi yang membolehkan kami mengambil data matematik, dan kami akan mempunyai satu lagi webcast teknologi Hot pada subjek itu.

Tetapi kami panggil seni bina ini, dan ini mengintip menyelinap, Senibina Pengedaran Asli India. Idea utama di sebalik ini ialah kita mempunyai platform, Statistica, dan saya boleh mengeksport aliran kerja analitik sebagai atom. Dan saya boleh melakukan model, atau keseluruhan alur kerja, supaya tidak penting. Tetapi saya boleh membuatnya, dan mengeksportnya dalam bahasa yang sesuai dengan platform sasaran. Di sebelah kiri ini, ramai orang melakukan ini, tetapi mereka mencetak gol dalam sistem sumber. Baiklah, kami boleh melakukan pemarkahan dan kami boleh melakukan model bangunan dalam pangkalan data, jadi itu menarik.

Dan kemudian di sebelah kanan, kami mempunyai Boomi. Ini adalah teknologi pendamping, kita bekerja dengan semua ini. Tetapi kita juga boleh mengambil aliran kerja ini, dan pada dasarnya mengangkutnya di mana saja di dunia. Apa-apa sahaja yang mempunyai alamat IP. Dan saya tidak perlu memasang Statistica di awan awam atau swasta. Apa-apa sahaja yang boleh menjalankan JVM, kita boleh menjalankan aliran kerja analitik ini, alur kerja persediaan data, atau hanya model pada mana-mana platform sasaran ini. Sama ada di awan awam atau swasta saya, sama ada di dalam traktor saya, kereta saya, rumah saya, lampu suluh saya, perkara-perkara internet saya, kita mempunyai teknologi yang membolehkan anda mengangkut aliran kerja di mana sahaja di dunia.

Mari tinjau. Anda tahu, kita mempunyai garis pengguna perniagaan, jadi orang-orang ini, kita mempunyai teknologi membolehkan mereka menggunakan output dalam format yang mereka selesa dengan. Kami mempunyai saintis data warganegara, dan apa yang kami cuba lakukan adalah meningkatkan kerjasama, menjadikannya sebahagian daripada pasukan, bukan? Dan jadi kami mahu orang berhenti mencipta semula roda. Dan kami mempunyai saintis data ini, mungkin terdapat jurang kemahiran di sana, tetapi mereka boleh kod dalam bahasa yang mereka mahu, mereka boleh pergi ke pasar analitik dan menggunakan algoritma di sana. Dan dengan ini, bagaimana anda tidak boleh berfikir bahawa semuanya mengagumkan dengan ini? Ini sempurna, inilah yang kami lakukan. Kami sedang membina aliran kerja yang boleh diguna semula, kami memberikan arahan orang, kami memberi mereka blok Lego supaya mereka boleh membina istana yang besar ini dan apa sahaja yang mereka mahu lakukan. Sebagai contoh, kami mempunyai platform yang memberi kuasa kepada pengguna perniagaan, saintis data warganegara, ahli sains data programmer, kami mempunyai - kami boleh menangani apa-apa jenis penggunaan analisis IOT kelebihan, dan kami membolehkan pengenalan perisikan kolektif ini. Dengan itu, saya fikir kami mungkin akan membukanya untuk soalan.

Robin Bloor: Baiklah. Saya fikir yang pertama - maksud saya, jujur, maksud saya telah diberi taklimat oleh Dell Statistica sebelum ini, dan jujur ​​saya sebenarnya agak terkejut dengan perkara-perkara yang saya tidak tahu bahawa anda dibesarkan dalam persembahan . Dan saya harus mengatakan bahawa satu perkara, itu sesuatu yang menjadi masalah bagi saya dalam penggunaan analisis, adalah, anda tahu, mendapatkan alat itu bukan, anda tahu? Terdapat banyak alat di luar sana, terdapat alat sumber terbuka, dan sebagainya dan sebagainya, dan ada pelbagai, apa yang saya panggil, separa platform. Tetapi saya fikir perbezaan yang anda ada, saya amat kagum dengan beberapa aliran kerja.

Tetapi perbezaannya adalah seolah-olah anda memberikan akhir. Ia seperti analisis adalah proses perniagaan yang canggih yang bermula dengan pengambilalihan data dan kemudian meneruskan siri langkah-langkah yang menyeluruh, bergantung pada bagaimana data yang lemah, dan kemudian ia dapat merangkum dalam pelbagai siri serangan matematik yang berbeza di data. Dan kemudian keputusan muncul dalam satu cara atau yang lain dan mereka perlu bertindak. Terdapat sejumlah besar analisis yang saya jumpai di mana banyak kerja hebat telah dilakukan tetapi tidak ada tindakan. Dan anda seolah-olah mempunyai banyak perkara yang diperlukan. Saya tidak tahu bagaimana komprehensifnya, tetapi cara ini lebih komprehensif daripada yang saya harapkan. Saya sangat kagum dengan itu.

Saya ingin anda mengulas mengenai spreadsheet. Anda sudah mengatakan sesuatu, tetapi salah satu daripada perkara yang saya perhatikan, dan saya telah mencatat sejak bertahun-tahun, tetapi ia menjadi semakin jelas, apakah terdapat banyak spreadsheet yang amat besar yang merupakan sistem bayangan dan benar-benar saya fikir hamparan itu, maksud saya, ia adalah alat yang hebat apabila ia diperkenalkan dan ia telah menjadi indah sejak banyak cara, tetapi ia adalah alat yang umum, ia tidak semestinya sesuai untuk tujuan. Ia pastinya tidak begitu baik dalam konteks BI dan saya fikir ia adalah buruk dalam konteks analytics. Dan saya tertanya-tanya jika anda mempunyai beberapa komen untuk dibuat, katakan, contoh di mana, anda tahu, Statistica telah memerah keluar, menggunakan spreadsheet yang berlebihan, atau sebarang komen yang anda ingin buat mengenainya?

David Sweenor: Ya, saya fikir, anda tahu, anda boleh mencari kesilapan spreadsheet yang terkenal. Google atau enjin carian apa sahaja yang anda gunakan akan kembali dengan hasil yang banyak. Saya tidak fikir, anda tahu, kita akan menggantikan hamparan. Itulah niat kita, tetapi banyak organisasi yang saya pergi, terdapat beberapa penyihir spreadsheet atau ninjas atau apa sahaja yang anda mahu memanggil mereka, tetapi mereka mempunyai spreadsheet yang sangat canggih dan anda harus berfikir, apa yang berlaku apabila ini orang menang lotto dan mereka tidak kembali? Dan apa yang kita cuba lakukan adalah, kita tahu spreadsheet akan wujud supaya kita dapat menelan mereka, tapi saya fikir apa yang kita cuba lakukan adalah membangun representasi visual aliran kerja anda supaya dapat difahami dan dikongsi dengan orang lain . Spreadsheets agak sukar, sukar untuk dikongsi. Dan sebaik sahaja anda menghantar hamparan anda kepada saya, saya telah mengubahnya, dan sekarang kita tidak disegerakkan dan kita mendapat jawapan yang berbeza. Apa yang kita cuba lakukan ialah meletakkan beberapa penjaga di sekeliling ini dan membuat perkara menjadi lebih cekap. Dan hamparan benar-benar mengerikan apabila menggabungkan pelbagai set data bersama, anda tahu? Mereka jatuh di sana. Tetapi kita tidak akan menggantikannya, kita menanggungnya dan kita mempunyai orang yang mula beralih kerana jika kita mempunyai nod yang mengatakan "mengira risiko" itulah yang digunakan orang yang menggunakan spreadsheet. Jadi mereka sudah tiada.

Robin Bloor: Ya, maksud saya, saya akan mengatakan bahawa, anda tahu, dari satu perspektif yang saya melihat perkara, saya akan mengatakan bahawa spreadsheet hebat untuk membuat maklumat. Mereka juga hebat untuk mewujudkan pulau-pulau pengetahuan, tetapi mereka benar-benar tidak baik untuk berkongsi pengetahuan. Mereka tidak mempunyai mekanisme untuk berbuat demikian, dan jika anda menyerahkan spreadsheet kepada seseorang, ia tidak seperti anda boleh membacanya seperti artikel yang menerangkan dengan tepat apa yang mereka lakukan. Ia bukan sahaja di sana. Saya fikir, anda tahu, perkara yang paling mengagumkan saya mengenai persembahan dan mengenai keupayaan Statistica, nampaknya sangat agnostik. Tetapi ia mendapat benang ini melalui aliran kerja. Adakah saya betul-betul mengandaikan bahawa anda boleh melihat aliran kerja akhir-ke-akhir tepat, anda tahu, dari pengambilalihan data sepanjang jalan untuk memasukkan keputusan dalam aplikasi BI tertentu atau bahkan menjalankan aplikasi?

David Sweenor: Ya, betul. Dan ia mempunyai keupayaan hujung ke hujung dan sesetengah organisasi menggunakannya sepenuhnya, dan saya tidak ilusi tidak ada mana-mana syarikat hari ini membeli segala-galanya dari satu vendor. Kami mempunyai campuran. Sesetengah orang menggunakan Statistica untuk segala-galanya dan sesetengah orang menggunakannya untuk aliran kerja pemodelan, sesetengah orang menggunakannya untuk aliran kerja persediaan data. Sesetengah orang menggunakannya untuk mengedarkan ratusan laporan kejuruteraan kepada jurutera. Dan jadi kita ada segalanya di antara. Dan ia benar-benar end-to-end dan ini, anda tahu, platform agnostik, bahawa jika ada algoritma yang anda mahu gunakan dalam R atau Python, Azure, Apervita, apa sahaja, anda tahu, menggunakannya. Itu hebat, menjadi produktif, gunakan apa yang anda tahu, gunakan apa yang anda selesaikan dan kami mempunyai mekanisme untuk memastikan ia dikawal dan boleh di audit dan semua perkara semacam itu.

Robin Bloor: Saya sangat suka aspek itu. Maksud saya, saya tidak tahu jika anda boleh bercakap melebihi apa yang anda katakan kepada kekayaan apa yang ada di sini. Maksud saya, saya telah melihat ini tetapi saya tidak melihatnya dengan cara yang komprehensif dan sudah tentu terdapat sejumlah besar perpustakaan Python di perpustakaan kami tetapi ada apa-apa yang anda boleh menambah pada gambar itu? Kerana saya fikir itu perkara yang sangat menarik, anda tahu, idea bahawa anda akan mempunyai komponen yang boleh dipercayai, kerana anda tahu pelbagai orang yang telah menciptakannya dan pelbagai orang yang menggunakannya yang boleh anda muat turun. Anda tahu, bolehkah anda memperkayakan apa yang telah anda katakan tentang itu?

David Sweenor: Ya, saya fikir beberapa pasaran aplikasinya, anda tahu, pasaran algoritma yang ada di sana. Sebagai contoh, anda tahu, Dr. John Cromwell di University of Iowa, dia telah membangunkan satu model yang akan meramalkan, yang digunakan dalam masa nyata sementara kami sedang dihidupkan, akan memberikan skor jika anda akan mendapat jangkitan laman pembedahan. Dan jika skor itu cukup tinggi, mereka akan mengambil hak campur tangan di bilik operasi. Itu sangat menarik. Jadi mungkin ada hospital lain yang tidak begitu besar. Nah, Apervita adalah pasaran aplikasi kesihatan untuk analisis. Anda boleh pergi mencari satu di banyak pasar aplikasi ini, anda boleh mencari dan menggunakan semula itu, dan urus niaga adalah antara anda dan sesiapa yang memiliki itu, tetapi anda boleh pergi mencari atau anda boleh berkata, "Ini apa yang saya perlukan. "Saya fikir ia memanfaatkan komuniti global kerana semua orang pakar hari ini, dan anda tidak boleh mengetahui segala-galanya. Saya fikir R dan Python adalah satu perkara tetapi idea ini, "Saya mahu melakukan fungsi ini, letakkan spec di sana di salah satu tempat pasaran aplikasi ini dan buat seseorang membangunkannya untuk anda." Dan mereka boleh mengewangkan itu, saya fikir itu sangat menarik dan sangat berbeza daripada murni model sumber terbuka.

Robin Bloor: Baiklah. Bagaimanapun, saya akan lulus bola kepada Dez. Adakah anda ingin menyelam, Dez?

Dez Blanchfield: Sudah tentu dan saya ingin kekal pada perkara spreadsheet hanya seketika kerana saya fikir ia telah menangkap inti yang tepat daripada apa yang kita bicarakan di sini. Dan anda membuat komen, Robin, berkaitan dengan peralihan dari jenis hamparan lama dalam bentuk fizikal mereka kepada bentuk elektronik. Kami mempunyai perkara yang menarik di mana, anda tahu, apabila hamparan pada asalnya adalah perkara yang mereka hanya helaian kertas dengan baris dan lajur dan anda secara manual akan menulis perkara-perkara ke bawah, maka anda akan kuasa dan mengira mereka, sama ada dengan melakukan ia dari bahagian atas kepala anda atau dengan beberapa peranti lain. Tetapi kita masih berpeluang untuk mengalami kesilapan dengan kesalahan tulisan tangan atau disleksia, dan sekarang kita telah menggantikannya dengan kesilapan. Risiko ialah dengan spreadsheet profil risiko lebih cepat dan lebih besar, tetapi saya fikir alat seperti Statistica membalikkan piramid risiko.

Saya sering melukis gambar ini pada papan putih seorang tokoh kayu di bahagian atas, sebagai satu orang, dan kemudian koleksi mereka ke bawah, katakan, bayangkan sepuluh daripada mereka di bahagian bawah papan putih itu, dan saya menarik piramid di mana titik piramid di orang tunggal dan kaki piramid koleksi orang. Dan saya menggunakan ini untuk memvisualisasikan idea bahawa jika satu orang di bahagian atas membuat spreadsheet membuat kesilapan dan berkongsi dengan sepuluh orang, dan sekarang kita mempunyai sepuluh salinan kesilapan. Berhati-hati dengan makro anda dan berhati-hati dengan Visual Basic anda jika anda akan berpindah ke itu. Kerana apabila kita membina alat elektronik seperti spreadsheet ia sangat berkuasa, tetapi ia juga berkuasa dengan cara yang baik dan buruk.

Saya fikir alat seperti Statistica membawa keupayaan untuk membalikkan profil risiko itu dan itu adalah bahawa anda kini boleh sampai ke titik di mana anda mendapat banyak alat yang tersedia untuk individu itu dan ketika mereka pergi dari banyak alat di bahagian atas piramid dan kemudian ke bahagian paling bawah di mana titik piramid kini terbalik adalah alat sebenar, jika kita mempunyai pasukan orang yang membina alat dan algoritma itu. Dan saintis data tidak perlu menjadi pakar dalam analisis regresi pada data mereka. Mereka mungkin dapat menggunakan alat ini, tetapi anda mungkin mempunyai lima atau enam ahli statistik dan aktuari dan ahli sains data dan beberapa ahli matematik yang bekerja pada alat itu, modul itu, algoritma itu, yang masuk dan sebagainya di dalam spreadsheet, jadi bayangkan bahawa setiap spreadsheet yang diterbitkan yang anda boleh gunakan sebenarnya ditulis oleh pakar yang menguji makro, menguji Visual Basic, memastikan algoritma berfungsi, jadi apabila anda memperolehnya, anda hanya boleh memasukan data ke dalamnya tetapi anda sebenarnya tidak dapat memecahkannya dan oleh itu lebih baik untuk dikawal.

Saya fikir banyak alat analisis melakukan itu. Saya rasa datang ke titik itu, adakah anda melihat bahawa dalam bidang sekarang, adakah anda melihat peralihan dari spreadsheet yang berpotensi dapat menolak kesilapan dan kesilapan dan risiko, ke titik di mana alat yang anda bina dengan anda platform sekarang, dengan penemuan data yang tepat dalam masa nyata dan orang yang membina modul dan algoritma menghapus atau mengurangkan profil risiko itu? Adakah perkhidmatan pelanggan melihat bahawa dalam erti kata sebenar atau adakah anda fikir itu hanya berlaku dan mereka tidak menyedarinya?

David Sweenor: Anda tahu, saya fikir ada beberapa cara untuk menjawabnya. Tetapi apa yang kita lihat, anda tahu, dalam mana-mana organisasi, dan saya menyebutkan bahawa analitik yang saya fikir mungkin tertinggal dari perspektif pelaburan korporat, jenis apa yang kita lakukan dengan pergudangan data dan CRM. Tetapi apa yang kita lihat, maka, diperlukan banyak perubahan organisasi, untuk mendapatkan inertia organisasi itu. Tetapi apa yang kita lihat ialah orang mengambil spreadsheet mereka, mengambil alur kerja mereka, dan saya menyebut keselamatan dan tadbir urus, "Baiklah, saya mempunyai spreadsheet, " "Baiklah, saya dapat mengunci ini dan saya dapat mengawalnya." kita melihat banyak pertubuhan, mungkin mereka hanya bermula di sana. Dan jika ia berubah, ada aliran kerja dan saya akan pergi, nombor satu walaupun, siapa yang mengubahnya? Mengapa mereka mengubahnya. Apabila mereka menukarnya. Dan saya juga boleh menetapkan aliran kerja supaya saya tidak akan meletakkan spreadsheet baru ini kepada pengeluaran kecuali ia disahkan dan disahkan oleh satu, dua, tiga, namun banyak pihak yang ingin anda tentukan dalam aliran kerja anda. Saya fikir orang mula mengambil, dan organisasi mula mengambil langkah-langkah bayi di sana, tetapi saya mungkin mencadangkan kita mempunyai jalan panjang untuk pergi.

Dez Blanchfield: Sesungguhnya dan saya fikir anda sedang membina kawalan keselamatan dan tadbir urus di sana, maka beban kerja secara automatik dapat memetakannya dan segala-galanya sampai kepada ketua pegawai risiko, yang kini menjadi sesuatu. Anda boleh mula mengawal bagaimana alat dan sistem tersebut diakses dan siapa yang melakukan apa dengan mereka, jadi sangat kuat. Saya fikir perkara-perkara lain yang masuk ke dalam ini adalah jenis alat yang anda berikan, untuk saya, memberi pinjaman kepada tingkah laku manusia lebih daripada hamparan tradisional yang kita bicarakan, jika saya mempunyai bilik yang penuh dengan orang dengan papan pemuka yang sama dan akses kepada data yang sama yang mereka benar-benar boleh mendapatkan pandangan yang berbeza dan, sebagai hasilnya, mendapat pandangan yang sedikit berbeza dari maklumat yang sama, yang sesuai dengan keperluan mereka supaya mereka dapat berkolaborasi. Kami kemudian mempunyai pandangan yang lebih manusia dan interaksi dengan perniagaan dan proses membuat keputusan, berbanding dengan semua yang pergi ke mesyuarat yang sama dengan PowerPoint yang sama, dan spreadsheet yang sama dicetak, semua data tetap yang sama.

Adakah anda melihat peralihan dalam tingkah laku dan budaya dalam organisasi yang menyusun alat anda sekarang di mana mereka melihat bahawa berlaku, di mana ia tidak seperti lima orang di dalam bilik yang melihat spreadsheet yang sama cuba mengucapkannya dan membuat nota padanya, tetapi kini mereka sebenarnya berinteraksi dengan papan pemuka dan alat dalam masa nyata, dengan visualisasi dan analisis di hujung jari mereka dan mendapat aliran yang sama sekali berbeza pada perbualan dan interaksi, bukan hanya dalam mesyuarat tetapi hanya kerjasama umum di sekitar organisasi itu? Kerana mereka boleh melakukannya masa nyata, kerana mereka boleh bertanya soalan dan mendapatkan jawapan yang sebenar. Adakah itu trend yang anda lihat pada masa ini atau yang belum berlaku lagi?

David Sweenor: Tidak, saya fikir ia sudah pasti memulakan laluan itu dan saya fikir perkara yang sangat menarik adalah, anda tahu, jika kita mengambil contoh kilang, sebagai contoh. Mungkin seseorang yang memiliki sektor proses tertentu dalam kilang itu ingin melihat dan berinteraksi dengan data ini dengan cara tertentu. Dan mungkin saya, menghadap semua proses, mungkin ini di bahagian bawah, mungkin saya mahu melihatnya di seluruh segalanya. Saya fikir apa yang kita lihat adalah, nombor satu, orang mula menggunakan set visualisasi standard atau visualisasi standard dalam organisasi mereka, tetapi ia juga disesuaikan dengan peranan mereka. Jika saya seorang jurutera proses, mungkin itu pandangan yang sangat berbeza daripada seseorang yang melihatnya dari perspektif rantaian bekalan, dan saya fikir itu hebat kerana ia perlu disesuaikan dan ia perlu dilihat melalui lensa yang anda perlukan untuk mendapatkan pekerjaan anda.

Dez Blanchfield: Saya rasa proses keputusan itu turun, masa bijak dan pantas, untuk membuat keputusan yang pintar dan tepat juga meningkat dengan cepat, bukan? Kerana jika anda mempunyai analitik masa nyata, papan pemuka masa nyata, jika anda mempunyai alat Statistica di hujung jari anda, anda tidak perlu melintasi lantai untuk pergi dan bertanya kepada seseorang tentang sesuatu, anda telah mendapatnya dalam hard copy. Anda boleh berbincang, berinteraksi dan benar-benar membuat keputusan dengan cepat dan mendapatkan hasil itu dengan serta-merta. Yang saya fikir sesetengah syarikat benar-benar belum memegang, tetapi apabila mereka melakukannya, ini akan menjadi masa eureka, ya, kita masih boleh tinggal di bilik dan bekerja di rumah, tetapi kita boleh berinteraksi dan bekerjasama dan membuat keputusan kita buat ketika kita bekerjasama berubah menjadi hasil serta-merta. Lihatlah, saya fikir ia adalah hebat untuk mendengar apa yang anda katakan setakat ini dan saya benar-benar berharap untuk melihat di mana ia pergi. Dan saya tahu kami mempunyai banyak soalan dalam Q & A, jadi saya akan kembali kepada Rebecca untuk meneruskan beberapa perkara supaya kami boleh mendapatkannya secepat mungkin. Terima kasih banyak - banyak.

Rebecca Jozwiak: Terima kasih Dez, dan ya Dave, kami mempunyai beberapa soalan dari penonton. Dan terima kasih Dez dan Robin untuk pandangan anda juga. Saya tahu peserta ini terpaksa turun dari puncak jam, tetapi dia semacam bertanya, adakah anda melihat jabatan-jabatan sistem maklumat seperti meletakkan lebih banyak keutamaan pada kawalan data canggih daripada jenis yang selesa dalam menyediakan alat untuk pekerja pengetahuan? Maksud saya, adakah itu - teruskan.

David Sweenor: Ya, saya fikir ia bergantung kepada organisasi. Saya fikir bank, sebuah syarikat insurans, mungkin mereka mempunyai keutamaan yang berbeza dan cara melakukan sesuatu, berbanding organisasi pemasaran. Saya rasa saya perlu mengatakan ia bergantung kepada industri dan fungsi yang anda cari. Industri yang berbeza mempunyai tumpuan dan penekanan yang berbeza.

Rebecca Jozwiak: Baiklah, ini masuk akal. Dan kemudian seorang lagi yang ingin tahu, apakah enjin di sebalik Statistica? Adakah itu C ++ atau barangan anda sendiri?

David Sweenor: Saya tidak tahu sama ada saya boleh mendapatkan spesifik dengannya kerana ini telah wujud selama 30 tahun dan ia telah dimajukan sebelum masa saya tetapi terdapat perpustakaan teras algoritma analisis yang merupakan algoritma Statistica yang dijalankan. Dan anda lihat di sini bahawa kita juga boleh menjalankan R, kita boleh menjalankan Python, kita boleh pecah ke Azure, kita boleh berjalan di Spark di H2O, jadi saya rasa saya perlu menjawab soalan itu dari segi, ia adalah pelbagai enjin. Dan bergantung kepada algoritma yang anda pilih, jika ia adalah Statistica, ia berjalan seperti ini, jika anda memilih satu di H2O dan Spark, ia menggunakannya, dan oleh itu ia pelbagai.

Rebecca Jozwiak: Baiklah. Jenis lain yang hadir bertanya secara khusus menunjuk kepada slaid ini, ingin tahu, jenis, bagaimana saintis data warganegara mengetahui template yang boleh diguna semula untuk digunakan? Dan saya rasa saya akan membuat persoalan yang lebih luas daripada itu. Itu, apa yang anda lihat apabila pengguna perniagaan atau penganalisis perniagaan datang dan mereka mahu menggunakan alat ini, betapa mudahnya mereka mengambil dan terus berjalan?

David Sweenor: Saya rasa saya akan menjawabnya dan jika anda boleh menggunakannya, jika anda biasa dengan Windows, ini adalah platform berasaskan Windows, jadi saya memotong bahagian atas tangkapan skrin ini, tetapi ia mempunyai pita Windows. Tetapi bagaimana mereka tahu aliran kerja apa yang hendak digunakan? Ia kelihatan seperti Windows Explorer, jadi ada struktur pokok dan anda boleh mengkonfigurasi dan menetapkannya tetapi organisasi anda mahu menyiapkannya. Tetapi mungkin, anda hanya akan mempunyai folder ini dan anda akan meletakkan templat ini boleh diguna semula dalam folder ini. Dan saya fikir ada kemungkinan nama tatanama syarikat anda boleh mengamalkan, katakan di sini adalah "mengira profil risiko, " di sini adalah "mendapatkan data dari sumber-sumber ini" dan anda menamakan mereka apa sahaja yang anda mahukan. Ia hanya folder percuma, anda hanya menyeret nota ke kanvas anda. Jadi, cukup mudah.

Rebecca Jozwiak: Baiklah. Mungkin demo masa depan. Kemudian, ada juga yang hadir, dan ini adalah apa yang anda dan Robin dan Dez sedang bercakap mengenai ketidaktepatan, terutamanya pada spreadsheet, tetapi sampah dalam / sampah, dan dia melihatnya sebagai lebih kritikal apabila ia datang untuk analisis. Jenis menyebutkan bahawa, anda tahu, penyalahgunaan data benar-benar boleh membawa kepada beberapa keputusan malang. Dan dia tertanya-tanya apa pandangan anda tentang perkembangan algoritma yang lebih failsafe, saya rasa untuk itu, dia menggunakan perkataan, "analitik" penggunaan analitik. Anda tahu, ada orang yang masuk, mereka benar-benar teruja, mereka mahu melakukan analitik lanjutan ini, mereka mahu menjalankan algoritma canggih ini, tetapi mungkin mereka tidak pasti. Jadi apa yang anda lakukan untuk menjaga keselamatan terhadapnya?

David Sweenor: Ya, jadi saya rasa saya akan menjawab ini dengan sebaik mungkin, tetapi saya fikir semuanya turun kepada orang, proses dan teknologi. Kami mempunyai teknologi yang membantu membolehkan orang ramai dan membantu membolehkan apa sahaja proses yang anda mahu dimasukkan ke dalam organisasi anda. Dalam contoh menghantar kupon kepada seseorang, mungkin itu tidak begitu kritikal, dan jika digital itu benar-benar tiada kos, mungkin terdapat satu tahap kawalan keselamatan dan mungkin kita tidak peduli. Jika saya meramalkan jangkitan laman pembedahan, mungkin saya ingin menjadi lebih berhati-hati mengenai perkara itu. Atau jika saya meramalkan kualiti dadah dan keselamatan dan perkara-perkara seperti itu, mungkin saya ingin menjadi lebih berhati-hati mengenai perkara itu. Anda betul, sampah dalam / sampah, jadi apa yang kami cuba lakukan adalah menyediakan platform yang membolehkan anda menyesuaikannya dengan apa cara proses organisasi anda mahu mengadopsi.

Rebecca Jozwiak: Baiklah. Saya mempunyai beberapa soalan lagi, tetapi saya tahu kita sudah agak melewati sejam dan saya hanya ingin memberitahu penyampai kita, itu hebat. Dan kami ingin berterima kasih kepada Dave Sweenor dari Dell Statistica. Sudah tentu, Dr Robin Bloor dan Dez Blanchfield, terima kasih kerana menjadi penganalisis hari ini. Kami akan mempunyai webcast lain bulan depan dengan Dell Statistica. Saya tahu jenis Dave membayangkan mengenai topik itu. Ini akan menjadi mengenai analisis di pinggir, satu lagi topik yang menarik, dan saya tahu bahawa beberapa kes penggunaan yang sangat menarik akan dibincangkan di webcast itu. Jika anda menyukai apa yang anda lihat hari ini, kembali lagi bulan depan. Dan dengan itu, saya mengucapkan selamat tinggal kepada anda. Terima kasih banyak-banyak. Selamat tinggal.

Menyematkan analisis di mana-mana: membolehkan saintis data warganegara