Rumah Perisian Teknologi pengenalan suara: membantu atau menyakitkan?

Teknologi pengenalan suara: membantu atau menyakitkan?

Isi kandungan:

Anonim

Pernahkah anda memanggil syarikat untuk mendapatkan bantuan atau membayar bil anda, hanya untuk disambut dengan suara rekod yang menyenangkan yang ingin mempunyai perbualan dengan anda - tetapi tidak dapat memahami separuh daripada apa yang anda katakan? Atau mungkin anda memiliki iPhone, dan sementara Siri pertama kelihatan seperti sekutu yang baik, anda telah menyedari bahawa kadang-kadang (OK, mari kita jujur, kerap) dia hanya tidak mendapatnya? Teknologi pengenalan suara (VRT), juga dikenali sebagai ucapan-teks, jatuh ke dalam perangkap umum: ia mempunyai potensi untuk menjadi sangat sejuk (dan anak lelaki, kita mengakarinya), tetapi lebih kerap, ia adalah penggilingan gigi senaman dalam kekecewaan.


Sebaik sahaja idea yang dimiliki dalam bidang fiksyen sains, pengiktirafan suara telah berkembang sejak awal tahun 1950-an, ketika sistem Bell Laboratories Audrey direka untuk mengenali digit yang diucapkan dalam satu suara, ke rangkaian elektronik perbualan moden yang kini kita berinteraksi dengan setiap hari - dengan hasil yang bercampur-campur.

Untuk Berbincang dengan Manusia, Sila Tekan 0

Banyak perniagaan hari ini kini menggunakan sistem yang dipanggil sambutan suara interaktif (IVR) untuk mengendalikan panggilan perkhidmatan pelanggan. Penggunaan yang paling umum adalah untuk menu navigasi suara, tetapi sesetengah syarikat menggunakan sistem IVR yang boleh mengakses maklumat akaun pelanggan dan menjawab soalan-soalan kecil. Perisian IVR Menu biasanya mempunyai perbendaharaan kata yang terhad, yang mungkin terhad kepada "ya, " "tidak" dan nombor. Sistem yang lebih rumit dapat mengenali kata-kata dan frasa khusus syarikat.


Sistem-sistem ini menjadi lebih popular - sekurang-kurangnya untuk perniagaan - untuk alasan yang mudah: mereka kos efektif. Menurut laporan 2010 oleh Wall Street Journal, panggilan pelanggan tipikal yang mencapai kos ejen antara $ 3 dan $ 9, sementara panggilan yang ditangani melalui sistem automatik hanya berharga lima hingga tujuh sen. Dan sudah tentu, program komputer tidak menjadi letih, panggil sakit, atau kecewa dengan pelanggan (walaupun pelanggan pastinya kecewa dengan mereka!).


Mujurlah, ini tidak bermakna IVR mengambil pekerjaan jauh dari orang - atau sekurang-kurangnya semua orang hilang dari pusat panggilan. Pembantu suara yang diaktifkan ini membolehkan wakil perkhidmatan pelanggan manusia menjadi lebih produktif dengan mengarahkan panggilan dan menjawab soalan mudah.


Sudah tentu bagi pengguna manusia yang berinteraksi dengan teknologi ini, ia tidak selalunya berjalan lancar. Teknologi membantu memperbaiki masalah umum dalam teknologi IVR, seperti masalah dengan aksen, tetapi memecat sistem automatik masih tema umum dalam talian. Lihat skit komedi ini mengenai lif yang dilengkapi dengan pengiktirafan suara, yang menyoroti kekecewaan yang tidak berfungsi dalam sistem IVR.

Apl Telefon Peribadi: Siri, Google Now

Kebanyakan orang biasa mengenali pengenalan suara untuk telefon pintar. Walaupun majoriti model telefon terbaharu datang dengan VR, populariti mereka - dan ketenaran - membengkak apabila Apple memperkenalkan Siri, "pembantu peribadi" yang lembut dan bersemangat, untuk iPhone 4S pada tahun 2011. Google tidak lama lagi mencipta pesaing langsung: Google Sekarang untuk Android Jelly Bean OS. Kedua-dua sistem mempunyai suara wanita dan ciri pengiktirafan canggih yang membolehkan pengguna "bercakap" dengan telefon mereka menggunakan bahasa kasual.


Tetapi sementara sistem-sistem ini jauh lebih canggih dan berfungsi daripada pendahulunya, mereka juga menunjukkan bahawa teknologi masih jauh. Jenaka tentang kegagalan Siri telah menjadi meme Internet popular. Seorang lelaki juga menyaman Apple untuk pengiklanan palsu mengenai keupayaan Siri.


Mungkin itulah sebabnya ketika Apple mencipta Siri untuk maju dan bermaklumat, perisian VR juga sedikit di sisi sassy. Sebagai contoh, jika anda bercakap dalam salah satu daripada rangkaian teknologi perisikan yang paling terkenal dalam sejarah wayang dari filem 1968 "2001: A Space Odyssey" - "membuka pintu pod bay" - Siri akan bertindak balas dengan sama ada saluran menjawab dari filem, " Saya minta maaf (nama anda), saya takut saya tidak boleh berbuat demikian, "atau lebih sarkastik, " kami ejen-ejen perisikan tidak akan hidup itu, nampaknya. "


Memanggil anda dengan nama adalah salah satu fungsi yang cuba menjadikan Siri mudah untuk dicintai, dan sedikit lebih manusia. Pembantu VR boleh mengikuti arahan suara untuk membuat panggilan, mengambil keputusan dan menghantar teks, melakukan carian Internet untuk mendapatkan maklumat, mencari kedai berdekatan, memberi arahan memandu dan banyak lagi, tanpa perlu menyentuh apa-apa. Jawapan pada masa yang sama dituturkan oleh telefon dan dipaparkan pada skrin.


Google Now, bahagian VR platform Android Jelly Bean, sangat mirip dengan Siri. Sistem ini menawarkan keupayaan pengiktirafan yang sama dengan menerjemahkan ucapan kasual ke dalam perintah yang membolehkan pengguna membuat panggilan, menghantar teks, menjalankan carian, melakukan pengiraan dan penukaran, merebut definisi perkataan, menetapkan penggera, memainkan lagu, dan mendapatkan peta dan arah.


Dengan pembantu suara peribadi seperti Siri dan Google Now, faedahnya jelas. Segala-galanya dari memanggil dan menghantar mesej untuk mencari dan hiburan lebih pantas dan lebih mudah. Cuma katakan apa yang anda mahu, dan (kebanyakan masa) aplikasi VR merebutnya untuk anda. Teknologi tangan VR sangat berguna semasa memandu. Dan sementara ramai orang telah mencuba kecacatan Siri, dan penulis telah berpendapat bahawa keupayaan Google Now untuk menjalankan kehidupan pengguna secara asasnya menyeramkan sedikit, kebanyakan orang masih merasakan teknologi futuristik ini sangat keren.


Sudah tentu, aplikasi telefon peribadi seperti Siri dan Google Now jauh dari sempurna - walaupun mereka menunjukkan di mana teknologi ini boleh diketuai pada masa hadapan. Ini bermakna bahawa walaupun Siri bertukar jawapan yang salah, kita mungkin ketawa dan memaafkannya, mengetahui bahawa versi seterusnya akan menjadi lebih baik.

Di mana VR Falls Flat

Jika anda pernah mengalami IVR apabila anda telah memanggil perniagaan, anda mungkin telah melihat halangan tertentu untuk komunikasi. Sesetengah program menggunakan suara teks-ke-ucapan robot yang menyalahi perkataan dan membuat perkara sukar difahami. Orang lain mempunyai masalah kepekaan yang menyebabkan perisian tidak dapat memproses apa yang anda katakan jika anda terlalu kuat, terlalu lembut, atau tidak mengutip dengan teliti.


Di samping itu, ramai yang masih tidak berasa selesa bercakap dengan mesin. Jika anda menjalankan beberapa carian pada IVR, anda akan menemui senarai orang yang telah mengumpulkan cara untuk memintas sistem IVR dan masuk ke "orang sebenar." Penyelesaian ini terdiri daripada "terus menekan 0 untuk pengendali" untuk "bersumpah di mesin sehingga ia menjangkau manusia." Akibatnya, banyak perkembangan terkini dalam sistem IVR telah memburukkan lagi menjadikan mereka lebih sesuai untuk manusia; membuat suara lebih bersimpati dan kurang robot, menjadikan sistem lebih mudah untuk menavigasi, dan membolehkan pemanggil mengetahui berapa lama segala-galanya akan diambil dari awal hingga akhir. Itu menunjukkan teknologi yang lebih baik hanya separuh pertempuran di sini; separuh lagi mendapatkan pengguna di atas kapal dengan bercakap dengan mesin.

Apa Masa Depan Yang Dipegang

Walaupun menghadapi cabaran ini, teknologi pengenalan suara semakin baik sepanjang masa. Aplikasi seperti Siri dan Google Now - kecacatan dan semua - masih sangat mengagumkan dalam prestasi mereka, dan beberapa syarikat mengembangkan keupayaan VR ke aplikasi lain.


Sebagai contoh, Nuansa, pencipta perisian ucapan teks Teks NaturallySpeaking, telah membangunkan kawalan suara untuk televisyen dan kereta, dan versi teknologi ini dimasukkan ke dalam beberapa TV Samsung dan sistem hiburan SYNC yang digunakan dalam kenderaan Ford tertentu.


Dan kerana Google dan Apple terus mencari kegunaan baru untuk teknologi pengenalan suara mereka, kemungkinan besar kami akan semakin bercakap dengan pelbagai jenis mesin sehari-hari, dari televisyen kami kepada pembakar kami. Dan, sekali lagi, ia kelihatan seperti fiksyen sains yang betul. Kita hanya perlu berharap penulis-penulis pandai itu salah mengenai satu perkara. Sekiranya mesin-mesin ini mengambil alih, anda mungkin akan menghadapi banyak masalah pada masa akan datang apabila anda bertanya kepada Siri untuk "membuka pintu pod."

Teknologi pengenalan suara: membantu atau menyakitkan?