閱讀 | 訂閱
閱讀 | 訂閱
電子加工新聞

語音識別是移動互聯網的下個突破亮點

fun88网页下载 來源:鈦媒體(ti) 2013-09-10 我要評論(0 )   

這幾天,可穿戴設備突然一下熱起來了,國內(nei) 廠商一口氣發布了好幾款智能手表,有映趣科技的inWatch,土曼科技的TWatch、盛大果殼電子的GeakWatch等,當然,最重頭的還是...

       這幾天,可穿戴設備突然一下熱起來了,國內(nei) 廠商一口氣發布了好幾款智能手表,有映趣科技的inWatch,土曼科技的TWatch、盛大果殼電子的GeakWatch等,當然,最重頭的還是三星在德國舉(ju) 行的發布會(hui) 上,發布了智能手表Galexy Gear。

      智能手表不是新發明的,有很多早就在市麵上流行的產(chan) 品,如索尼的SmatWatch等,就連做芯片的高通也發布了一款智能手表。大家早就看出,這裏麵是有前景的,是未來的一大趨勢,隻是如果巨頭不出手,這個(ge) 市場就很難被激活。

       智能手表到底是用來做什麽(me) 的?在當前技術條件下,還隻能發短信,拍個(ge) 照,記錄筆記,充當健身輔助設備,在手機的支持下實現通話等,或許未來還可以在NFC的支持下完成近場支付等功能。智能手表的未來,一定不是滿足用戶的娛樂(le) 需求,而是著眼於(yu) 普通人日常生活領域的諸多實際需求,這是由其自身特點所決(jue) 定的。但我更關(guan) 心的是,智能手表靠什麽(me) 輸入文字,傳(chuan) 送信息。

       智能手表屏幕較小,使用額外的S-pen一類的輔助工具也並不現實,在當前條件下看,唯有依靠語音輸入了。語音輸入看上去是個(ge) 不大的基礎應用,實現起來卻需要非常複雜的技術能力,已經涉及到人工智能AI的範疇,而且這個(ge) 技術已經進化了幾十年,似乎還沒得以大規模商用,可見其開發難度。

        13年前我曾買(mai) 過一張IBM的Viavoice光盤,裝到電腦上後對著電腦練了一下午,希望其能快速熟悉我的個(ge) 人口音,哪怕能有90%的識別率,也能為(wei) 我繁重的文案工作減輕不少負擔。這次試驗最終還是失敗了,卻並不令人沮喪(sang) ,至少領略了世界前沿的語音識別技術,理解到識別自然語言對於(yu) 計算機而言有多麽(me) 難了。在當時,Viavoice是世界最尖端的語音識別技術。

        Gear中內(nei) 置了三星自己的S-Voice,另外也和百度合作,將百度語音助手預裝了進去。看來百度與(yu) 三星的關(guan) 係相當不一般,前有百度雲(yun) ,後有語音助手,對看重安卓更甚ioses的百度,支持力度相當大。不過,還是有理由相信,百度語音助手的技術實力已達到三星所期望的程度,預裝其語音產(chan) 品,可以給智能手表帶來更好的用戶體(ti) 驗。語音有可能是智能手表的唯一輸入方式,在這方麵無法做到準確,易用,快捷,是很難讓用戶買(mai) 單的,會(hui) 成為(wei) 其發展瓶頸。


       在周日的下午下載了百度語音助手,進行了一番測試。我發現,普通話方麵的語音識別準確率,已經到了令人驚喜的地步。除了一些停頓和轉折,機器在識別上仍有一定困難外,基礎字詞很少會(hui) 出現錯誤,隻要對自己的普通話有一定自信,基本都能做到99%以上的識別率。

       之後我還對百度語音助手進行了上海話和英文的測試,發現效果並不理想,用上海話說了一串上海市井小吃的名字,基本無法識別,但在將上海的區縣名稱挨個(ge) 念出來後,發現還是有一定的識別率。至於(yu) 英文,則是基本無法識別。看來,這一版語音助手,仍是以普通話識別為(wei) 基礎的,還沒有考慮到更多需求。


        我不知道這是否代表中文普通話語音識別的最高水平了,其他一些語音識別工具,如搜狗和科大訊飛等產(chan) 品,是不是也能做到差不多的識別效果。這一次的測試,與(yu) 13年前的那次從(cong) 感覺上完全不一樣。Viavoice是一種學習(xi) 型的語音識別軟件,你需要適時地對識別結果進行調整,以方便機器下一次識別,積累下來的識別數據要妥善保護,要是因為(wei) 一次重裝係統而導致丟(diu) 失的話,一切都得重來。從(cong) 商用角度來看,這還做不到多好的商用體(ti) 驗,而如今的語音識別技術,從(cong) 體(ti) 驗上明顯已能讓人看到曙光。

       甚至可以認為(wei) ,隻有在語音識別技術取得革命性突破之後,可穿戴設備真正的爆發之日才會(hui) 到來。設想你可以與(yu) 智能手表和眼鏡實現人機對話,戴著眼鏡時不必再傻傻地說句OK
 

      Glass才能開啟攝像,隻需用生活中最自然的語言即可完成指令發送,之後再由機器將任務完成情況用語音反饋給你,到那時,屏幕的作用將弱化,移動互聯網的新入口將誕生。

       過去一年,百度在矽穀建立了IDL實驗室,進行深度學習(xi) 方麵的研究,在利用軟硬件模擬人腦方麵試圖獲得更多成果。而這些工作,在過去印象中總是由IBM,貝爾實驗室等大機構所做的,出了能商用的成果,大家去買(mai) 授權好了,像百度這樣的廣告公司也來搞這個(ge) ,著實令人感慨萬(wan) 分。

       不過,這些耗費甚巨卻見不到短期產(chan) 出的基礎研究項目,使得百度在語音識別技術方麵有了相當不錯的進步,還沒有達到商用化的地步,最起碼也已可以進行積極布局,積累用戶了。

       未來隨著手持設備的小型化,甚至穿戴化,各種智能眼鏡,手表等層出不窮,誰能在語音輸入方麵取得領先優(you) 勢,誰就能掌握了用戶的一個(ge) 基礎需求,誰也就能在這個(ge) 由鼠標鍵盤、觸屏和語音所組成的互聯網世界裏,占據一個(ge) 重要入口。

轉載請注明出處。

免責聲明

① 凡本網未注明其他出處的作品,版權均屬於(yu) fun88网页下载,未經本網授權不得轉載、摘編或利用其它方式使用。獲本網授權使用作品的,應在授權範圍內(nei) 使 用,並注明"來源:fun88网页下载”。違反上述聲明者,本網將追究其相關(guan) 責任。
② 凡本網注明其他來源的作品及圖片,均轉載自其它媒體(ti) ,轉載目的在於(yu) 傳(chuan) 遞更多信息,並不代表本媒讚同其觀點和對其真實性負責,版權歸原作者所有,如有侵權請聯係我們(men) 刪除。
③ 任何單位或個(ge) 人認為(wei) 本網內(nei) 容可能涉嫌侵犯其合法權益,請及時向本網提出書(shu) 麵權利通知,並提供身份證明、權屬證明、具體(ti) 鏈接(URL)及詳細侵權情況證明。本網在收到上述法律文件後,將會(hui) 依法盡快移除相關(guan) 涉嫌侵權的內(nei) 容。

網友點評
0相關評論
精彩導讀