歡迎來體驗
什么是最懂你的中文語音識別算法

華少的快,矮大緊的京范兒口音,神仙打架的《奇葩說》,這些復雜場景的語音識別有多難?今天依圖帶你領略新鮮出爐的語音識別算法實力。

今天開始,依(zei)圖(hao)語音開放平臺上線了!

 

業內首次
系統測試主流語音識別廠商的技術性能


(測試完成于2018年11月底)

在全球最大中文普通話數據庫AISHELL-2的三個測試子集、Accent近場口音測試集、Chat近場安靜聊天測試集上,依圖語音識別算法最近測得多項第一。AISHELL-2數據規模達1000小時,是目前全球最大的中文開源數據庫。在AISHELL2-2018A-EVAL數據集中,依圖語音識別準確率達到96.29%,字錯率(CER)為3.71%,領先第二名約17%。

無論是語音助手還是節目,電話客服或是閑聊,依圖更懂你。

 

依圖語音識別性能優于第二名約17%
語音未來任重道遠

通過手機近距離收集聲音,依圖優于第二名約17%,字字再現強時效內容

語速超快又有地方口音?依圖和訊飛挺下來了

考驗系統是不是夠“皮實”、夠“穩健”的時候到了!在遠距離場景,環境中會存在噪聲、混響和反射,依圖和訊飛聽見優勢明顯

從技術性能來說,字錯率曲線抖動越小,算法的場景通用性越好。綜合各場景測試的結果,業界主流算法中,依圖和訊飛的算法字錯率抖動相對較小。

但是同樣說明了語音識別的發展既有驚喜也有遺憾。各大廠商的近場場景識別能力讓我們感受到了科技的力量,而加入遠場演講的高難度場景的識別能力不足,也表明了未來的路還很遠。

 

花式挑戰算法性能
依圖表現穩定

聽寫大會小程序一經發布,各種評(tiao)測(xi)洶涌而來。依圖語音憑借自身優秀的技術,展現了極其穩定的語音識別能力。

再熱血的足球解說我們hold住

繞口令?依圖能聽清!

語音識別歌詞,依圖可帶勁啦!

 

呂昊博士現場演示的這款“聽寫大會”小程序也是業界第一次基于公開 API 將市場上的主流語音識別技術性能做比較——歡迎大家去花式調戲!


 

 

此次測試的安靜對話和混響的數據集,依圖也將在線公布,敬請期待!

您可以復制這個鏈接分享給其他人:http://www.jisvip.com/node/539