4月22日-24日,首屆數(shù)字中國建設(shè)峰會在福州舉行。隨著會議的進行和企業(yè)最新成果的發(fā)布,記者發(fā)現(xiàn)在大屏幕上會不斷呈現(xiàn)出發(fā)言內(nèi)容的中英雙語字幕,隨著發(fā)言內(nèi)容的逐漸完整,屏幕上顯示的字幕也會根據(jù)語境自動完善。
據(jù)工作人員介紹,在現(xiàn)場擔任機器同傳工作的“機器人”來自搜狗公司,通過機器同傳,嘉賓演講內(nèi)容可以實時以中英文字幕顯示在屏幕上。它能讓參會者無需佩戴同傳耳機,而是通過字幕就能直觀的接收有效信息。并且“機器人”可以識別方言,降低由于普通話不標準而導(dǎo)致的分享內(nèi)容的折損,讓參會人員最大限度的理解發(fā)言內(nèi)容。
搜狗AI事業(yè)部總經(jīng)理張博告訴經(jīng)濟日報-中國經(jīng)濟網(wǎng)記者,2011年,搜狗開始研究語音識別技術(shù),至今已有7年,搜狗采取“雙引擎”戰(zhàn)略,不斷加大人工智能技術(shù)、產(chǎn)品和服務(wù)的研發(fā)投入。
全球首家商用機器同傳系統(tǒng)
據(jù)了解,2016年11月,搜狗的機器同傳在第三屆世界互聯(lián)網(wǎng)大會“移動互聯(lián)網(wǎng)論壇”亮相,成為全球首個商用機器同傳。
從首次亮相開始,搜狗同傳不斷升級。張博表示,在產(chǎn)品化的過程中,為了達到實時的效果,搜狗在速度和精度上做了很多嘗試,比如使用了GRU作為搜狗同傳的神經(jīng)元結(jié)構(gòu),使其可以在性能保持不變的前提下,降低運算復(fù)雜度,在層數(shù)和參數(shù)量上也做了一定的精簡。在提升翻譯效果方面,針對實體詞、集外詞、對齊效果的處理上也做了很多研發(fā)工作。目前,搜狗同傳語音識別的準確率可以達到97%,支持最快400字每分的高速聽寫,翻譯的準確率可以達到90%。方便了參會者更好地理解發(fā)布者所講述的內(nèi)容。
先進的神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)
張博介紹,搜狗還支持語音實時翻譯技術(shù)SNMT(Sogou Neural Machine Translation),即搜狗同傳翻譯系統(tǒng),集成了語音識別、機器翻譯、語音合成等先進技術(shù),運行同傳翻譯時,屏幕上會實時顯示出語音識別出的中文或英文,同時也會實時翻譯成對應(yīng)的英文或中文,此外,還可實現(xiàn)男、女聲或某特定個人的聲音輸出翻譯后的語言。
目前,市面上一些機器同傳系統(tǒng)在實際操作中會出現(xiàn)大面積單詞無意義重復(fù)、大小寫及字符混亂、中英夾雜翻譯混亂、帶口音普通話無法識別等現(xiàn)象!八压纷鳛槿蚴准疑逃脵C器同傳,兩年多的時間里已經(jīng)積累了無數(shù)場同傳的實戰(zhàn)經(jīng)驗,通過技術(shù)創(chuàng)新基本上克服了以上出現(xiàn)的所有問題,為機器同傳技術(shù)的大規(guī)模商用做了有益探索!睆埐⿲(jīng)濟日報-中國經(jīng)濟網(wǎng)記者表示。 (經(jīng)濟日報-中國經(jīng)濟網(wǎng)記者王婉瑩)
(責任編輯:王惠綿)