現(xiàn)在位置:主頁 > 科技 > 從語音識別的角度扒一扒,為什么訊飛翻譯機譯得更準

從語音識別的角度扒一扒,為什么訊飛翻譯機譯得更準

作者:編輯 ? 時間:2019-12-02 ? 瀏覽:人次

  如今人工智能的發(fā)展過程,就如同我們求學(xué)的過程:不停地努力學(xué)習(xí),不停地擴充知識,不停地刷新成績。

  當成績刷到語言這一關(guān),翻譯機出現(xiàn)了。而且為了幫人類越過語言障礙這條“溝”,翻譯機做了許多努力,才最終行的“通”。

  “聽得清才能譯得準?!?/strong>

  對于翻譯機而言,這句話不光是一句廣告詞,更說出了翻譯機的本質(zhì)。

云圖片

  想要翻譯機譯的準,首先需要的就是對你說的話有一個準確的識別。就像如果要正確的回答問題,就一定要先聽清、聽懂問題。如果連你說的話識別出來都是錯的,那還談何翻譯的準呢?

  所以翻譯機工作的第一步,就是從聽懂你說話開始。

  訊飛翻譯機依托訊飛語音識別技術(shù),應(yīng)用強大的神經(jīng)網(wǎng)絡(luò)模型,中文語音識別準確率超過98%,并且支持5種漢語方言識別,2016和2018連續(xù)兩屆包攬CHiME語音識別大賽冠軍。

  所以今天我們就來扒一扒,有科大訊飛語音識別技術(shù)傍身的訊飛翻譯機,到底為什么能譯的更準。

云圖片

  1、

  記得上學(xué)那會兒,老師洋洋灑灑講完一個知識點,總喜歡最后接一句“都聽懂了沒有?”

  臺下的學(xué)生七零八落的點著頭,但也不知道有多少人只是因為聽見了老師說的每個字而點頭,又有多少人是因為真正聽懂了每句話的含義而點頭。

  市面上的翻譯機,其實就像是一個班里水平層次不齊的學(xué)生。老師教學(xué)方式是相同的,但有人資質(zhì)平平,勉強及格,對外界信息需要一定時間消化才能反饋(或者不能);而有的人學(xué)習(xí)能力強、成績優(yōu)秀,對外界的信息能迅速做出準確的反應(yīng)。

  翻譯機在開始的語音識別階段,從收到聲音到轉(zhuǎn)換成對應(yīng)的文字,過程都是相同的:接收聲音信號-提取聲音特征-綜合聲學(xué)模型和語言模型-解碼形成文字。

  難就難在如何把你說的話能夠意思分毫不差、一字不差的識別出來。這也就是不同品牌的翻譯機從一開始拉開差距的地方。

  為什么說識別的一字不差很難呢?

  如果在安靜的環(huán)境下說著語法、發(fā)音都標準的普通話,機器可以很容易準確識別,而一旦夾雜了多音字、方言口音,或者說話環(huán)境嘈雜、有回音等聲音干擾,機器的識別過程就沒那么輕松了。

云圖片

  在收到了有特征的聲紋信息后,機器會通過聲學(xué)模型組成單詞或拼音,再通過語言模型來讓識別結(jié)果變得更準確。

  這其中,語言模型是非常重要的,它通過訓(xùn)練大量文本語料、學(xué)習(xí)詞與詞之間的相互關(guān)系,來估計你所說的話對應(yīng)的每個字的可能性,并利用語言本身的統(tǒng)計規(guī)律來幫助提升識別正確率。如果還了解特定領(lǐng)域或任務(wù)相關(guān)的先驗知識,語言模型可以識別的更準確。但如果不使用語言模型,機器面對大量的聲音信息,識別出的結(jié)果則會是一團亂麻。

  所以說,機器也和人一樣,越學(xué)習(xí)、越優(yōu)秀。但不是所有翻譯機都能有足夠的學(xué)習(xí)資源,而訊飛翻譯機恰巧就是“飽讀詩書”的那一個。

  2、

  眾所周知,科大訊飛深耕人工智能技術(shù),為醫(yī)療、教育、家庭、城市等智能化建設(shè)作出了相當?shù)某删?,也因此,訊飛擁有了千萬級各行業(yè)平行領(lǐng)域數(shù)據(jù)的支撐,也因此為語言模型帶來了豐富的學(xué)習(xí)文本。

  隨著對各行業(yè)學(xué)習(xí)的不斷深入,基于大量垂直領(lǐng)域語料,不斷對特定垂直領(lǐng)域的語音聽寫模型進行訓(xùn)練,這樣一來,機器不僅能聽懂日常口語,連那些專業(yè)術(shù)語也能聽懂了。

  這就是訊飛翻譯機行業(yè)翻譯官工作的基礎(chǔ)——先聽清楚你在說什么,再為你翻譯出專業(yè)的結(jié)果。

  打開訊飛翻譯機,我們能看到醫(yī)療、金融、外貿(mào)、法律、體育、能源、計算機、電力八大行業(yè)翻譯官。行業(yè)翻譯功能的到來,也就意味著訊飛翻譯機相較于其他翻譯機,對你說話含義的理解又更深入了一步。

云圖片

  3、

  另一個影響翻譯機識別能力的關(guān)鍵,是翻譯機的耳朵——麥克風(fēng)。

  回想一下,當我們和別人說話時,面對著對方和背對著對方,聽到的清楚程度是有區(qū)別的。

  麥克風(fēng)作為翻譯機的耳朵,如果想要各個方向都聽的清楚,獲得較好音質(zhì)的音頻,就需要360度無死角、多帶幾個麥克風(fēng)在身上。

  所以,訊飛翻譯機采用四麥克風(fēng)陣列,利用陣列方位信息進行噪聲抑制,將陣列原始信號與深度學(xué)習(xí)結(jié)合,加強識別模型訓(xùn)練,以便讓翻譯機聽得更清楚,從而提高翻譯機在嘈雜環(huán)境、聲音源過遠等情況下的語音識別準確率。

云圖片

  4、

  了解訊飛的人都知道,方言識別是訊飛語音識別技術(shù)中的一大特色。從最開始的維吾爾族語和藏語與中文普通話互譯在新疆、西藏等少數(shù)民族地區(qū)建設(shè)上的應(yīng)用,到現(xiàn)在翻譯機支持粵語、東北話、河南話、四川話、五種英文口音、一種法語口音及一種孟加拉語口音,方言口音識別的應(yīng)用越來越為大眾所用。

  這離不開訊飛在聲學(xué)模型層面針對不同地區(qū)人的口音、發(fā)音方式的優(yōu)化,使聲學(xué)模型更加個性化且具有差異化。

  有了方言口音識別能力的加持,就算你只會說方言,訊飛翻譯機也能聽懂;就算你和一個印度口音濃重的人交流,訊飛翻譯機也能給你一個準確的翻譯結(jié)果。

云圖片

  對我們消費者而言,選擇翻譯機時最關(guān)心的就是看它翻譯的準不準,通過翻譯結(jié)果來判斷翻譯機的好壞雖不失為一個最直觀的方法,但如果想從本質(zhì)上判斷它的性價比,不妨從翻譯機工作的源頭——語音識別這一環(huán)節(jié)開始對比。


轉(zhuǎn)載請保留原文鏈接:http://www.eatcooks.com/a/keji/2019/1202/37915.html上一篇:上一篇:外貿(mào)人的雙十二怎么過?沒有比買訊飛翻譯機更劃算的事了
下一篇:下一篇:沒有了