你聽不懂我的言語(yǔ)?SkypeTranslator現(xiàn)場(chǎng)翻譯

2015-04-14 10:08 來(lái)源:電子信息網(wǎng)綜合 作者:龍貓傘

隨著交通的越來(lái)越便利,人們能踏足的地方也越來(lái)越遠(yuǎn),但五花八門的語(yǔ)言使人們望而卻步。然而幾天之前微軟旗下的Skype宣布,具備實(shí)時(shí)語(yǔ)音翻譯技術(shù)的翻譯器SkypeTranslator中文預(yù)覽版正式在中國(guó)市場(chǎng)推出。使問(wèn)題慢慢得到了解決。

作為一項(xiàng)長(zhǎng)久愿望,在此前數(shù)十年時(shí)間,語(yǔ)音實(shí)時(shí)翻譯的發(fā)展一直受到錯(cuò)誤率高,麥克風(fēng)敏感度差異,噪音環(huán)境等因素阻礙。但近些年來(lái),由于大數(shù)據(jù)的涌現(xiàn),這項(xiàng)技術(shù)取得了不錯(cuò)的進(jìn)展。而SkypeTranslator更是凝聚了微軟在語(yǔ)音識(shí)別,自動(dòng)翻譯和機(jī)器學(xué)習(xí)等多領(lǐng)域的成果。

簡(jiǎn)單地說(shuō),SkypeTranslator的翻譯邏輯主要分為三步:將你的實(shí)時(shí)語(yǔ)音轉(zhuǎn)成文字;將文字翻譯成另一種語(yǔ)言的文字;將文字轉(zhuǎn)成語(yǔ)音。其中,識(shí)別實(shí)時(shí)語(yǔ)音并轉(zhuǎn)成文字是最棘手的部分。

如你所知,精確的實(shí)時(shí)語(yǔ)音翻譯有賴于強(qiáng)大的機(jī)器學(xué)習(xí)——也就是軟件學(xué)習(xí)訓(xùn)練數(shù)據(jù)的能力。這些訓(xùn)練數(shù)據(jù)包括翻譯的網(wǎng)頁(yè),配有字幕的視頻,以及預(yù)先翻譯且轉(zhuǎn)錄成文字的一對(duì)一談話。事實(shí)上,已有不少人分享了他們過(guò)去的對(duì)話記錄。SkypeTranslator通過(guò)記錄對(duì)話來(lái)分析文本并訓(xùn)練系統(tǒng)更好地“學(xué)習(xí)”語(yǔ)言——當(dāng)準(zhǔn)備好的數(shù)據(jù)錄入系統(tǒng)后,機(jī)器學(xué)習(xí)軟件會(huì)在這些對(duì)話和環(huán)境涉及到的單詞中搭建一個(gè)統(tǒng)計(jì)模型,當(dāng)你說(shuō)話時(shí),軟件會(huì)在統(tǒng)計(jì)模型中尋找相似內(nèi)容,然后應(yīng)用到預(yù)先“學(xué)到”的轉(zhuǎn)化程序中,得以讓語(yǔ)音轉(zhuǎn)換為文本,再?gòu)奈谋巨D(zhuǎn)換成另一種語(yǔ)言。

值得一提的是,與程序設(shè)定一般的朗誦不同,人會(huì)一邊思考一邊說(shuō)話,會(huì)犯錯(cuò),這種犯錯(cuò)在口語(yǔ)表達(dá)中的體現(xiàn)就是打磕巴,停頓,重復(fù),或者頻頻出現(xiàn)如“嗯”“啊”“呃”之類的語(yǔ)氣助詞,針對(duì)于此,SkypeTranslator的機(jī)器學(xué)習(xí)模型也會(huì)處理這些停頓。在預(yù)覽版中,用戶可以看到部分語(yǔ)氣詞停頓被移除,而未被移除的部分則可能通過(guò)用戶反饋進(jìn)行再優(yōu)化。

目前看來(lái),實(shí)時(shí)語(yǔ)音翻譯技術(shù)并不完美,它是一項(xiàng)不斷優(yōu)化的技術(shù)。每個(gè)國(guó)家的語(yǔ)言,時(shí)刻都在變化,哪怕同一國(guó)家,因地域不同也有不同口音。這些問(wèn)題可以通過(guò)更大范圍的數(shù)據(jù)解決么?也許能,但還需要時(shí)間。

SkypeTranslator

相關(guān)閱讀

暫無(wú)數(shù)據(jù)

一周熱門