區塊鏈
真『言論自由』?元宇宙將不受語言限制!
元宇宙建構出一個「無國界」的虛擬世界,meta也為此推出了許多輔助軟硬體,現在也端出了讓大家不論說何種語言,都能溝通無障礙的AI模型, Meta新技術可翻譯128種語言
緊貼世界各地區塊鏈社群最新資訊,追蹤 Coindaily 社交平台!
加入 TG 頻道: https://t.me/coindaily_official
Facebook:https://www.facebook.com/CoinDaily_official
Instagram:https://www.instagram.com/coindaily.official
據 Coindaily 報道,Facebook宣佈改名Meta,此後便新動作不斷,先是推出了一個觸覺手套,試圖讓人們在VR世界中也能體驗到觸覺變化。觸覺之後,Meta又盯上了語言,它要讓人們在虛擬世界中也可以無障礙溝通,哪怕雙方使用的語言不同,你說英語,我說中文都能互相理解。
就這樣 XLS-R 來了,它是Meta最近發布的一個AI語言處理模型,最高能識別128種語言,目前已經公佈了網頁體驗版。體驗版的功能有一定缺失,僅支援將22種語言翻譯為16種語言,對比市面上常見語音翻譯應用,這個速度和轉譯表現其實中規中矩,都對口語清晰度有要求,一旦語速稍微快一些,就比較難理解,轉譯會出錯。
XLS-R的潛力體現在多語言通用AI模型上,據Meta該技術基於 wac2vec2.0 預訓練模型,能將語音拆成25毫秒的基本單元來分析,利用上下文轉換語音內容,提升識別準確度。之後Meta又對 wac2vec2.0 技術進行了多次調整,嘗試處理多種語言,轉換準確率提升了不少,經過通過436000小時的公開錄音訓練後,才有如今的XLS-R。
XLS-R僅僅用一種語言模型就可以轉換128種語言,和特殊領域使用特殊模型的常見做法不同,極大地提升了通用性。在官方部落格中,Meta表示它們的目標是用單一模型識別全球7000多種語言,從而改進轉換算法。
作為同在在自然語言識別領域擁有大量技術儲備的 Google,其實比Meta更早在消費級裝置上支援多語種翻譯功能,只有聯網live Translate功能才能做到支援48種語言,而使用雲端計算技術的Google翻譯也僅支援108種語言,離7000種語言很遠。
元宇宙離我們仍然有一段距離,不過XLS-R等技術作為Meta口中虛擬世界的基礎建設之一,或許能在其他領域發揮作用,現在它已經發布了XLS-R預訓練模型的微調教程,讓業內人士可以基於它進行微調以便應用到具體的工作當中。
或許不久之後,我們能看到越來越多的應用支援更多語種的語音轉譯功能。