語言作為人們溝通的工具,全世界不知道有多少種語言,每一種語言都有自己的文法、方言和變化,所以就算強大如 Google 也沒有辦法翻譯所有的語言。不過 Google 翻譯最近宣布即將新增包含粵語、NKo 和 Tamazight 等共 110 種新語言,希望可以打破語言障礙,幫助人們互相連結並更好地理解周遭的世界。
Google 翻譯新增 110 種語言,AI 助攻語言復興!
Google 在 2022 年 11 月份時宣布了 1000 種語言計畫,希望建立一個可以支援 1000 種最常用語言的人工智慧模型,為世界各地邊緣化社區的數十億人帶來更大的包容性。最近 Google 又宣布 Google 翻譯即將新增 110 種新語言,其中包含
- 粵語:長期以來都是 Google 翻譯最受歡迎的語言之一,不過因為書寫經常與中文重疊,因此難以找到數據和訓練的模型
- Afar:Afar 為一種聲調語言,在 Djibouti、Eritrea 和 Ethiopia 使用
- Manx :屬於曼島的凱爾特語,在 1974 年最後一位母語使用者去世之後幾乎接近滅絕,不過由於曼島的復興運動,現在已有數千名使用者
- NKo:西非曼德語系的標準形式,將許多方言統合為一種通用語言,目前有一個活躍的研究社群在為其開發資源和技術
- Tok Pisin:以英文為基礎的克裡奧爾語,也是巴布亞紐幾內亞的通用語。會說英文的人可能能夠理解 Tok Pisin 的含義
本次更新的語言有許多來自小型原住民社群,還有像是 Afar 一些幾乎沒有母語使用者的語言,不過 Google 都在積極復興中。
加上這次新增的 110 種語言, Google 翻譯將可以為超過 6.14 億的使用者(全球約為 8 %的人口) 提供翻譯功能。Google 翻譯能夠新增這 110 種語言也多虧了它們的人工智慧大型語言模型 PaLM 2,PaLM 2 可以幫助翻譯更有效的學習彼此之間有著密切相關的語言。未來 Google 也繼續與專業語言學家和母語使用者合作,將支援更多的語言變體和拼寫慣例。想了解本次 Google 翻譯增加了哪 110 種語言的朋友可以前往 Google 幫助中心。