京都大學研究生院信息學研究科的黑橋貞夫教授和日本科學技術廳信息規劃部研究員 Toshiaki Nakazawa 開發了一種日漢和中日科技論文機器翻譯系統,使用神經網絡 *. 從 2018 年 5 月 8 日起,該系統在日本科學技術振興機構的網站上提供。

 近年來,中國發表的科技論文數量已成為僅次於美國的世界第二大科技文獻,對日文中文科技文獻的檢索和瀏覽需求日益增加。雖然可以快速且廉價地處理機器翻譯,但預計會普及,但在科技信息翻譯中代表最新技術的各種技術術語和新詞,因此需要提高機器翻譯的準確性翻譯...

 在此背景下,自2013年起,京都大學信息學研究科、日本科學技術振興機構信息計劃部、中國科學技術信息研究所合作,為科學技術打造高精度神經機器我們一直致力於“日中/中日機器翻譯實際應用項目”,推動翻譯系統的實際應用。

 在該項目中,我們基於科技論文準備了超過400萬個中日雙語語料庫(=用於機器翻譯培訓的教師數據)。這些都是由本次開發的神經機器翻譯引擎學習的,並通過準備雙語詞典減少了誤譯和遺漏。結果,開發中設定的97%的評價標準“包含最重要的信息”和“易於理解,沒有過多或不足的信息”,翻譯準確率達到6%左右。此外,在2016年12月舉辦的亞洲語言國際機器翻譯研討會“WAT2016”的評測中,在科技信息機器翻譯任務中表現出最高準確率。

 日中/中日機器翻譯系統通過雙語語料庫和雙語詞典的開發,即使是尖端技術信息,也有望提供高度準確的翻譯。

* 神經網絡是一種計算模型,旨在模仿人類腦細胞中信息傳遞的機制。計算機用於“深度學習”以理解複雜的事物,近年來,它們不僅用於機器翻譯,還用於高級圖像識別、圍棋和將棋等許多領域。

京都大學

本著“自重自重”的精神,培育自由的學術傳統,開闢創造性學習的天地。

以自學為座右銘,繼續保持不受常識束縛的自由學術傳統,培養兼具創造力和實踐能力的人才。它提供了一個包容性的學習空間,允許多樣化和分層的選擇,以便學生自己可以通過有價值的嘗試和錯誤來選擇一個堅實的未來。 […]

大學學報在線編輯部

這是大學期刊的在線編輯部。
文章由對大學和教育具有高水平知識和興趣的編輯人員撰寫。