大阪大學科學產業研究院助理教授 Ryu Takeda 領導的研究小組開發了一種識別對話中包含的未知單詞的技術,這是口語對話系統所必需的。”介紹道。
近年來,已經發布了許多語音應答機器人和應用程序,但基本上它是一種僅識別預先註冊的單詞的機制。如果話語中包含其他單詞(未知單詞),則會被已知單詞替換,無法正確識別為“單詞”。如果能夠正確識別“生詞”部分,就可以通過詢問來了解其含義。
在我的研究中,我重點研究了自然語言處理技術中的“無監督分詞”方法,並將其應用於語音過程中未知詞的識別。在這種方法中,書面語言通常是有針對性的,切分單位是“字符”,但應用於語音時,應該用什麼作為“聲音表達單位”以及什麼是有效的,並不是不言而喻的。這些單位包括音素(音標)和音節(平假名)等表達方式。
在所開發的方法中,使用“詞相似性”計算出的“基於發音及其構成模式的單位”被用作“語音單位”。該模式是根據多個單詞中出現的常見發音和出現位置計算得出的,可以更輕鬆地識別與已知單詞具有相似語音結構的未知單詞。假設音素識別正確,我們驗證日語/英語會話語料庫中每個單元的生詞識別率。
這項成果據說是實現語音對話系統所必需的技術,該系統不僅可以讓開發者提前準備或更新交互,而且還可以在與人類對話時進行自我學習並逐漸變得更加聰明。
論文信息:【2018 IEEE口語技術研討會(SLT)】基於Pitman-Yor半馬爾可夫模型利用子詞信息的音素序列分詞