大阪大學開發識別語音中未知單詞的技術

　大阪大學科學產業研究院助理教授 Ryu Takeda 領導的研究小組開發了一種識別對話中包含的未知單詞的技術，這是口語對話系統所必需的。”介紹道。

　近年來，已經發布了許多語音應答機器人和應用程序，但基本上它是一種僅識別預先註冊的單詞的機制。如果話語中包含其他單詞（未知單詞），則會被已知單詞替換，無法正確識別為“單詞”。如果能夠正確識別“生詞”部分，就可以通過詢問來了解其含義。

　在我的研究中，我重點研究了自然語言處理技術中的“無監督分詞”方法，並將其應用於語音過程中未知詞的識別。在這種方法中，書面語言通常是有針對性的，切分單位是“字符”，但應用於語音時，應該用什麼作為“聲音表達單位”以及什麼是有效的，並不是不言而喻的。這些單位包括音素（音標）和音節（平假名）等表達方式。

　在所開發的方法中，使用“詞相似性”計算出的“基於發音及其構成模式的單位”被用作“語音單位”。該模式是根據多個單詞中出現的常見發音和出現位置計算得出的，可以更輕鬆地識別與已知單詞具有相似語音結構的未知單詞。假設音素識別正確，我們驗證日語/英語會話語料庫中每個單元的生詞識別率。

　這項成果據說是實現語音對話系統所必需的技術，該系統不僅可以讓開發者提前準備或更新交互，而且還可以在與人類對話時進行自我學習並逐漸變得更加聰明。

資訊