大阪大學科學產業研究院助理教授 Ryu Takeda 領導的研究小組開發了一種識別對話中包含的未知單詞的技術,這是口語對話系統所必需的。”介紹道。

 近年來,已經發布了許多語音應答機器人和應用程序,但基本上它是一種僅識別預先註冊的單詞的機制。如果話語中包含其他單詞(未知單詞),則會被已知單詞替換,無法正確識別為“單詞”。如果能夠正確識別“生詞”部分,就可以通過詢問來了解其含義。

 在我的研究中,我重點研究了自然語言處理技術中的“無監督分詞”方法,並將其應用於語音過程中未知詞的識別。在這種方法中,書面語言通常是有針對性的,切分單位是“字符”,但應用於語音時,應該用什麼作為“聲音表達單位”以及什麼是有效的,並不是不言而喻的。這些單位包括音素(音標)和音節(平假名)等表達方式。

 在所開發的方法中,使用“詞相似性”計算出的“基於發音及其構成模式的單位”被用作“語音單位”。該模式是根據多個單詞中出現的常見發音和出現位置計算得出的,可以更輕鬆地識別與已知單詞具有相似語音結構的未知單詞。假設音素識別正確,我們驗證日語/英語會話語料庫中每個單元的生詞識別率。

 這項成果據說是實現語音對話系統所必需的技術,該系統不僅可以讓開發者提前準備或更新交互,而且還可以在與人類對話時進行自我學習並逐漸變得更加聰明。

論文信息:【2018 IEEE口語技術研討會(SLT)】基於Pitman-Yor半馬爾可夫模型利用子詞信息的音素序列分詞

大阪大學

每個人的“真正價值”成為大阪大學的“進化”。到一所生活在社區中並延伸到世界的大學

大阪大學是一所研究型大學,設有 11 個學院和 23 個系。 自1931年建校以來,以“立足本地區,走向世界”為座右銘,打造了編織先進的教育和研究能力、教職員工和睦相處的優秀“基礎”和“力量”傳統的重量和大阪的優勢。我有。利用這些優秀的潛力 […]

大學學報在線編輯部

這是大學期刊的在線編輯部。
文章由對大學和教育具有高水平知識和興趣的編輯人員撰寫。