筑波大學生命科學研究中心的牧野正司教授和國立資訊學研究所資訊學原理研究部的小野純紀副教授領導的研究小組能夠從重疊的聲音中檢測到一個人使用多個設備錄製多人的聲音。我們開發了音訊訊號處理技術,可以分離單一語音並允許同時識別多個語音。它預計將用於自動創建會議紀要等事情。

 據筑波大學稱,一個研究小組開發了一種新的訊號處理技術,可以同步由不同設備記錄的多個不同步的記錄訊號。透過將其與國立資訊學研究所小野實驗室開發的高速盲音源分離技術相結合,將由多個說話者的混合聲音組成的對話分離為單獨的聲音,然後應用並識別語音識別。顯著提高性能。
如果應用這項技術,如果與會者在各自的智慧型手機上記錄會議內容,還可以自動建立會議記錄。

 近年來,語音辨識能力得到了顯著提高,但當用於多人言語重疊的對話或會議時,問題是功能會惡化。
國家資訊研究所也在研究如何在基於網路的系統中實施這項技術。這項研究成果於9月8日在美國加州舊金山舉行的國際音訊會議上發表。

筑波大學

持續挑戰跨學科融合與國際化,以智慧、人性化發展人力資源

筑波大學綠意盎然,是筑波科學城的核心,一座學術文化氣息濃厚的國際都市。目前的教育體係為9組23班,可開設各領域的專業入門課程,旨在培養具有創造性的智慧和豐富的人文精神。用靈魂天才解決全球問題 […]

大學學報在線編輯部

這是大學期刊的在線編輯部。
文章由對大學和教育具有高水平知識和興趣的編輯人員撰寫。