筑波大學生命科學研究中心的牧野正司教授和國立資訊學研究所資訊學原理研究部的小野純紀副教授領導的研究小組能夠從重疊的聲音中檢測到一個人使用多個設備錄製多人的聲音。我們開發了音訊訊號處理技術,可以分離單一語音並允許同時識別多個語音。它預計將用於自動創建會議紀要等事情。
據筑波大學稱,一個研究小組開發了一種新的訊號處理技術,可以同步由不同設備記錄的多個不同步的記錄訊號。透過將其與國立資訊學研究所小野實驗室開發的高速盲音源分離技術相結合,將由多個說話者的混合聲音組成的對話分離為單獨的聲音,然後應用並識別語音識別。顯著提高性能。
如果應用這項技術,如果與會者在各自的智慧型手機上記錄會議內容,還可以自動建立會議記錄。
近年來,語音辨識能力得到了顯著提高,但當用於多人言語重疊的對話或會議時,問題是功能會惡化。
國家資訊研究所也在研究如何在基於網路的系統中實施這項技術。這項研究成果於9月8日在美國加州舊金山舉行的國際音訊會議上發表。