東京大學成功利用人工智慧學習高精度預測烹飪時的眼球運動

　東京大學佐藤洋一教授領導的研究小組開發了一種方法，可以根據頭戴式攝影機記錄的「第一人稱影片」以前所未有的精度預測人的視線運動。預計它將應用於廣泛的領域，包括傳統技能和醫學的傳承。

　要了解詳細的人類行為，重要的是要知道人們何時專注於什麼以及關注什麼。如果能夠從影像中預測一個人的視線如何移動，那麼無需使用視線測量設備等特殊設備就可以知道一個人在看什麼以及如何看。另一方面，眾所周知，人的視線移動很大程度上取決於該人正在執行的任務，但現有的第一人稱視角視訊（頭戴式攝影機錄製的視訊）的視線預測方法不能，這沒有考慮工作依賴性。

　在這項研究中，受深度學習圖像分析中註意力模型的啟發，我們開發了一種方法，可以通過考慮取決於任務的注視運動模式，從第一人稱視角視頻中高精度預測注視位置。做過。結果，他們能夠預測人們在廚房做飯時眼睛何時會從一個物體移至另一個物體。

　當我們使用第一人稱視訊分析研究中使用的標準基準資料集進行評估實驗時，我們發現所提出的方法能夠預測注視位置，其準確度比現有的最新註視預測方法高出 40%。證實了這一預測是可能的。

　新開發的技術廣泛應用於與感知和分析人類行為相關的各種領域，例如製造現場的技能傳承、自閉症譜系障礙的早期篩檢以及分析駕駛員駕駛汽車時的視覺行為等。被利用。

論文信息：[歐洲電腦視覺會議 (ECCV 2018)] 透過學習任務依賴的注意力轉移來預測自我中心視訊中的注視

東京大學通過人工智能學習預測烹飪過程中的眼球運動，成功提高了準確性

資訊

研究結果

當地創造

產學合作

大學入學考試

職業

特色計劃

東京大學通過人工智能學習預測烹飪過程中的眼球運動，成功提高了準確性

相關文章

資訊

研究結果

當地創造

產學合作

大學入學考試

職業