東京大學佐藤洋一教授領導的研究小組開發了一種方法,可以根據頭戴式攝影機記錄的「第一人稱影片」以前所未有的精度預測人的視線運動。預計它將應用於廣泛的領域,包括傳統技能和醫學的傳承。

 要了解詳細的人類行為,重要的是要知道人們何時專注於什麼以及關注什麼。如果能夠從影像中預測一個人的視線如何移動,那麼無需使用視線測量設備等特殊設備就可以知道一個人在看什麼以及如何看。另一方面,眾所周知,人的視線移動很大程度上取決於該人正在執行的任務,但現有的第一人稱視角視訊(頭戴式攝影機錄製的視訊)的視線預測方法不能,這沒有考慮工作依賴性。

 在這項研究中,受深度學習圖像分析中註意力模型的啟發,我們開發了一種方法,可以通過考慮取決於任務的注視運動模式,從第一人稱視角視頻中高精度預測注視位置。做過。結果,他們能夠預測人們在廚房做飯時眼睛何時會從一個物體移至另一個物體。

 當我們使用第一人稱視訊分析研究中使用的標準基準資料集進行評估實驗時,我們發現所提出的方法能夠預測注視位置,其準確度比現有的最新註視預測方法高出 40%。證實了這一預測是可能的。

 新開發的技術廣泛應用於與感知和分析人類行為相關的各種領域,例如製造現場的技能傳承、自閉症譜系障礙的早期篩檢以及分析駕駛員駕駛汽車時的視覺行為等。被利用。

論文信息:[歐洲電腦視覺會議 (ECCV 2018)] 透過學習任務依賴的注意力轉移來預測自我中心視訊中的注視

東京大學

明治10年成立。日本歷史最悠久、日本知識最前沿的大學

東京大學成立於 1877 年(明治 10 年),由東京開成學校和東京醫科大學合併而成。自成立以來,它作為日本領先的大學和東西方文化融合的學術中心,以世界獨特的方式發展教育和研究。因此,在廣泛的領域中產生了許多人力資源,並取得了許多研究成果[…]

大學學報在線編輯部

這是大學期刊的在線編輯部。
文章由對大學和教育具有高水平知識和興趣的編輯人員撰寫。