京都大學研究生院生命科學研究科本田直樹教授、信息學研究生院(現Preferred Networks Co., Ltd.)碩士生山口翔一郎和石井信教授組成的研究小組是行為策略除了設計一種機器學習方法來闡明上述內容外,我們還將這種方法應用於線蟲,並在與名古屋大學理學研究生院的 Ikue Mori 教授的聯合研究中證實了它的有用性。
根據京都大學的說法,人類和動物會根據情況採取行動策略,以獲得食物和金錢等某種獎勵。但是,由於有些獎勵沒有伴隨實際情況,因此僅通過觀察自由移動的動物很難知道什麼是獎勵。
因此,課題組重點研究了線蟲的溫度趨向行為。當線蟲在恆定溫度下通過充分餵養而生長時,它會記住其生長溫度並在溫度不均勻的空間中向生長溫度移動。相反,當它在恆定溫度下經歷飢餓狀態而沒有食物的情況下生長時,它具有試圖逃離生長溫度的特性。
該研究小組設計了一種機器學習方法(反向強化學習方法),該方法從測量的時間序列數據中估計未知獎勵。線蟲行為時間序列數據分析表明,在充足食物條件下生長的線蟲具有在相同溫度下有效地向生長溫度移動或沿等高線移動的特性。
此外,作為基於估計獎勵的線蟲行為的計算機模擬的結果,再現了線蟲的溫度趨向行為。該研究小組希望這種方法能夠推動對迄今為止無法闡明的動物行為策略的研究。