來自日本國立信息通信技術研究所 (NICT)、埼玉大學和慶應義塾大學的研究小組通過利用半導體激光器產生的光學混沌應用超快光子學,在世界上首次成功實現了強化學習。

 機器學習是現代人工智能 (AI) 的基礎,涉及深度學習和強化學習技術。強化學習是一種在未知環境中通過試錯來學習的方法。中心問題是“如何在擁有許多老虎機的賭場中最大化利潤”(=“多臂強盜問題”)。

 要想利潤最大化,就必須擊中勝盤,但如果嘗試太多,就會賠錢,如果過早退出,就會錯過擊中盤。解決這個“搜索”或“決策”問題的方法是隨機選擇一個平台,傳統上是使用根據計算機計算過程生成的“偽隨機數”,但這需要時間,而且隨機數的“質量”有限。因此,研究小組提出了“直接利用自然界物理現象的強化學習”,並成功實現了利用單光子的方法。

 在這項研究中,利用使用半導體激光器時出現的光的“混沌現象”(注),可以非常快速地解決從兩台老虎機中選擇獲勝概率高的機器的問題。對半導體激光器產生的激光混沌光進行高速採樣,僅根據“過去的戰鬥歷史”判斷“閾值”的大小來做出決策。結果,我們實現了信息從輸入到輸出的時間為十億分之一秒(2納秒)的高速決策,表現出比使用偽隨機數的傳統方法更好的性能。未來有望作為瞬時頻率分配等人工智能和物聯網的基礎技術做出巨大貢獻。

(注)當從半導體激光器發射的光被鏡子反射並返回激光器時,激光器的操作變得不穩定,並且會出現混亂(初始狀態的微小差異隨著時間的推移而爆炸性增加的現象)。

論文信息:【科學報導】基於激光混沌的超快光子強化學習

埼玉大學

在培養引領下一代的人才的埼玉大學發現並成長新的自我

埼玉大學成立於1949年(昭和24年),將原浦和高中、埼玉師範學校和埼玉青年師範學校合併為一所新的國立大學。擁有文科、經濟、教育、科學和工程五個學院,以紮實的研究能力為基礎的先進教育內容,提高研究能力,有助於開發新的知識視野和解決當代問題 […]

慶應義University大學

大學學報在線編輯部

這是大學期刊的在線編輯部。
文章由對大學和教育具有高水平知識和興趣的編輯人員撰寫。