東北大學研究生院助理教授 Soh Yibun 領導的研究小組將以往研究中取得優異成績的深度學習模型的關注領域與基於醫生診斷的重要領域進行了比較,結果發現 30% 的關注領域大約80% 與醫學上重要的領域無關,而且很明顯,兩者之間存在很大差異。
深度學習等人工智慧(AI)取得了顯著進展,其在醫學影像診斷中的應用正在取得進展。然而,深度學習模型的有效性,例如所關注的醫學影像的特徵與醫學檢查結果的匹配程度等尚未得到充分驗證,並且有可能導致與醫生的診斷結果不一致。臨床實踐,令人恐懼。
研究小組檢查了深度學習模型的醫學有效性,該模型在先前的研究中取得了高效能,利用法醫取證透過屍檢影像診斷溺水。使用視覺化技術識別深度學習模型關注的影像特徵,並將其定義為“感興趣區域”,並將診斷放射科醫生根據影像發現註釋的影像區域定義為醫學“重要區域”。
因此,模型的興趣區域僅在 30% 的情況下與醫學上重要的區域相符。此外,即使達成了約 80% 的共識,該地區內的重要地位也不同。考慮到先前的研究報告所測試的深度學習模型能夠對溺水進行分類,準確率高達90%以上,但該模型與臨床醫學發現之間存在出乎意料的巨大差異,可以說是存在的。
研究表明,人們對人工智慧醫學影像診斷的醫學有效性存在擔憂,預計透過開展新的訓練方法開發等驗證和應對措施,實現高度安全的人工智慧的臨床應用。它將完成。