2022年12月28日,中國科學院上海營養(yǎng)與健康研究所李虹研究組在國際學術(shù)期刊Briefings in Bioinformatics上在線發(fā)表了題為“A systematic assessment of deep learning methods for drug response prediction: from in vitro to clinical applications”的論文。文章從多角度系統(tǒng)地評估了癌癥藥敏預測深度學習算法的性能,為用戶根據(jù)自身需求和數(shù)據(jù)特點選擇恰當?shù)念A測模型提供指導,同時為構(gòu)建新的計算模型指引方向。
基于分子組學預測藥物對腫瘤的殺傷效果是癌癥個體化治療中的一個重要方向。近期研究結(jié)果顯示,深度學習模型相比經(jīng)典的機器學習模型能提高預測性能。然而,目前缺乏對不同深度學習方法的系統(tǒng)性比較,尤其是從臨床前模型到臨床數(shù)據(jù)的模型遷移能力。研究人員使用九個評估指標對六種具有代表性的藥敏預測深度學習方法,在多個應用場景中的性能進行了評估,包括整體預測準確性、單個藥物水平的可預測性、預測性能的潛在相關(guān)因素、以及細胞系模型用于臨床患者的遷移能力等。結(jié)果顯示,大多數(shù)方法在細胞系數(shù)據(jù)集中有良好的預測性能,其中基于蛋白質(zhì)-蛋白質(zhì)關(guān)聯(lián)的雙圖神經(jīng)網(wǎng)絡算法對腫瘤細胞系組學特征的捕捉能力更強,準確性更好。由于細胞系和患者腫瘤樣本之間的差異,細胞系上訓練的模型應用于患者時,性能指標會出現(xiàn)不同程度的降低,但是幾種單藥模型仍然能在部分藥物上取得可靠的預測結(jié)果。
中國科學院上海營養(yǎng)與健康研究所博士研究生沈碧寒和博士后馮方尤敏為本文共同第一作者,李虹研究員為本文通訊作者。特別感謝中國科學院上海營養(yǎng)與健康研究所李昕研究員和馬良宵工程師、貴州科學數(shù)據(jù)中心貴安超級計算中心蔡文舉工程師給予的支持和幫助。該工作獲得了國家自然科學基金、科技部國家重點研發(fā)計劃、中科院青年創(chuàng)新促進會、上海市自然科學基金、上海人才發(fā)展資金的資助,同時也得到了中國科學院上海營養(yǎng)與健康研究所生物醫(yī)學大數(shù)據(jù)中心技術(shù)平臺的支持。