6月22日,國際學術期刊Briefings in Bioinformatics以“Dr AFC: drug repositioning through anti-fibrosis characteristic”為題,在線發(fā)表了基于化合物抗纖維化特征的藥物重定位平臺Dr AFC(https://www.biosino.org/drafc/),為研究人員提供了準確、方便、快捷的在線藥物重定位預測工具,助力臨床新藥研發(fā)。
藥物重定位指將已有藥物再利用,將其應用于新的疾病。與傳統(tǒng)的藥物研究相比,藥物的重定位具有巨大的優(yōu)勢,其大大縮短藥物研發(fā)周期,降低成本并降低潛在風險,現(xiàn)已成為藥物研發(fā)中重要策略之一。然而,如何不斷優(yōu)化藥物重定位方法和模型則成為目前需要攻克的難點。纖維化是許多疾病致病機制中的關鍵病理過程,這些涉及到纖維化的疾病具有共同的機制和治療靶點,具有共同的治療方法和藥物。因此,研究團隊開發(fā)了基于化合物抗纖維化特征的藥物重定位預測算法,在預測模型中引入抗纖維化的特征,提高重定位的成功率。
該研究系統(tǒng)收集了纖維化相關的文獻和抗纖維化臨床實驗數(shù)據(jù),經(jīng)過篩選和分析后,最終獲得3096篇纖維化相關文獻,1787個抗纖維化臨床實驗,1067個纖維化相關靶點,507個抗纖維化化合物-靶點的相互作用和1223個抗纖維化化合物,其中包括386個DrugBank中FDA批準的上市藥物?;诖?,該研究首先建立了抗纖維化藥物知識庫,進一步整合DrugBank上市藥物小分子數(shù)據(jù)構建了“基于化合物結構譜預測模型”(Structure Profile Prediction Model, SPPM),和整合小分子刺激基因表達譜數(shù)據(jù)(CMap, connectivity map)構建了“基于化合物生物表達譜預測模型”(Biological Profile Prediction Model, BPPM)。在這兩個藥物重定位的模型中,根據(jù)化合物是否與纖維化有關來定義陽性和陰性數(shù)據(jù),經(jīng)過質(zhì)控和預處理后用于后續(xù)模型的訓練和測試。在評估4種不同的機器學習算法后,發(fā)現(xiàn)梯度提升算法具有最優(yōu)的準確性和AUC,進而通過迭代特征消除(IFE, Iterative feature elimination)算法篩選并確定最優(yōu)的特征(feature)組合,構建最終模型。模型在實際數(shù)據(jù)中進行了進一步測試與驗證,得到了良好的預測效果。
該研究基于SPPM和BPPM模型開發(fā)了在線藥物重定位平臺Dr AFC,用戶可以分別上傳化合物的結構譜(通常為結構描述符/指紋)或生物表達譜(通常為化合物刺激的轉錄組表達值)來進行重定位分析。此外,Dr AFC平臺中還加入了常用的藥物設計分析功能,包括類藥性分析、相似性計算、結構匹配等工具,方便研究人員使用。
該工作由同濟大學吳頂峰、高文星、黎曉逸等在同濟大學朱瑞新教授、中國科學院上海營養(yǎng)與健康研究所生物醫(yī)學大數(shù)據(jù)中心張國慶研究員和中山大學朱立新教授的共同指導下完成。研究得到了科技部國家重點研發(fā)計劃、國家自然科學基金、上海市自然科學基金、中國科學院等多項基金的資助。(科技處)
在線服務地址: https://www.biosino.org/drafc/
文章鏈接:https://academic.oup.com/bib/article/doi/10.1093/bib/bbaa115/5860688
?
圖:Dr AFC藥物重定位平臺構架。平臺實現(xiàn)了基于化合物結構譜(SPPM)和基于化合物生物表達譜(BPPM)的藥物重定位預測模型,集成了藥物重定位預測和重定位機制分析等多種方便的新藥研發(fā)工具。