模擬人類問題解決關鍵方面的計算機系統通常稱為人工智能(AI)。過去幾年,該領域取得了巨大進展。最值得一提的是,深度學習使無人駕駛汽車,計算機在戰略游戲(圍棋,國際象棋),計算機游戲,撲克以及診斷醫學的最初應用中擊敗了最優秀的人類玩家,從而取得了突破性的進展。深度學習基于人工神經網絡-迭代地重新組織數學函數的網絡,直到它們將描述給定問題的數據準確地映射到其解決方案為止。

對細胞信號網絡的深度學習為單細胞生物學建立

在生物學中,深度學習已成為一種從基因組數據(例如基因表達譜)預測表型(即細胞或個體的可觀察特征)的強大方法。深度學習通常是一種“黑匣子”方法:當神經網絡提供足夠的訓練數據時,它們是非常強大的預測器。例如,它們已用于根據基因表達譜預測細胞類型,并根據DNA序列數據預測蛋白質結構。但是標準的神經網絡無法以人類可以理解的方式解釋輸入與輸出之間的學習關系。因此,到目前為止,深度學習對增進我們對細胞內分子功能的機械理解的貢獻很小。

為了解決這種缺乏解釋性的問題,CeMM博士后研究員Nikolaus Fortelny和CeMM首席研究員Christoph Bock追求了直接在生物網絡上進行深度學習的想法,而不是在常規深度學習中使用的通用,完全連接的人工神經網絡。他們建立了基于信號通路和基因調控網絡的“知識型神經網絡 ”(KPNN)。在KPNN中,每個節點對應一個蛋白質或基因,并且每個邊緣都有機械的生物學解釋(例如,蛋白質A調節基因B的表達)。

方法的詳細概述:人工神經網絡將輸入(X)轉換為輸出(Y),例如將基因表達數據(X)轉換為具有高預測精度的表型(Y)。KPNN將生物網絡的知識整合到深度學習中,從而實現了黑盒算法的可解釋性。圖片來源:Nikolaus Fortelny / CeMM

CeMM研究人員在發表于《基因組生物學》的新研究中表明,對生物網絡的深度學習在技術上是可行的,并且在實踐中是有用的。通過強迫深度學習算法保持接近生物網絡中編碼的基因調控過程,KPNN在深度學習的力量和我們快速增長的對復雜生物系統的知識與理解之間架起了一座橋梁。結果,該方法提供了對所研究的生物系統的具體見解,同時保持了較高的預測性能。這種功能強大的新方法使用一種優化的深度學習方法,可以在存在冗余的情況下穩定節點權重,增強節點權重的定量可解釋性,并控制生物網絡固有的不均勻連接性。