精準醫療2.0時代:“數據為王”,誰來做“王后”?
在達納法伯癌癥研究所癌癥計算生物學中心主任John Quackenbush教授看來,精準醫療的發展進入了2.0時代。在這個時代里,毋庸置疑“數據為王”,但倘若沒有它的實用王后——生物學,是毫無意義的。
Quackenbush教授指出:很多我們研究的腫瘤精準醫療藥物一直專注于識別個體的突變或基因組的個體差異,如HER-2基因擴增匹配的患者是否存在改變單一治療的方式。這間接證明了我們對癌癥分子基礎的科學理解;也凸顯了我們真正了解的程度。
盡管大多數人都掌握了生物學的基礎,但許多有針對性的治療只占其中一小部分。即使是這個新時代最成功的藥物,如檢查點抑制劑,也不能像預期的那樣普遍發揮作用。
Quackenbush教授繼續補充道,“目前腫瘤學精準醫療的發展現狀是,在很多已經實施精準醫學的細分領域,對生物系統功能逐漸具有一定了解。隨著時間的推移,其他領域將一步步跟隨。
盡管通過的路徑不同,但精準醫學的終極目標相似,即真正認識到單個突變或單個基因組改變只是我們解決問題的其中部分。
那么其他部分從哪里來呢?
Quackenbush解釋道,最近的許多熱點都集中在將表型數據集成到基因組數據庫中。換句話說,追蹤病人及其腫瘤的物理特性,而不是簡單地從他們的基因組中進行預測。因此,他認為在精準醫療2.0時代,數據和內容必須同時進行。
他舉了個電子病歷的例子,目前電子病歷的設計大多數不是為研究及患者護理而設計的,它們是為報銷而設計的。而如何在宏觀尺度上提取信息且不丟失數據的上下文,并牢牢把握其局限性,這是一個挑戰。
他說:“很多人都急于以不可知論的方式來解釋這種數據,這使得科學家不得不面對過度擬合或不適合他們模型的問題,或者他們建立的模型缺乏真實世界價值或。在我的職業生涯中,我總是接受這些大規模的數據集。但我對如何使用它們一直很謹慎。”
Quackenbush博士還指出,很多網站通過模仿數據,建立所謂的模型都是“虛假相關”。例如作者Tyler Vigen在研究肯塔基漁民死亡與婚姻間的強相關性時,使用的數據一部分是來自美國疾病控制預防中心和國家統計報告;另一部分則是來自尼古拉斯·凱奇出演的電影數量和掉進游泳池淹死人數之間的聯系。可以肯定地說,這兩者間不存在因果關系。
上述只是一個簡單的問題,生物學問題比其更要復雜很多倍,且風險要高得多。如何獲得真正的生物學見解,Quackenbush博士認為,大量數據分析只是研究人類生物學復雜性的一部分。通過大數據我們看到了巨大的希望,但前提是我們要勇敢地面對這些生物系統。