科研成果
江濤教授團隊《GPB》在線發表中國腦膠質瘤基因組圖譜 (CGGA) 數據庫
2021年3月,北京市神經外科研究所、附屬北京天壇醫院江濤教授團隊在國際生物信息學領域權威學術期刊《Genomics, Proteomics & Bioinformatics (GPB)》雜志在線發表題為“Chinese Glioma Genome Atlas (CGGA): A Comprehensive Resource with Functional Genomic Data from Chinese Gliomas”的數據庫論文。北京市神經外科研究所趙征助理研究員、張克難和王強威博士研究生為共同第一作者,北京市神經外科研究所、附屬北京天壇醫院江濤教授與保肇實副主任醫師為通訊作者。
江濤教授團隊歷經十五年的腦膠質瘤臨床樣本積累、患者長期隨訪以及多維組學數據檢測,構建了首個中國人群的腦膠質瘤功能基因組學數據庫——中國腦膠質瘤基因圖譜計劃(CGGA)數據庫。CGGA數據庫向全世界研究者免費公開了約2000例中國腦膠質瘤樣本的功能基因組學數據,開發了多個腦膠質瘤的可視化在線分析工具,成為亞洲乃至全世界最大規模的腦膠質瘤醫學信息工程。該工作為腦膠質瘤發生發展過程中的重要分子機制的深入探究,為腦膠質瘤的分子分型和藥物靶點研發提供指導,并為腦膠質瘤精準醫學全鏈條的發展奠定基礎,推動中國腦膠質瘤臨床治療和科學研究的進步。自2019年6月,數據庫上線后全球總訪問量逾6.7萬次,其中包括來自美英德意日等115個國家地區的諸多學者,數據庫獲多名國際知名教授撰文肯定。截至目前,已有發表在Cell、Nature Cell Biology、Annals of Oncology等國際知名雜志的576篇論文引用數據庫數據。
腦膠質瘤是成人最常見的顱內惡性腫瘤,年發病率約5-8/10萬人。患者預后不良,常于手術后早期復發,給患者家庭及社會帶來了巨大的經濟和心理負擔。近年來,隨著腦膠質瘤分子生物學研究不斷深入,越來越多的生物學標記物被發現并用于臨床診治。腦膠質瘤功能基因組學數據的全面收集和共享有助于加速科學研究和臨床轉化,對臨床治療對策和國家腫瘤防控政策的制定具有重要指導意義。
CGGA數據庫是第一個完備的中國腦膠質瘤患者隊列的外顯子組、轉錄組、表觀遺傳組等多組學息庫。該信息庫的建設包括標準樣本采集、測序、分析流程、數據存儲與共享等。CGGA數據庫提供了完備的腦膠質瘤臨床信息、組織病理和分子病理等重要信息資源,其中最大隨訪時間逾15年。開發了數個針對特定組學數據的可視化在線分析工具。自上線以來,CGGA不斷更新完善,豐富數據內容、更新隨訪信息、提升可視化效果。
在CGGA數據庫網站中,包含CGGA、TCGA和Rembrandt隊列的腦膠質樣本組學數據和臨床資料,所有數據基于MySQL 14.14進行組織存儲。數據庫主要在Java Servlet框架下編寫開發,并部署在Tomcat 6.0.44 web服務器上,其運行環境為CentOS 5.5 Linux。數據庫的在線可視化分析工具主要通過Perl和R腳本實現。CGGA網站能夠在Chrome及Safari等主流瀏覽器中穩定運行。數據庫開發構架設計如圖1所示。
圖1 CGGA數據庫開發構架示意圖
CGGA數據庫能夠在線可視化分析全外顯子組、轉錄組學及小RNA、DNA甲基化芯片平臺等數據資源(圖2A)。在全外顯子組可視化分析中,用戶可針對其感興趣的基因或者基因集合可視化分析腦膠質瘤中的突變譜,以此來更好的探究腦膠質瘤的遺傳圖譜(圖2B,C)。此外,用戶還可以探索特定基因的遺傳改變對腦膠質瘤患者預后的影響(圖2D)。在該結果中,還提供了可視化分析工具所使用的數據和運行腳本,以便用戶可以更好的復現其分析結果。
圖2 CGGA數據庫的主要內容及外顯子數據分析工具
此外,CGGA數據庫還提供了在線的全轉錄組、小RNA及DNA甲基化數據的可視化分析工具(圖3A)。用戶可通過輸入感興趣的基因來查詢在不同腦膠質瘤亞型中的分布情況(圖3B)。其次,用戶可以探索感興趣的基因對在特定腦膠質瘤亞型中的共表達情況(圖3C)。此外,用戶可以針對自己感興趣的基因探究在不同腦膠質瘤亞型中的的預后價值(圖3D)。相應的組學數據、臨床數據以及R腳本呈現在相應結果部分,以便用戶可以很好的復現可視化分析的結果。
圖3 CGGA轉錄組數據分析示例
CGGA數據庫包含了來自中國人群的2000余例腦膠質瘤樣本的多維功能組學數據,其包括全外顯子組測序、轉錄組測序和表觀遺傳組學數據等。CGGA數據庫當前已實現多維功能基因組學數據共享,通過豐富多樣的數據分析功能和用戶友好的可視化分析工具,為全球眾多國家和地區科研人員提供重要的腦膠質瘤數據資源服務。CGGA數據庫建設仍在不斷完善,不久將來我們將豐富諸如單細胞測序數據、影像組學數據等腦膠質瘤重要的數據資源。依托北京市神經外科研究所、首都醫科大學附屬北京天壇醫院以及中國腦膠質瘤協作組(CGCG),我們將繼續收集腦膠質瘤組織樣本,開展測序,補充更多的中國人群的功能組學數據。我們期望CGGA數據庫能夠為中國人群腦膠質瘤的基礎和臨床科學研究助力,推動中國腦膠質瘤研究向前不斷發展。