懂行的人都知道,代謝組學的研究紛繁復雜、種類繁多,實驗得到的數據量也相當驚人。那么如何在代謝組學的研究中理出頭緒呢?今天谷君整理了一些常用的“套路”,希望能夠給大家一些啟發。

一:代謝組學分析流程

一般來說,代謝組的分析流程有:首先將代謝組分進行預處理, 預處理的方法由測量分析方法決定,如使用質譜方法分析,則需要預先對代謝組分進行分離和離子化。接著,再對預處理后的組分進行定性和定量分析。

預處理中,常用分離方法包括:氣相色譜(Gas chromatography, GC),高效液相色譜(High performance liquid chromatography, HPLC)。氣相色譜具有較高的分辨率,但需要對代謝組分進行氣化,并且對組分分子質量有一定的限制。高效液相色譜也在代謝組分析中被廣泛地使用,因其在液相中對代謝組分進行分離,因此不用對組分進行氣化,相較氣相色譜具有測量范圍更廣,更靈敏的優點。此外,毛細管電泳法(Capillary electrophoresis)也可以對代謝組分進行分離,其應用較少,但在理論上其分離效率比高效液相色譜法高。

在預處理時,常常會加入內參(internal standards),以方便后續對樣品的質量進行監控和對比,由于不同的實驗批次、樣品順序對后續測量也有一定對影響,因此,還會加入空對照和混合樣品對照來進行質量監控。

對不同的代謝組分進行定性和定量分析的方法包括質譜分析法(Mass spectrometry, MS)和核磁共振譜(Nuclear Magnetic Resonance Imaging, NMR)等。其中,質譜分析法具有靈敏度高,特異性強等優點,被廣泛地應用于檢測代謝組分,可以對經過分離、離子化處理后的代謝組分進行定性和定量。離子化的方法包括:大氣壓化學電離(Atmospheric-pressure chemical ionization, APCI), 電子電離(Electron ionization, EI ), 以及電噴霧電離(Electrospray ionization , ESI)等,需要根據不同的分離方法選用。例如電噴霧電離,常用于被液相色譜進行分離的組分。但由于質譜并不能直接對生物溶液或組織進行檢測,其應用一直受限。為了提高原有的質譜分析法的靈敏性,使樣品的準備簡單化,減少背景的影響,一些新的質譜相關技術得以產生。這些技術包括:二次離子質譜(Secondary-ion mass spectrometry , SIMS)和納米結構引發器質譜(Nanostructure-Initiator MS, NIMS),屬于去吸附/離子化方法,這兩種技術都不依賴基質。其中,SIMS使用高能離子束使樣品接觸表面解吸,具有高空間分辨率的優勢,與質譜串聯后是用于器官/組織造影的有力技術。而NIMS可用于小分子的檢測。基質輔助激光脫附電離(Matrix-assisted laser desorption/ionization ,MALDI)是一種較為溫和的離子化方法,可以得到用常規離子化方法容易解離為碎片的一些完整大分子質譜信息,如DNA、蛋白質、多肽和糖等。解析電噴霧電離(Desorption electrospray ionization ,DESI)是一種直接電離技術,可以與質譜串聯后,直接對大氣條件下的樣品分析。其原理是利用快速移動的帶電溶液流來提取接觸表面的樣品,可用于取證分析、藥物、植物、生物組織、高聚物等的分析。激光燒蝕電噴霧電離(Laser Ablation Electrospray Ionization , LAESI)是一種結合了中紅外激光燒蝕和二次電噴霧電離的直接電離技術,可用于廣泛的樣品,包括植物、組織、細胞,甚至是未經處理的生物溶液如血液、尿液等。已被用于食品監管、藥物監管等領域。核磁共振譜不需要預先對代謝組分進行分離,相較質譜而言,核磁共振譜具有結果可重復性好,樣品準備較簡單,不用預先分離,對樣品破壞性低等優點,盡管靈敏性相較質譜低(存在爭議,部分學者認為這是樣品預處理工作流程不正確造成的),但因其易于使用,因此應用也十分廣泛。

除此之外,其他的檢測方法還有:離子遷移率光譜(Ion-mobility spectrometry ,IMS)是一種基于離子化的分子在在氣相載體中的遷移來分離和分析這些分子的技術,具有很高的靈敏度,可以單獨使用,也可以和質譜、氣相色譜或液相色譜串聯使用。電化學檢測串聯高效液相色譜(electrochemical detection techniques coupled with high-performance liquid chromatography ,HPLC-ECD)可以用于測量復雜基質中低含量的組分,具有易用性、靈敏性、選擇性,已被用于臨床研究、食品檢測、藥物檢測等領域。拉曼光譜(Raman spectroscopy)基于振動光譜學,能夠檢測化合物結構和其微小變化,具有不破壞樣品、樣品預處理簡易、高空間分辨率等優點,已被應用于臨床病理學研究、微生物的分類和檢測、化合物的分析等領域。

二:代謝組學相關數據庫(及常用軟件)

常用的代謝組學相關數據庫有人類代謝組數據庫(Human Metabolome Database, HMDB)、KEGG數據庫、Reactome數據庫 (http://www.reactome.org)等,一一介紹如下:人類代謝組數據庫(HMDB)是代謝組學熱門數據庫之一,包含人體內發現的小分子代謝物的詳細信息,包含不少于79,650種代謝物條目。SMPDB數據庫與HMDB關聯,包含約700種人類代謝和疾病途徑的途徑圖。KEGG數據庫是代謝組熱門數據庫之一,包含代謝通路和互作網絡信息。Reactome數據庫主要收集了人體主要代謝通路信息以及重要反應。MassBank數據庫主要收集許多高分辨率低代謝組分的譜圖。

BioCyc數據庫包含通路和基因組數據。METLIN數據庫,是商業化的代謝組及串聯質譜數據庫,包含有約43000種代謝物和22000個MS/MS譜圖。FiehnLib數據庫是商業化的代謝組數據庫,包含約1000個保守的代謝分子的EI光譜。

NIST/EPA/NIH Mass Spectral Library數據庫也是商業化的代謝組數據庫,包含超過190,000 個EI譜圖。 BioCyc數據庫收集了通路和基因組數據,可以免費使用。MetaCyc數據庫廣泛收集了許多來自不同生物體的代謝通路以及酶的信息,囊括了超過51000篇文獻。MMCD數據庫收集有超過10000種代謝物的信息以及它們的質譜和核磁共振譜數據,大多數是擬南芥的代謝物。

三:代謝組學與其他組學數據整合

如何更好地整合各種組學數據目前仍是生物學界面臨的一個重大挑戰,并且有時還要面對不夠完善的實驗設計、不同實驗平臺的數據的整合。常用的方法是代謝通路水平的分析、生物網絡分析、經驗關聯分析等。有一些軟件或網站可以提供現成的整合多種組學數據的分析。如可以進行代謝通路富集分析的有:IMPaLA網站,使用了來自11個數據庫等3000多個代謝通路的信息,可以用于整合多種組學的分析;此外還有iPEAP軟件,MetaboAnalyst網站等也可以提供代謝通路富集分析。提供生物網絡分析的包括:SAMNetWeb網站,可以提供轉錄組和蛋白組的通路腹肌分析和網絡分析;pwOmics包,是R軟件包,能夠由隨著時間變化的數轉錄組和蛋白組信息構建網絡;相似的軟件還有MetaMapR(R軟件包,擁有用戶界面)、MetScape(Cytoscape插件) 、Grinn(R軟件包)等。可以進行經驗關聯分析的有:WGCNA(R軟件包),可以基于相關性和網絡拓撲結構對多種組學數據進行整合分析;其他R軟件包還有MixOmic、DiffCorr、qpgraph、huge。

四:代謝組學數據的統計分析方法及策略

得到代謝組學數據后,需要使用軟件對原始數據的信息進行讀取和分析,確定原始數據里面含有的代謝組分的成分,含量。有許多統計學軟件可以對核磁共振譜、質譜數據進行讀取、分析。XCMS是常用的用于讀取、分析質譜原始數據的免費軟件,類似的常用軟件還有MZmine2、MetAlign、MathDAMP、LCMStats 等。

一旦得到代謝組分成分和含量,可以對這些數據進行統計分析。常用的分析方法有主成分分析(principal component analysis, PCA) ,偏最小二乘回歸,聚類分析等,差異表達分析等。還可以使用前面提到的數據庫,對結果進行功能、通路富集分析。

本次的介紹先到這里,下面是會議推薦時間~

參考網站和文獻:

https://en.wikipedia.org/wiki/Metabolomics#Statistical_methods

https://zh.wikipedia.org/wiki/%E5%9F%BA%E8%B4%A8%E8%BE%85%E5%8A%A9%E6%BF%80%E5%85%89%E8%A7%A3%E5%90%B8/%E7%94%B5%E7%A6%BB

https://masspec.scripps.edu/publications/public_pdf/172_greving_2011.pdf

https://en.wikipedia.org/wiki/Desorption_electrospray_ionization

https://en.wikipedia.org/wiki/Laser_ablation_electrospray_ionization

https://en.wikipedia.org/wiki/Ion-mobility_spectrometry

https://en.wikipedia.org/wiki/Secondary_ion_mass_spectrometry

https://tools.thermofisher.com/content/sfs/brochures/XX-70872-HPLC-ECD-Pub-Articles-XX70872-E.pdf

http://www.eag.com/raman/

https://www.ncbi.nlm.nih.gov/pubmed/15450497

https://www.zbsa.uni-freiburg.de/core_fac/Metabolomics/metabolomics-datenbanken

https://en.wikibooks.org/wiki/Metabolomics/Databases#Reactome

https://academic.oup.com/bioinformatics/article/27/20/2917/202905/Integrated-pathway-level-analysis-of