1. 首頁 > 汽車知識網 > 汽車知識

    GO分析,GO富集分析是什么

    幾乎現在的套路性文章在做完差異表達分析后,都會去做GO和KEGG富集分析。那么GO和KEGG都是什么?富集分析又是個什么東西呢?

    1 為什么做富集分析?

    GO分析,它分析的是差異蛋白質組學(Proteomics)蛋白質功能分析。

    高通量的數據的分析,可以讓我們得到很多候選的結果。但是如果只是把結果這樣的平鋪開的話,反正不利于我們去發現事情的本質。所以為了更情況的看清楚這些基因的功能,我們就使用了富集分析。我們可以把富集分析理解為在把很零零碎碎的東西,通過一個整體來反應出來,類似于從微觀到宏觀的變化。

    做GO分析的思路:比如,在疾病研究的時候,進行藥物治療之后某些基因的表達量明顯的發生了變化,拿這些基因去做GO分析發現在Biological process過程當中集中在RNA修飾上,然后在此基礎上繼續進行挖掘。這個例子就是想啟示大家拿到。

    利用富集分析,我們就可以把很多看著雜亂的差異基因總結出一個比較整體反應事件發生的概述性的句子。例如:TP53信號通路和胃癌的發生有關。而不是說BAX、BID、ABL1、ATM、BCL2、BOK、CDKN1A這7個基因和胃癌的發生有關系。

    2 GO和KEGG是什么?

    就算沒有做過富集分析,但是也肯定見過公司或者一些文章里面寫到他們做了GO分析和KEGG pathway分析。那么這兩個東西到底是什么?

    GO富集分析原理簡介和DAVID的GO富集分析方法操作演示 ????尋找差異表達的基因并挖掘它們可能的功能,是我們進行RNA測序的最主要目的。很明顯,這些差異的基因必然與功能改變密切相關,例如,比較患病個體。

    對于每個基因而言,其基本的功能基于他們的蛋白結構域以及研究的文獻已經可以大致的知道一個基因具有什么樣子的功能了。GO和KEGG就是基于不同的分類思想而儲存的基因相關功能的數據庫。

    含義不同。geo和go分析的區別是含義不同,go不是數據庫,GEO數據是由美國國立生物技術信息中心NCBI創建并維護的基因表達數據庫。它創建于2000年,收錄了世界各國研究機構提交的高通量基因表。

    GO數據庫,全稱是Gene Ontology(基因本體),他們把基因的功能分成了三個部分分別是:細胞組分(cellular component,CC)、分子功能(molecular function,MF)、生物過程(biological process,BP)。利用GO數據庫,我們就可以得到我們的目標基因在CC,MF和BP三個層面上,主要和什么有關。例如: SRSF1這個基因的在GO數據庫的注釋就有:

    KEGG數據庫:除了對基因本身功能的注釋,我們也知道基因會參與人體的各個通路,基于人體通路而形成的數據庫就是通路相關的數據庫。而KEGG就是通路相關的數據庫的一種。其實通路數據庫有很多,類似于wikipathway,reactome都是相關的通路數據庫。只是因為KEGG比較被人熟知,所以基本上都做這個分析的。例如: SRSF1這個基因的在通路數據庫的注釋就有:

    3 GO、KEGG和富集分析有什么關系呢?

    GO分析

    GO和KEGG是基礎,而富集是過程,最后得到的結果就是整合后的宏觀的結果。

    GO分析

    版權聲明:本站文章均來源于網絡,如有侵權請聯系刪除!

    聯系我們

    在線咨詢:點擊這里給我發消息

    QQ:

    工作日:9:30-18:30,節假日休息

    老婆的视频完整版在线观看