当前位置:首页 > 技术交流 > 最新应用

技术交流

扫描二维码
或添加“GeneGroup003
获取更多最新资讯

商城订购

扫描二维码
或添加“生物通ebiobuy
手机下单,快人一步

GSEA基因集富集分析—高阶篇

版权所有,转载请联系基因市场部
2019-03-19

上期介绍了GSEA数据分析的基础原理,阐述了为什么要做GSEA分析,以及我司的优化的GSEA数据分析的亮点,接着一段视频欣赏重磅升级的GSEA数据网页版的效果!



贝晶升级的GSEA数据分析

亮点一

GSEA分析所有图形的分辨率都是出版级别, 适用于任何高影响因子的杂志。

亮点二

我司GSEA图相比Broad Institute图增加了阴影区域标示零假设分布,这样更容易比较看出p-value的显著性,便于用户更直观比较数据结果的准确性。

 

亮点三

结合GSEA检出的差异功能集,后续还可以进行其它数据分析,进一步解读转录组下游功能,如在差异基因集中做转录因子分析;并提取转录因子显著富集结果进行激酶底物富集分析,汇总推测得到的Kinase(激酶), TF(转录因子), 在结合DEG(差异基因),以及DEG之间的PPI(蛋白质网络互作)调控关系, 并把它们之间的关系以Arc Diagram图展示(如下图)。

http://img.xiumi.us/xmi/ua/1eAiE/i/13ac852cdfe0119291c13b17d860310e-sz_91701.jpg?x-oss-process=style/xmorient

 

亮点四

贝晶的结果都以html网页版的形式展出,输出为出版级别的矢量图(svg),结合第三方矢量图编辑软件(inkscape等),用户可以把各组样本灵活组合成图,修改样本名称,以及在总的热图中挑选自己关注的基因组合成新的热图,并保存为不同的图片格式。

 

最后对GSEA中几个关键的概念做个介绍:

ES

富集得分 (ES, enrichment score). 它反应基因集成员s在排序列表L的两端富集的程度,它反映的是将全部芯片数据或测序数据按表达量大小排序后,在此序列的前部或后部一个功能基因集富集的程度。当 ES 值为正,表示某一功能基因集富集在排序序列的前方,当 ES 值为负,表示某一功能基因集富集在排序序列的后方。

计算方式是,从基因集L的第一个基因开始,计算一个累计统计值。当遇到一个落在s里面的基因,则增加统计值。遇到一个不在s里面的基因,则降低统计值。每一步统计值增加或减少的幅度与基因的表达变化程度(更严格的是与基因和表型的关联度)是相关的。

NES

ES标准化处理的值,为什么要做标准化处理:因为各个功能基因集中所包含的基因数不同,而且不同的功能基因集与要分析的目标基因列表也不同,因此在比较数据集在不同功能基因集中的富集程度时,需要对ES进行标准化处理。

 

LEADING EDGE

领头亚集。领头亚集中的基因是指对ES 值贡献最大的基因集合。当 ES 为正值时,领头亚集位于 ES值对应排序序列之前,反之,则位于 ES 值对应排序序列之后。领头亚集的出现可说明这些基因在通路中有富集,且这些基因在通路中有共同的表达趋势。

 

 

具体情况请联系身边的基因人或直接拨打电话021-67285083


欢迎关注“基因快讯”官方微信

沪公网安备 31010402003540号 沪ICP备13000399号-1

2018在线国产偷拍视频_偷拍久久国产视频_一本道国产在线国产