新闻动态

联系我们

服务与产品

时间序列分析

发布时间:2021/09/24
时间序列分析

  实验介绍通过在不同时间点对细胞周期以及特地状态条件下的基因表达进行测定,获得的基因表达数据,即时间序列基因表达数据,包含着丰富的基因调控信息,可以想象位于基因调控网络上游基因的变化,理应处于下游基因的前面。当上游基因(比如转录因子TF)的表达发生变化以后,这种变化会沿着基因调控网络传播,当测量了每个基因在不同时间的表达水平后,就能够从这种时间序列数据中反推得到关于基因调控顺序以及调控对象的重要信息。RNA-seq的基础分析是差异表达。但当样本的实验时间点大于或等于3的时候,我们可能更关心这些基因在多个时间的变化规律(上下波动的变化),而不仅仅满足于差异表达。

 

  我们利用STEM软件通过先预设趋势,再分配的基本原理将输入的基因按照其表达趋势进行分类,结合功能富集分析,从而更有效地挖掘数据内部的规律。

 

  区别于K-means硬聚类算法,我们利用R包Mfuzz模糊聚类原理,将一个基因对应到几个簇,通过计算各个簇下该基因membership值,直观感受基因在某个聚类的归属程度,对时间序列这种逐渐变化,并且会频繁的出现聚类重叠的类型的数据进行很好的聚类分析。

 

  2.结果展示

 image.png

  图1  stem软件分析结果图。左图表示所有的聚类集合,有颜色的表示基因表达模式显著相似,其中小方块左上方的数字表示聚类基因集合的编号;方块中黑色折线表示该基因集合中所有基因表达的整体趋势走向;右图为其中一个基因集合的具体表达模式图及详细信息。

 image.png

  图2  R包Mfuzz分析基因表达模式聚类结果图。黄色和绿色的线表示低membership值的基因,红色和紫色的线表示高membership值的基因

 image.png

  图3  R包Mfuzz分析基因表达模式聚类全局分布图。蓝色线粗细代表两种聚类模式的耦合度。


咨询热线:400-1600-106     地址:吉林省长春市南关区高新技术产业开发区飞跃路5588号中国吉林东北亚文化创意科技园
版权所有:长春可研生物科技有限公司      ICP备案编号:吉ICP备16006047号-2