刊期:双月刊
主管单位:中国科学院
主办单位:中国科学院动物研究所,中国昆虫学会
地址:北京市朝阳区北辰西路1号院5号中国科学院动物研究所
邮编:100101
电话:010-64807137
传真:010-64807137
E-Mail:entom@ioz.ac.cn
刊号:ISSN 2095-1353
        CN 11-6020/Q
国内发行代号:2-151
国际发行代号:BM-407
发行范围:国内外公开发布
定价:138元/册
定价:828元/年
银行汇款:中国工商银行北京海淀西区支行
户名:中国科学院动物研究所
帐号:0200 0045 0908 8125 063

您所在位置:首页->信息之窗

基因组暗物质的识别:数量最大的一类非编码RNA的高精度预测算法获得突破
发布时间:2011/5/5 16:40:00


        第二代测序技术又称作深度测序技术,应用到RNA上统称作RNAseq或RNA测序,它已成为基因表达和转录组分析的重要手段。第二代转录组测序数据中含有大量不编码蛋白质的ncRNA序列,因为它们像宇宙中的暗物质一样难以识别和有重要功能,也被称为“基因组暗物质”。由于数据量巨大,保守性差,又有噪音干扰,这些“暗物质”的识别成为表观遗传学和调控网络研究的瓶颈。piRNA是数量最大的一类ncRNA,主要是通过与转座子的序列互补来控制转座子的表达,进而调控生殖和发育。由于不同物种的piRNA之间同源性很差,至今国际上还没有有效的识别方法。
      中国科学院动物研究所康乐研究组的张屹等最近发表的题为“A kmer scheme to predict piRNA and characterize locust piRNA”的最新研究论文,解决了高精度预测生物体中数量最大的一类非编码RNA——piRNA的难题,论文发表在《生物信息学》(Bioinformatics)上。这篇文章中提出了一种基于kmer串频率的Fisher判别式来预测piRNA的算法, 精度达90%以上,超过了哈佛大学B. Doron的61%的精度。利用这个方法,他们成功地鉴定出飞蝗8万多条piRNA, 预测飞蝗可能存在约13万条piRNA。进一步分析发现这些piRNA在飞蝗群居型和散居型间存在巨大差异,这可能为解释飞蝗两型生殖力差异提供了重要的线索。这个不依赖基因组数据来鉴定非模式生物piRNA的新方法具有重要的理论意义和广泛的应用价值。目前,在线软件piRNApredictor (http://59.79.168.90/piRNA/index.php)已被国外科研机构用于猪的piRNA研究中。
       piRNA预测算法的突破为其它ncRNA的预测提供了重要的启示:不保守的ncRNA是可以预测的。由于该算法理论的普遍性,这个方法不仅可以预测其它物种的piRNA,还可以通过变更训练集来预测其它种类的ncRNA。而且,在线软件给出的piRNA高精度预测结果,对进一步表观遗传学,调控网络与piRNA功能的研究有重要理论意义和应用价值。(来源:中国科学院动物研究所 2011-03-10)

版权所有©2024应用昆虫学报》编辑部 京ICP备10006425号
本系统由北京菲斯特诺科技有限公司设计开发
您是本站第8744085名访问者