Personal tools
You are here: Home ncRNA KnowledgeBase Paper Review Prediction of Structured Non-Coding RNAs in the Genomes of the Nematodes Caenorhabditis elegans and Caenorhabditis briggsae
Document Actions

Paper Review

by admin last modified 2006-10-27 22:25

Journal of Experimental Zoology (Mol. Dev. Evol) 306B (2006)

Prediction of Structured Non-Coding RNAs in the Genomes of the Nematodes Caenorhabditis elegans and Caenorhabditis briggsae

Kristin Missal, Xiaopeng Zhu, Dominic Rose, Wei Deng, Geir Skogerb0, Runsheng Chen, and Peter F. Stadler

概要

RNAzを用いてC. elegansおよびC.briggsaeのゲノム中の構造RNAモチーフを探索。

・ 3,672の構造RNAモチーフを同定。

・ 同定された大部分のモチーフはイントロン中あるいは既知のタンパクコード遺伝子と離れた位置に存在しているものが多かった。

線虫ゲノムには3,000から4,000の進化的に保存されたRNAが存在すると見積もった。これらの少数だけが既知のRNAファミリ(tRNA, snoRNA, snRNAあるいはmicroRNA)に含まれた。

比較的少数のncRNA候補だけがRNA特有の上流エレメント(以前の目次紹介で岡田さんが紹介 Organization of the Caenorhabditis elegans small non-coding transcriptome: genomic features, biogenesis, and expression, Genome Res. 2006, 16, 20-29)を持っていた。

手法

RNAzを使う。

入力のアラインメントは以下のように作成した:

初期データセットからは既知タンパク遺伝子とリピート領域は除いているが、コンピュータによる予測タンパク遺伝子領域は解析対象から除かない。

アラインメントにはblastを利用(E<10-3

アラインメントをつなげる際にrearrengementやduplicationを考慮する

結果

100,291,769 bp (C. elegansのDNA全体) →

61,067,263 bp (既知タンパク遺伝子、リピート除く) →

13,567,851 bp (C. briggsaeとアラインメントがとれた)

アラインメントに対してRNAzをかけた結果3,672の構造RNAモチーフを同定した(pc=0.5の場合)。Table 1を参照。

探索された候補は、イントロン領域とintergenic region(既知遺伝子から1kb以上離れている)に多い。

入力アラインメントをシャッフルしてSpecificityを見積もっている。Specificityは高いがFP rateで見ると30から50%程度

Wormbookのアノテーションに対するsensitivityの見積もり。70%以上の重なりがあれば予測できているとしている。

Dengらの結果に対するsensitivityの見積もり。

これらを平均するとsensitivityとFP rateがともに50%ぐらいなので、線虫のゲノムには3,000から4,000ぐらいの進化的に保存された2次構造が存在していると見積もれる。

線虫のncRNAの上流に存在すると報告されている配列UM1, UM2, UM3が予測ncRNAの場合どの程度存在するかを調べた。

Predicted はC..elegansの全ゲノムに対する予測結果を示している。


Powered by Plone CMS, the Open Source Content Management System

This site conforms to the following standards: