医療・健康
ヒト転写因子データの未測定範囲を体系化し研究戦略を提示

ヒトの遺伝子調節を担うタンパク質である転写因子のゲノム結合データを精査し、未測定データが多数存在することを明らかにしました。これにより、データの偏りが研究や疾患理解に及ぼす影響と、今後の測定対象選択の戦略を提案しました。また、本成果を公開データベースとして整備しました。
ヒトのゲノムには約1,600種類の転写因子があり、400種類以上の組織・細胞型で遺伝子の働きを調節しています。その役割を理解するために重要な手法が、クロマチン免疫沈降シーケンス(ChIP-seq)です。しかしながら、抗体や細胞数などの制約からすべての組み合わせを網羅的に測定することは困難で、多くの重要な組織・細胞型が未測定のまま残されています。
本研究では、公開されているヒトのChIP-seqデータを大規模に解析し、十分に発現しているにもかかわらず測定されていない「未測定転写因子−組織・細胞型ペア」を体系的に定義しました。その結果、血球細胞では測定が比較的進んでいる一方、膵臓や筋肉、胎盤などでは80%以上が未測定であり、大きな研究の空白が存在することが明らかになりました。
また、他の実験データと統合解析したところ、未測定の転写因子であっても多くの遺伝子の発現に影響を及ぼしうることが示されました。これは、現在得られているデータだけでは遺伝子調節ネットワークの全体像を十分に把握できないことを意味します。さらにシミュレーション解析からは、測定順序を工夫し、初期段階から多様な転写因子を幅広く測定する戦略が、疾患関連変異の解釈を効率的に改善できることが示されました。
この研究は、未測定データがゲノム機能解析の応用研究や疾患理解に与える影響を初めて包括的に示したものであり、今後の研究資源の戦略的な活用に重要な指針を提供します。
PDF資料
プレスリリース研究代表者
筑波大学医学医療系尾崎 遼 客員准教授(兼 理化学研究所 生命機能科学研究センター チームディレクター)
筑波大学附属病院
田原 沙絵子 初期研修医
掲載論文
- 【題名】
-
Unmeasured human transcription factor ChIP-seq data shape functional genomics and demand strategic prioritization
(未測定のヒト転写因子ChIP-seqデータが機能ゲノム学に与える影響と戦略的優先順位付けの必要性) - 【掲載誌】
- Briefings in Functional Genomics
- 【DOI】
- 10.1093/bfgp/elaf016