解読困難だったヒトゲノムの「暗黒領域」を読み解く医療技術ニュース

東京大学は、日本人健常者270人のゲノムデータを分析し、ヒトゲノムの中で暗黒領域と呼ばれる領域の1つである縦列反復配列の組成を明らかにした。

» 2023年10月04日 15時00分 公開
[MONOist]

 東京大学は2023年9月14日、日本人健常者270人のゲノムデータを分析し、ヒトゲノムの中で暗黒領域と呼ばれる領域の1つである縦列反復配列の組成を明らかにしたと発表した。

 ヒトゲノムには解読が困難な領域があり、暗黒領域と呼ばれている。暗黒領域の多くは、リピート単位が隣り合って縦列式に重複した縦列反復配列で構成されている。

 今回の研究では、1万塩基以上のDNA断片を解析したロングリードデータを用いて、ゲノム中の約200万カ所の縦列反復配列を分析した。そのうち約32万2000カ所の領域は、周辺領域よりも多様性が著しく大きかった。

キャプション 脳疾患CANVASの原因と考えるリピート伸長が存在する遺伝子RFC 1の第2イントロンに存在する複合型の縦列反復配列の例[クリックで拡大] 出所:東京大学

 また、縦列反復配列のうち、複数種のリピート単位が存在する複合型領域と単一のリピート単位が存在する単一型領域を比較したところ、複合型は単一型に比べて塩基の変化が大きいが、リピート単位と全長は短い傾向にあった。単一型は塩基の変化が少ないため、リピートが長く、より正確に複製されて全長が長くなる傾向が明らかとなった。

キャプション 複合型と単一型で分類した縦列反復配列長の分布[クリックで拡大] 出所:東京大学

 さらに詳細な分析により、縦列反復配列領域が従来の1塩基バリアントだけでなく、リピート単位での重複や縮退が高頻度で生じていることも明らかとなった。疾患に関連した縦列反復配列の伸長の特徴理解のために、重複と縮退を考慮した進化系統樹を描くことは有用と考えられる。

キャプション 脳疾患CANVASの原因遺伝子RFC 1の第2イントロンに存在する複合型の縦列反復配列の進化系統樹[クリックで拡大] 出所:東京大学

 過去には、約60個の疾患に関連して顕著に長い縦列反復配列配列が報告されているが、今回の健常者集団では、約8900カ所の領域で個人ゲノムが中央値と比べて100塩基以上長かった。特徴としては、複合型より単一型の頻度が高く、単一型は複合型より長いリピート単位が顕著に多いことが挙げられる。

キャプション 伸長が顕著な個人が存在する縦列反復配列の分析。(a)集団内における縦列反復配列が中央値に比べて最長値が100塩基以上長くなる領域の頻度を、長さの範囲および複合型と単一型で分類したヒストグラム。(b)各グループの領域におけるリピート単位の長さの分布。複合型は最長単位の長さの分布。(c)18番染色体の領域でALS罹患者において伸長する69塩基を単位とする縦列反復配列が、日本人健常者集団での分布[クリックで拡大] 出所:東京大学

 これらの領域は、疾患関連の候補領域として今後重要になると考えられる。また、縦列反復配列分布は民族的に異なる可能性があり、日本人だけでなく民族集団での調査が重要であることが示唆された。

Copyright © ITmedia, Inc. All Rights Reserved.