東京大学は、日本人健常者270人のゲノムデータを分析し、ヒトゲノムの中で暗黒領域と呼ばれる領域の1つである縦列反復配列の組成を明らかにした。
東京大学は2023年9月14日、日本人健常者270人のゲノムデータを分析し、ヒトゲノムの中で暗黒領域と呼ばれる領域の1つである縦列反復配列の組成を明らかにしたと発表した。
ヒトゲノムには解読が困難な領域があり、暗黒領域と呼ばれている。暗黒領域の多くは、リピート単位が隣り合って縦列式に重複した縦列反復配列で構成されている。
今回の研究では、1万塩基以上のDNA断片を解析したロングリードデータを用いて、ゲノム中の約200万カ所の縦列反復配列を分析した。そのうち約32万2000カ所の領域は、周辺領域よりも多様性が著しく大きかった。
また、縦列反復配列のうち、複数種のリピート単位が存在する複合型領域と単一のリピート単位が存在する単一型領域を比較したところ、複合型は単一型に比べて塩基の変化が大きいが、リピート単位と全長は短い傾向にあった。単一型は塩基の変化が少ないため、リピートが長く、より正確に複製されて全長が長くなる傾向が明らかとなった。
さらに詳細な分析により、縦列反復配列領域が従来の1塩基バリアントだけでなく、リピート単位での重複や縮退が高頻度で生じていることも明らかとなった。疾患に関連した縦列反復配列の伸長の特徴理解のために、重複と縮退を考慮した進化系統樹を描くことは有用と考えられる。
過去には、約60個の疾患に関連して顕著に長い縦列反復配列配列が報告されているが、今回の健常者集団では、約8900カ所の領域で個人ゲノムが中央値と比べて100塩基以上長かった。特徴としては、複合型より単一型の頻度が高く、単一型は複合型より長いリピート単位が顕著に多いことが挙げられる。
これらの領域は、疾患関連の候補領域として今後重要になると考えられる。また、縦列反復配列分布は民族的に異なる可能性があり、日本人だけでなく民族集団での調査が重要であることが示唆された。
Copyright © ITmedia, Inc. All Rights Reserved.