先天性免疫異常症(IEI)は、遺伝子の病的変異により易感染性、炎症性疾患、自己免疫疾患、アレルギー、悪性疾患など様々な症状を呈する疾患です。次世代シークエンス技術(*1)の躍進により、これまでに480を超える遺伝子がIEIの疾患原因遺伝子として同定されています。IEIの遺伝子診断は、根治療法の選択や合併症を予測する上で非常に重要であり、IEI患者のQOL(*2)に大きく関わります。しかし、遺伝子パネル検査(*3)や全エクソーム解析(*4)などの標準的遺伝子検査の診断効率は30〜40%であり、遺伝子診断効率の向上は現在の課題です。
岡田賢(広島大学大学院医系科学研究科小児科学 教授)、佐倉文祥(同大学院生)らの研究グループ、金兼弘和(東京医科歯科大学大学院医歯学総合研究科発生発達病態学分野 寄附講座教授)らの研究グループ、八角高裕(京都大学大学院医学研究科小児科学 准教授)らの研究グループ、大西秀典(岐阜大学大学院医学研究科小児科学 教授)らの研究グループ、野々山恵章(防衛医科大学校小児科学 名誉教授)、今井耕輔(防衛医科大学校小児科学 教授)らの研究グループ、小原收(かずさDNA研究所 副所長)らの研究グループは、プロテオミクス(*5)とターゲットRNAシーケンス(*6)のマルチオミックス解析(*7)を用いて、IEI患者における遺伝子診断効率を向上させることに成功しました。
本研究は、国立研究開発法人日本医療研究開発機構(AMED)難治性疾患実用化研究事業のサポートを受けて実施いたしました。
本研究成果は、2023年3月28日(火)に「PNAS Nexus」で公開されました。
【背景】
先天性免疫異常症(IEI)は、遺伝子の病的変異により免疫不全症、炎症性疾患、自己免疫疾患、アレルギー、悪性疾患など様々な症状を呈する疾患です。次世代シークエンス技術の躍進により、これまでに480を超える遺伝子がIEIの原因遺伝子として同定されています。IEIの遺伝子診断は、疾患の予後予測や根本的治療法提供のために必要で、IEI患者のQOLに大きく関わります。しかし、遺伝子パネル検査や全エクソーム解析など現在広く行われている遺伝子検査の診断効率は30〜40%であり、遺伝子診断効率の向上は現在の課題です。
遺伝子はヒトの体を作る設計図に相当するもので、DNA(いわゆる遺伝子)がmRNAへ転写され、mRNAがタンパクへ翻訳されることで初めて生体内での機能を獲得します(概要図参照)。多くの疾患はタンパクの機能異常によって発症するため、遺伝子の異常を調べる遺伝子検査だけでは発症原因が見逃されてしまう症例が存在します。このことが、遺伝子検査の診断効率が低くなる主な原因です。近年、mRNAを解析するRNAシーケンス(RNA-seq)や、タンパクを解析するプロテオミクスが様々な研究分野で注目されています。これらの研究は、設計図であるDNAの異常がmRNAやタンパクに及ぼす影響を直接調べることが可能で、遺伝子検査だけでは得られない疾患に関する情報を知ることができます。IEIの分野でも、疾患の病態理解や遺伝子診断におけるRNA-seqの有用性が知られています。しかし、プロテオミクスはさらに新しい分野であり、IEIの遺伝子診断にプロテオミクスを用いた研究はほとんどありません。RNA-seqとプロテオミクスを同時に行った(マルチオミックス解析)研究に関してはさらに少ないのが現状です。本研究は、プロテオミクスとターゲットRNA-seqの統合解析を用いて、従来の遺伝子検査で診断できなかったIEI患者の診断効率を向上させることを目的として取り組みました。
【研究成果の内容】
遺伝子パネル検査や全エクソーム解析で遺伝子診断できなかった70名のIEI患者を対象にマルチオミックス解析を行いました。その結果4名の患者で新たに原因遺伝子を同定することに成功しました。これらの患者では原因遺伝子由来のタンパク発現が著明に低下していましたが、その内2名ではmRNAの発現は正常で、mRNAとタンパクの発現量に不一致が存在することを明らかになりました(図1)。さらに、プロテオミクスとターゲットRNA-seqのデータを詳細に調べると、IEIに関連する遺伝子の約半数でmRNAとタンパクの発現量に不一致を認めました(図2)。このことは、タンパクとmRNAを同時に調べるマルチオミックス解析の重要性を示しています。
さらに我々は、B細胞やT細胞などの免疫細胞に特異的に発現している遺伝子において、タンパクとmRNAの発現量に高い相関性があることに着目し、タンパク発現量解析で免疫細胞の障害を持つ患者を同定できるのではないかと考えました。それを証明するために、B細胞やT細胞に特異的な遺伝子群の発現量に基づいてクラスタリング解析(*8)を行いました。その結果、B細胞やT細胞に異常を来す疾患で、それぞれの細胞に特異的な遺伝子群の発現量が低下していることを見いだしました(図3)。このことから、IEIの病態の中心である免疫細胞の障害もマルチオミックス解析で診断できると判断しました。
一連の結果から、マルチオミックス解析は従来の遺伝子検査で診断できなかったIEI患者における遺伝子診断効率の向上及び、IEIの病態解明に貢献できることが示されました。
【今後の展開】
本研究で、マルチオミックス解析はIEI患者の診断と病態解析に有用であることが示されました。IEI患者の遺伝子診断は適切な治療法を選択するために必要不可欠で、遺伝子診断率の向上は患者のQOL向上に大きく貢献します。IEI患者に対するマルチオミックス解析は新しい研究分野でありますが、将来的には遺伝子検査を補完する新しい技術として臨床応用されることが期待されます。
図1 プロテオミクスとターゲットRNA-seqによる疾患原因遺伝子の探索
グラフは患者毎の疾患原因遺伝子の発現量(Log2変換)を示しています。上側のグラフがプロテオミクス(タンパク)、下側のグラフがターゲットRNA-seq(T-RNA-seq)(mRNA)の結果です。黒い棒グラフがその患者の発現量を示し、発現量変化の指標をZスコア(*9)で表しています。発現量変化が大きい場合は赤字で示しています。(A)BTK欠損症、(B)XIAP欠損症、(C)ADA2欠損症、(D)LRBA欠損症。
ADA2欠損症とLRBA欠損症ではタンパクとmRNAの発現量に不一致が認められました。
図2 IEI関連遺伝子のタンパク-mRNA相関解析
IEI関連遺伝子におけるタンパクとmRNA発現量の相関係数を解析しました。(A)スピアマン相関係数(*10)の分布を示したグラフです。多くの遺伝子が相関係数>0で、正の相関を示します。(B)相関係数に従って相関の強さを分類すると、半数以上(58.6%)の遺伝子が「弱い相関」あるいは「相関なし」でタンパクとmRNAの発現量に不一致を示します。
図3 クラスタリング解析による免疫細胞機能障害の探索
図はクラスタリング解析とヒートマップ(*11)を組み合わせたものです。B細胞やT細胞に特徴的なタンパクの発現パターンで、発現量が少ないもの(青)、発現量が多いもの(赤)を分類すると全体的に発現量が少ない群(免疫細胞が障害された群)が分離されます(赤枠)。(A)B細胞障害群、(B)T細胞障害群。
*1:次世代シークエンス:DNAやRNAの塩基配列(A, T (RNAはU), C, G)を決定(シーケンス)する技術の一つで、従来のサンガー法よりも高速かつ大量のデータを取得することができます。一度に数百万ものDNA分子の配列情報を取得することが可能で、多くの遺伝子変異を発見できることから様々な研究分野で活用されています。遺伝子パネル検査や全エクソーム解析も次世代シークエンスを利用した解析方法です。また、RNAシーケンスもこの技術を応用した解析方法で、配列情報に加えて発現量の情報を得る事もできます。
*2:QOL:Quality of Lifeの略称で、生活の質や生命の質を表す言葉です。一般的には患者の状態を測るための指標として用いられることが多く、身体的、精神的、社会的活動を含めた総合的な活力、満足度などが判断基準となります。
*3:遺伝子パネル検査:次世代シークエンスを用いた遺伝子解析手法の一つです。目的に応じたいくつかの遺伝子(遺伝子パネル)の配列情報を網羅的に調べる方法で、医療分野で応用されています。本研究における遺伝子パネル検査は先天性免疫異常症(IEI)の原因になることが分かっている遺伝子を網羅的に調べる方法です。
*4:全エクソーム解析:DNA(いわゆる遺伝子)は、ヒトの体内で様々な機能を担うタンパクの設計図となります。DNAがmRNAに転写され、mRNAがタンパクに翻訳されることで機能を発揮します。DNAがmRNAに転写される過程でDNAの一部分が除去され、残った部分がエクソンと呼ばれ、エクソンがつなぎ合わされてmRNAが完成します。このエクソン領域の配列情報を次世代シーケンスで調べる方法を全エクソーム解析と言います。遺伝子変異の中でも、タンパク翻訳に影響を与えるmRNAの配列情報を効率よく検出できることから、先天性免疫異常症を含む難病領域の医療に広く用いられています。
*5:プロテオミクス:プロテオーム解析とも呼ばれ、マススペクトロメトリーという測定技術を利用して非常に多くのタンパクを網羅的に測定する方法です。遺伝子は転写、翻訳されてタンパクになることで初めて機能を獲得します。遺伝子パネル検査や全エクソーム解析はDNAの配列情報の変化がタンパク機能へ影響するという予測しかできませんが、プロテオミクスは生体内で機能するタンパクがどのくらい存在しているのかを明らかにすることができます。それによって病気の発症に関わるタンパクの異常を見つけることができるため、近年様々な分野で注目されています。
*6:ターゲットRNAシーケンス:RNAシーケンスは次世代シーケンスを用いてmRNAの配列情報と発現量を網羅的に調べる方法です。また、mRNAはDNAが転写されて生じる配列のため、転写物の構造変化も調べることができます。ターゲットRNAシーケンスは遺伝子パネルと同様に、目的の(ターゲット)遺伝子群をシーケンスすることでより正確な情報を得ることができます。本研究はIEIの責任遺伝子群と、免疫細胞に特徴的な遺伝子群(総計530遺伝子)をターゲットとしています。
*7:マルチオミックス解析:人体の遺伝子からなる物質を、一つひとつではなく全て一括して調べる方法です。DNA(ゲノミクス)、RNA(トランスクリプトミクス)、タンパク(プロテオミクス)など、これらを包括的に解析することで一つの解析では得られないような重要な情報が得られるため多くの生命科学研究分野で注目されています。
*8:クラスタリング解析:大量のデータの中から似た特徴を持つデータをグループ化することで、データの構造や関係性を明らかにすることができます。例えば、様々な患者の遺伝子発現量のデータから、同じ発現パターンを示す患者群を見つけることができます。その患者群の特徴や遺伝子発現パターンを調べることによって、疾患について新たな情報を得ることができます。
*9:Zスコア:統計分析で用いられる手法で、その値が平均値からどの程度ずれているかを示す値です。絶対値が大きいほど平均値から大きくずれていることを示します。
*10:スピアマン相関係数:二つの変数間の相関の強さを測る指標です。相関係数は-1〜1の間の値をとり、0以上の時を正の相関(一方が増えるともう一方も増える)、0以下の時を負の相関(一方が増えるともう一方が減る)と言います。また、明確な基準はありませんが、絶対値の大きさにより相関の強さを表すことができ、1に近いほど相関が強く、0に近いほど相関が弱くなります。
*11:ヒートマップ:数値データの大小を見易くするために色の濃淡で表した図です。
本研究では、タンパク発現量の数値を色と濃淡でスケーリングしています。クラスタリング解析と組み合わせることで、発現パターン(色の濃淡)が似ているグループ分類を視覚的に捉え易くなるため、遺伝子発現量解析ではよく用いられる手法です。