• ホームHome
  • 研究
  • 【研究成果】脳画像の施設間差を減らすハーモナイゼーション法の開発に成功し、多くの施設で集めた複数の疾患の脳画像をデータベース化

【研究成果】脳画像の施設間差を減らすハーモナイゼーション法の開発に成功し、多くの施設で集めた複数の疾患の脳画像をデータベース化

本研究成果のポイント

  • 異なった施設で取得した脳画像データを調和させ、均質なデータとする方法(=ハーモナイゼーション法)を開発し、多施設から集めたfMRIデータを1つのデータベースとして統合することに成功しました。
  • 本研究では、旅行被験者データと呼ばれる、同一の複数人の被験者が実際に多施設に訪れて撮像を行うことで、脳画像における施設の違い(施設間差)のうち測定方法の違いを正確に調査することが出来るデータセットを取得しました。
  • このデータセットを用いることで、複数の施設から集められた脳画像データから測定方法の違いによる施設間差のみを除去するハーモナイゼーション法を開発し、施設間差を3割程度削減することに成功しました。
  • この開発に用いられたデータを含む、多施設・多疾患の数千人規模の脳画像データをデータベースとして整備し、参加者から同意を得ているデータについてデータ使用登録者に対して公開しました(https://bicr-resource.atr.jp/decnefpro/)。
  • 本研究成果によって、施設によらずに使える精神疾患の脳回路マーカなどを、世界に先駆けて開発して、精神疾患と発達障害の診断補助および治療補助に貢献していきます。

概要

山下歩らATR脳情報通信総合研究所、広島大学、東京大学、昭和大学、京都大学、京都府立医科大学の研究グループは、機能的磁気共鳴画像(fMRI)データについて、異なった施設で取得した脳画像データを調和させ、均質なデータとする方法(=ハーモナイゼーション法)の開発に成功しました。またATR・田中沙織室長、広島大・岡本泰昌教授らは、この開発に用いられたデータを含む、多施設で多疾患の数千人規模の脳画像データをデータベースとして整備し、その一部を登録者に対して公開しました。

近年、生物医学、心理学などの分野において、論文で発表された結果が再現出来ないことが指摘されています[1]。特に、1施設で撮像された数十人程度のfMRIデータに人工知能技術である機械学習法を適用して得られた結果は、他の施設では再現できません[2]。この問題を解決するには多施設から集めた多数の脳画像データが必要ですが、計測した施設によってデータの性質が異なるという、極めて困難な問題がありました。米国Human Connectome Projectでは一つの施設から多数の脳画像データを集めて、施設間差の問題を避けていましたが、世界中のどの施設でも再現可能な結果を得るためには、施設間差を解消する必要があります。

山下らは、fMRIに有効なハーモナイゼーション法を開発し、施設間差を3割程度減らしました。まず、9人の被験者が12施設を訪れて撮像し、全部で411サンプル取得しました。この旅行被験者データと、複数の施設から集められたデータ(9施設4疾患の被験者805人から1サンプルずつ805サンプル取得)の両者を組み合わせたデータセットに、施設の違い、疾患による変容などを推定する数学的なモデルを当てはめて、測定方法の違いによる脳画像の違いのみを除去するハーモナイゼーション法を開発しました。

本研究は、生命科学の分野で権威のあるPLOS Biology誌で、論文で発表された結果の再現性に関する問題などで注目を集めているmeta-researchというセクションの論文として掲載されます。

また、本研究で使用した多施設・多疾患で収集された大規模データ(総数2,409例)を世界的にも貴重なデータベースとして構築しました。このうち、研究参加者から同意を得ている1,828例のデータについて、参加者の個人同定が行われないように十分に配慮した上で、登録した研究者に対して所定の審査を行ったのちに利用可能となる形で公開を始めました。詳細はこちら

今後は、上記のハーモナイゼーション法を公開した脳画像データなどに適用して、施設によらずに使える精神疾患の脳回路マーカなどを、世界に先駆けて開発して、精神疾患と発達障害の診断補助および治療補助に貢献していきます。

補足説明

[1] 近年、生物医学、心理学、社会科学の多くの研究結果が再現出来ない問題が報告されています。

[2] fMRIデータから分類を行う場合には、基本的に機械学習が用いられます。機械学習では過学習の問題を避けるために、一人の被験者を除いて検証用として用いる交差検証法:leave-one-subject-out cross validationやデータを10分割し、10分の9で学習し、残りの10分の1で検証を行う10-fold cross validationを用いて分類器の評価を行うことが多い。しかし、単一施設から得られた少数のサンプルに対して機械学習を適用すると、予測のインフレーションを起こす危険が、精神医学分野でも近年認識されるようになってきました。少数のデータに対する機械学習では、学習用データにおける特定の施設のfMRI装置や測定方法、実験者、参加者群などに存在する特定の傾向、あるいはノイズに対して過学習してしまう可能性が高い。例えば、脳の解剖画像から自閉スペクトラム症を判別する分類器は、開発に使われた英国の学習用データには感度も特異度も 9 割以上の高性能を示すが、日本人のデータでは5割になってしまうことが報告されています。学習用データとは全く異なる施設と被験者群からなる独立検証コホートで検証していない分類器は、科学的にも実用的にも意味が殆どないと言って過言ではありません。本研究では、多施設多疾患データには含まれていない山口大学などの完全に独立施設で撮像されたデータを用いて汎化検証を行いました。

研究支援

本研究は、国立研究開発法人日本医療研究開発機構(AMED)・「戦略的国際脳科学研究推進プログラム」の『脳科学とAI技術に基づく精神神経疾患の診断と治療技術開発とその応用』課題 JP18dm0307008 (代表 川人光男)、脳科学研究戦略推進プログラム BMI課題の『DecNefを応用した精神疾患の診断・治療システムの開発と臨床応用拠点の構築』課題JP17dm0107044(代表 川人光男)、および「戦略的国際脳科学研究推進プログラム」の『縦断的MRIデータに基づく成人期気分障害と関連疾患の神経回路の解明』課題JP18dm0307002(代表 岡本泰昌)、『人生ステージに沿った健常および精神・神経疾患の統合MRIデータベースの構築にもとづく国際脳科学連携』課題 JP18dm0307004 (代表 笠井清登)、『非線形動力学に基づく次世代AIと基盤技術に関する研究開発』課題 JP18dm0307009(代表 合原一幸)の研究として行われたものです。

一部は、内閣府 総合科学技術・イノベーション会議が主導する革新的研究開発推進プログラム(ImPACT)「脳情報の可視化と制御による活力溢れる生活の実現」、日本学術振興会科研費26120002と15J06788の助成を受けています。

論文情報

  • 掲載雑誌: PLOS Biology
  • 論文題目: Harmonization of resting-state functional MRI data across multiple imaging sites via the separation of site differences into sampling bias and measurement bias
  • 著者: Ayumu Yamashita, Noriaki Yahata, Takashi Itahashi, Giuseppe Lisi, Takashi Yamada, Naho Ichikawa, Masahiro Takamura, Yujiro Yoshihara, Akira Kunimatsu, Naohiro Okada, Hirotaka Yamagata, Koji Matsuo, Ryuichiro Hashimoto, Go Okada, Yuki Sakai, Jun Morimoto, Jin Narumoto, Yasuhiro Shimada, Kiyoto Kasai, Nobumasa Kato, Hidehiko Takahashi, Yasumasa Okamoto, Saori C Tanaka, Mitsuo Kawato, Okito Yamashita, and Hiroshi Imamizu
  • DOI: 10.1371/journal.pbio.3000042
【お問い合わせ先】

<研究内容に関すること>
(株)国際電気通信基礎技術研究所(ATR)経営統括部 企画・広報チーム
TEL: 0774-95-1176
E-mail: pr*atr.jp (注: *は半角@に置き換えてください)
https://www.atr.jp/index_j.html

<AMEDの事業に関すること>
日本医療研究開発機構 戦略推進部 脳と心の研究課
TEL: 03-6870-2222
E-mail: brain*amed.go.jp (注: *は半角@に置き換えてください)


up