2021年04月23日
乳がんとの闘いにAIという心強い味方

2020年3月、新型コロナウイルスによる混乱が世界を覆いつくし始めた頃、良いニュースもありました。幹細胞の最先端技術により、2人目のHIV患者が完治したのです。 また同年6月には、嚢胞性線維症(のうほうせいせんいしょう:遺伝子の変異が原因となる常染色体劣性遺伝疾患) 患者の「生活を真に改善する」 治療が可能な配合薬が研究者によって発表されました。アルツハイマー病に 「慎重に言っても希望のある」 (つまりは完治できるかもしれないと捉えて良い) 2つの方法が科学者によって発見されたとの発表もありました。 世界の目は新型コロナに集中している昨今ですが、最新医療技術によって、致死率の高い病気を終わらせるための戦いは、絶え間なく続いています。

John Shepherd 博士は、乳がんがこれに続くことを願っているデータサイエンティストです。

Shepherd 博士は、ハワイ大学の疫学・人間科学の教授です。彼は最新の研究で、マンモグラフィ(乳房のX線写真)検査から疾患の有無や、進行状態を示す目安となるバイオマーカー(生理学的指標)を見極めるため、AIを活用しています。 彼は、2012年に乳がんの研究を始めました。この年は、くしくもCNN(Convolutional Neural Network:画像の深層学習に「畳み込み」操作を導入したもの)により、AIの画像認識技術を格段に進化させた、エポックメイキングな技術AlexNet が、ImageNet コンテストにて優勝し、日の目を見た年です。

「AlexNet がコンテストに優勝したとき、“ビッグデータを活用して取り組める問題が、格段に広がる” ことに気がつきました。AIは、高度な計算力が求められるディープラーニングのトレーニングモデルと組み合わせて、膨大な画像データを、非常に高い精度で認識できます。AlexNet は画像処理に効果的なGPUを駆使して、この課題をクリアしたのです。

AlexNetのGPUによるアプローチは、十分な量の画像データが手元にあれば、AIの新しく高度な画像処理の技術を稼働させることを可能にしました。 当時Shepherd博士 は、サンフランシスコ大学の600万枚ものマンモグラム画像データベースを利用しており、環境は整っていました。一方で、博士がその後移ったハワイ大学は、マンモグラム画像データ量が充分ではありませんでした。しかし、だからこそ彼の移籍は非常に重要な意味を持つことになったのです。

Shepherd博士によると、「一般的な学習を行うことができるデータベースはたくさんあります。しかし、こうしたデータベースがどこから集められているかを見てみましょう。サンフランシスコ、バーモント、メイヨー・クリニック、ハーバード大学のナース・スタディ、北欧のIBIS、スウェーデンのカルマ… つまり、これらのデータベースに登録されている患者の大半(Shepherd博士によると80%)は白人です」。

このようなデータの偏りを修正することで、民族や集団によって乳がんの転帰が異なる理由を明らかにします。乳がんに対する脆弱性の高い集団がいるならば、医療従事者がどのように支援するかを考える必要があるのです。

「ハワイでは、死亡率や進行度合いの判定において、中国人女性よりもネイティブ・ハワイアンの女性が、はるかに悪い結果が出ています」 と博士。「私たちは、”なぜそうなのか?これは民族的な問題なのか? 乳房に見られる何かが、このような悪い結果を予測させるのか? それとも、向き合わなければならない社会問題なのか? こうしたシンプルな質問にさえ、登録している人が多様でなくては、答えることができません」。

このミッションは、Shepherd博士こそが適任者だったのです。

画像データの拡張 (Data augmentation)

乳がんは通常、マンモグラフィで左右の乳房が非対称であることから発覚します。しかし、人間がこの非対称性を読み取れる範囲は限られています。

Shepherd博士によると、人間の目はマンモグラムの65,000段階のうち、256段階の陰影しか見分けることができないといいます。また、人間の脳は事象を連続的に処理するため、1回の検証で複数の変数を網羅することは困難です。

「AIはまったく違います。AIは、マンモグラムの65,000の陰影をすべて見て、何千もの変数とがんの転帰との関連性を同時に比較することができる。必要なのは、モデルとなる画像を次々と与えること。“この女性は5年後にがんになったが、この女性はそうではない” といった具合に、徐々にAIがこれらの結果を示すバイオマーカーを見つけ出すのです」。

マンモグラムの中からがんを見つけるため、博士はまず、健康なX線の違いを無視できるようにAIをトレーニングします。「乳房は、それぞれ厚さ、大きさ、密度、質感が異なり、AIはそれらが必ずしも必要な要素でないことを学習しなければなりません」。

博士はまた、同じマンモグラムを、画素数、陰影、スケール、構図などのバリエーションを持たせて何度もAIに見せることで、同じ内容の画像の違いを無視できるようにAIを訓練します。 これは“augmenting(拡張)” と呼ばれる工程です。

つまり、マンモグラフィのデータベースをAIに役立てるためには、膨大な量のデータが必要です。それにもかかわらず、データに地元の女性しか含まれていなければ、地元の女性しか助けることができません。そして、マンモグラフィラフィ・データベースがある場所の地元の女性は、最も助けを必要としているとは限らないのです。

「ハワイと北カリフォルニアのハイステージ率(進行した乳がんと診断される割合)を比較すると、ハワイのハイステージ率は北カリフォルニアよりも50%ほど高くなります。”北カリフォルニアは約10%。私たちは、約15%。 全ての民族が違うハイステージ率です。グアムやミクロネシアのような地域では、この数字は50%、あるいは80%にもなる」 とShepherd博士は言います。

多くの人々に役立ててもらうには、マンモグラフィのデータベースは膨大であるだけでなく、多様性に富んでいなければなりません。科学者たちがAIを訓練するための世界中のマンモグラフィデータベースを持つことが理想ですが、実現するには、技術的障壁があります。

何よりもまず、女性を守ること、すなわち彼女たちのプライバシーを守ることが非常に重要なのです。

システムに込められた希望

Hawai’i Pacific Island Mammography Registryは、ハワイと太平洋諸島の女性に焦点を当てた、初のコンピュータ制御されたマンモグラフィデータベースです。

博士によると、太平洋諸島の人は乳がんの転帰が最も悪く、ハワイ政府がマンモグラフィに関する情報を集めて、あらゆる力を使ってこの病気と対峙する必要があるといいます。しかし、民主的にアクセス可能なマンモグラムのデータベースは、患者のプライバシーを脅かすことになるのです。

博士は、強力な技術を使ってこの問題を解決しています。まず、ハッシュ化された暗号を使って、自分や他の研究者からHIPAAの情報を守っています。事前に承認を得れば世界中の誰もがデータベースを利用することができますが、すべてのマンモグラムと臨床情報はレジストリのファイアウォールの内側に保存され、データベース専用のNvidia DGXスーパーコンピュータを通してのみアクセスすることができます。承認された研究者は、マンモグラフィデータ上でモデルを実行するために、限られた時間のみ、スーパーコンピュータを使用することができます。承認時間が過ぎると、研究者はモデルを保持できますが、マンモグラムや臨床情報は残りません。スーパーコンピューター上のすべてのデータは消去され、次のユーザーに引き継がれます。

レジストリは、患者のプライバシーを守りながら、できるだけ多くの研究者に成果を提供し、スーパーコンピュータから常に迅速なデータのやり取りを行うことができるのです。

Western Digitalは、博士に必要なツールを提供しています。まず、レジストリを保持するためのディスクスペース、そして最近ではテラバイト単位の超高速フラッシュメモリーです。

人間の目には見えない乳がんのバイオマーカーを発見する技術が存在することは喜ばしいことですが、それだけでは博士は満足していません。

「以前、動物と人間の違いについて聞いた話があります。人間は、“なぜ?”という質問をする唯一の動物だそうです。これは、人間と人工知能の違いでもある」。と博士は説明します。「もし、私たちがその”なぜ?“という問いかけを、AIに任せてしまうと、人間は何も学ばなくなってしまいます」。

今年、より多くの人々が病気という理不尽な暴力を経験したことで、多くの人が 「なぜ?」という疑問を抱くようになりました。因果関係を求める人間の欲求は、時に呪いのようにも感じられます。

しかし、人間の本質的な疑問は、一度地域社会を荒廃させた病気を克服し、生命を生み出す医学の原動力でもあるのです。また、データサイエンティストが「なぜ?」と問いかけることで、人間一人では読み切れないほどの膨大なデータから、解を導き出すことができます。Shepherd博士のような科学者は、AIのような強力なテクノロジーを活用して、乳がんに直面しているハワイの女性のために実用的な洞察を得ることができるのです。

博士の仕事は、命をおびやかされている女性のマンモグラムに意味を見出すことです。彼は太平洋諸島の女性たちには別の未来があると言います。それは、人間の目にはまだ見えない地平線の向こう側にあるのです。

著者:Sophie Dillon Sophie Dillon
※Western Digital BLOG 記事(FEBRUARY 17, 2021)を翻訳して掲載しています。原文はこちらから。

戻る