海は常に変化しています。潮の満ち引きや海流による不規則なうねりにより栄養分を運び、広大な海洋に生命が分散しています。このダイナミズムが海を魅力的なものにしていますが、同時に海の研究を困難にしているのも事実です。現在、科学者たちは、ストレージとコンピューティングの進化を活用して、海洋データを処理することにより、海のライフサイクルを探る新しい方法を見つけようとしています。それは海洋科学を変革する可能性を秘めているのです。
Marcus G.Langseth号は3,834トンの調査船です。ナショナルホッケーリーグの公式リンクのサイズよりも大きいこの船には、12の実験室があり、世界最先端の機器が装備されています。
2022年7月、この船は海洋の栄養網を調査するため、11日間にわたる科学の旅に出港しました。Langseth号には20人の乗組員とオレゴン州立大学の20人の科学者、そしてボブスレーの車体にディーゼル発電機を組み合わせたような、ユニークな水中撮影装置が搭載されていました。
このボブスレーのような装置は、In Situ Ichthyoplanktonイメージングシステム(ISIIS)と呼ばれ、科学者、エンジニア、およびソフトウェア開発者によるチームによって開発されました。このような海洋学のツールは、Amazonのようなネット通販やWalmartのようなスーパーマーケットでは入手できないので、科学者自ら設計し、組み立てる必要があります。
ISIISは海洋動物プランクトンをリアルタイムで撮影する目的で開発されました。ほとんどのプランクトンは微小な生物で大洋を漂い、潮の干満や海流によって運ばれ拡散します。その数は数兆匹に及びます。プランクトンたちが海面近くに浮上して餌を取る行動は、地球上で最大規模の生物移動と考えられており、宇宙から観測することさえできるのです。
プランクトンは、地球上のあらゆる生き物が健康に暮らすために欠かせない存在です。小さな植物プランクトンは膨大な量の酸素を作り出します。それは私たちが普段、呼吸している酸素量の半分以上にもなります。ISIISが主に撮影している動物プランクトンと合せて、海の複雑な食物網の基礎を形成しています。
しかし、プランクトンが海洋の生態系にとって重要であるにもかかわらず、海の環境がプランクトンに与える影響についてはほとんど解明されていません。ISIISチームはこの現状を変えようとしているのです。
この調査船は、ホエールウォッチングで知られるオレゴン州ニューポートの海岸沿いの町を出航しました。乗船した科学者の中には、ISIISの最新バージョンを開発した優秀な2人がいました。オレゴン州立大学ハットフィールド海洋科学センターの研究・運用担当副学長兼ディレクターであるBob Cowen氏と、彼の研究室の研究員で、多くの人から「Mo」という愛称で呼ばれているMoritz Schmid氏の2名です。
Schmid氏は機械学習が大好きな海洋学者であり生態学者でもあります。彼は、カナダ沿岸警備隊の砕氷船で数か月を過ごし、北極海のプランクトンの分布を微細なスケールで調査した経験があります。彼の夜勤は午前3時に始まります。ゴム長靴と防水ズボンを履いて、過酷な天候の中を何日もかけて機器を保守し、ネットを引き上げます。
Schmid氏は次のように述べています。「プランクトンの研究は、100年以上前からネットを使って行われてきました。このプランクトンネットを漁網のように使ってサンプルを採取し、顕微鏡で観察して異なる種の個体が何匹いるかカウントします」。
ISIISのカメラは毎分10GBの映像を撮影します
しかし、この方法には多くの制約があります。サンプルがとても小さいので微細な構造や特徴を捉えることが難しく、周囲の環境や発生に関する情報がほとんどありません。また、このプロセスは非常に手間と時間がかかり、さらに厳しいのは、例えばクラゲのように大きく、しかも壊れやすいプランクトン種には、物理的なダメージを与えてしまう恐れがあります。
ISIISのような海中イメージングシステムは非常に高い空間分解能があり、物理的に接触せずにプランクトンを研究することができるため、科学者による研究での活用が拡大しています。
ISIISは本船に曳航され、2台の最先端カメラがシャドウグラフ法により海中を撮影します。この手法では、ピンホールから光を投射すると、そこを通過する物体は影を落とします。微小なプランクトンの影を捉えることができる超高解像度の撮影をするために、ISIISはデジタルラインスキャンカメラを使用しています。通常のカメラが全体像を一度に撮影するのに対し、このカメラは海中をライン状に分割し、ラインごとに1秒あたり36,000回スキャンします。
「船は1日約100マイル航海するので、1日分の記録が100マイルもの長さの画像になります。」とSchmid氏は説明します。「1枚の巨大な画像ですが、取り扱いと処理を簡単にするために、20フレーム/秒のビデオファイルとして保存しています」。
ISIISのカメラは、毎分10GBの映像を撮影します。Langseth調査船は、実に140時間分もの高解像度映像を撮影するので、海中撮影がビッグデータの課題でもあることは容易に想像できます。
Christopher M. Sullivan氏は、オレゴン州立大学定量生命科学センターの計算科学者です。彼は、同大学で数百万、数ペタバイトの計算研究インフラストラクチャの構築と設計を支援してきました。彼はあらゆる最新技術に精通しており、差し迫った科学的問題に応えるために、相互運用性に優れた最高のアーキテクチャを手に入れる(または構築する)ことに力を注いでいます。
Sullivan氏は、ITインフラストラクチャの構築における自身の役割について、次のように述べています。「我々は単なるボタン押し係」ではありません。「何よりもまず、私は科学者であり、我々が行っているボタンを押す作業は、科学を実際に形にすることなんです」。Sullivan氏の著作本は約40冊出版されており、本の中に記された内容は9,000回以上引用されています。
Sullivan氏は、10年以上にわたりこのプランクトンプロジェクトに携わってきました。「これは最高のプロジェクトのひとつです。世の中の人工知能技術をすべて活用し、あらゆる技術を限界まで追い込み、最終的に気候変動の解決に貢献するのです。」と彼は語っています。
ISIISにおけるビッグデータの課題は、海洋でテラバイト単位の膨大なデータを収集することだけでは終わりません。データを得られるのは喜ばしいことですが、そこから深い洞察を得ることはさらに素晴らしいことなのです。
一週間の航海で、10億枚を超えるプランクトンの個体画像を手にして帰港しました。
港に戻った後、ISIISの映像データは機械学習パイプラインを通ることになります。まず、AIに海中の画像からプランクトンを認識する方法を教えました。さらに、ディープニューラルネットワークを用いて、生物学的分類に沿ってプランクトンを区分けする方法をAIに覚えさせます。最終段階では、地理空間上の位置やその他のパラメーターに関する複雑なデータを追加し、世界中の研究者が利用できる形にしました。
「一週間の航海で、10億枚を超えるプランクトンの個体の画像を手にして帰港しました。」とSullivan氏は述べました。
これはAIの威力を示す鮮やかな洗練された事例です。しかし、これほどのデータを処理するのは非常に複雑で計算負荷の高い作業になります。必要な結果を得るために、このプロジェクトは全米科学財団のXSEDEインフラストラクチャ(現在のACCESS)を活用することにしました。XSEDEは、サンディエゴ・スーパーコンピューティング・センターやピッツバーグ・スーパーコンピューティング・センターなど、米国内の主要なスーパーコンピューティングセンターとつながっています。
これらのスーパーコンピューターは、インサイトを迅速に提供することに役立ちましたが、研究が行われた時期と、科学者がその結果を手にして調査できるようになる時期との間には、残念ながら常に一定のギャップがありました。しかし、Sullivan、Schmid、Cowenの3人は、海上でこのデータをリアルタイムに見る方法を探したくてウズウズしていました。それは単に、研究、分析、結果の間のタイムラグを減らすだけでなく、科学のやり方そのものを変えることでした。「複雑なデータを海上で処理できれば、海洋科学を変革する可能性があります」。とSchmid氏は語っています。
Sullivan氏は、高機能・高性能コンピューティングの扱いに慣れていますが、新たな課題に直面しました。AIパイプラインを専有し、スクリーンから画像を飛び出させるようなGPUや各種ギアは大量の電力を消費します。しかし科学船にはスーパーコンピューターは搭載されておらず、十分な電力が備わっているわけでもありません。また、エッジ環境でのデータ処理にはさらに厳しい要件が課されます。「私たちが抱えている問題を本当の意味で解決できる人はいなかったのです」。とSullivan氏は語りました。
彼は、このつらい思いを2021年まで訴え続けていました。
2021年、ウエスタンデジタルは、過酷な環境での使用を想定したエッジサーバーUltrastar Edge-MRを発売しました。Sullivan氏はUltrastarを高く評価してくれました。このサーバーには60テラバイトの超高速NVMeフラッシュストレージが搭載されており、8K動画ファイルを余裕で保存できます。さらに40個のCPUコアとGPUユニットが備わっており、エッジでAIタスクを処理する能力があります。そして何よりも頑丈なデバイスだったのです。
ミリタリーグレードで設計されたこのエッジサーバーは、砂漠の迷彩色のボックスに収められており、衝撃、振動、電磁干渉からサーバーを保護するための内部サスペンションを備えています。また、防水、耐塵性能も認証済みです。これらは清潔で電力も十分に備わる大規模データセンターからは遠く離れた、未開の海洋で必要な機能なのです。
「このような高耐久性が本当に重要なんです」。とSullivan氏は述べています。「我々が扱っているデバイスはすべて高耐久性のもので、頑丈なボックスに収納されている必要があります」。
新たな機器を導入する際は、まずSullivan氏による綿密な検査をパスしなければなりません。
「調査船、機械、機器、労働力などの費用を考慮すると、この10日間の実験を行うには約100万ドルが必要であることを理解すべきです。」とSullivan氏は述べています。「そのデバイスにデータを保存すれば、100万ドルの付加価値がついたデータになって戻ってきます。このことを真剣に受けとめてくれる企業と提携する必要がありました」。
Sullivan氏は厳格なテストを通じて確信に至りました。RedHatやUbuntuなどのエンタープライズグレードのO/Sを簡単に実行できたり、100Gb Ethernetのネットワーク機能やRAIDの柔軟性が備わっているだけではありません。あらゆるものを実に簡単に構成できたのです。
「ウエスタンデジタルはその点を十分に考慮していました。」とSullivan氏は述べています。このサーバーをコンピュータ科学者の目の前に置くだけで、即座に稼働させることができるのですから素晴らしい技術であることは間違いありません」。
コンピュータ科学者がサーバーの電源を入れ、魔法のように命を吹き込みました。その一人がGPU計算を研究する学部生で、SullivanとSchmid両氏の教え子でもあるDominic Daprano氏でした。
これほどの多様性を目の当たりにできて感動しました。
Daprano氏はSullivan氏とともに、AIアルゴリズムに取り組みました。この時点で、AIは約170種類におよぶプランクトンを識別できるまでに訓練されていました。 「これは大規模なニューラルネットワークを用いた非常に大きな数値計算用アルゴリズムです。」とSullivan氏は説明しています。「1回に処理するプランクトンは数十億個に達します」。
しかし、実験室でセットアップしたものをリアルな世界に運び出したときに、一体何が起こるかは誰にも分かりませんでした。そこで、Daprano氏をこの航海調査に参加するよう依頼することで、海洋学的な課題にコンピュータサイエンスの専門知識を取り入れることにしたのです。
そしていよいよ、Langseth号へのセットアップが完了しました。ISIISは、数マイル長の光ファイバーケーブルで海洋観測システムを制御するコンピュータに接続され、2本目の光ファイバーケーブルでウエスタンデジタルのサーバーに映像データを転送しました。
初日の夜9時頃、乗組員らは投光ランプで照らされたISIISをクレーンで海上に下ろしました。夜勤スタッフの誰もが、管制室に身を寄せ合ってコンピュータのスクリーンに釘付けになっていました。スクリーンに画像が表示されるたびに「ウォー!」や「うわー!」などと、叫び声が合唱のように響き渡りました。
「これほどの多様性を目の当たりにできて感動しました。」とSchmidは語っています。このシステムが他に類を見ないのは、高速で移動し、大量の海水(180L s-1)を取り込むことで、際立って希少な生物サンプルを採取することができることです。この驚異的な種のモザイクを見てください」。
Cowen氏とSchmid氏にとって、船の周辺の海中で何が起きているかをほぼリアルタイムで分かることは画期的な出来事でした。
「無限の海流が広がる海では、すべてがダイナミックです」。とCowen氏は述べています。「1時間後に同じ場所に戻ったとしても、状況はまったく変わっているのです。だからこそ、即座に反応して最高の瞬間を撮影できるようにしたいのです。リアルタイムで特定のポイントを認識し、それに合わせて船の進路を変えることができるのがアダプティブサンプリングです。ターゲットをより厳密に定めると、サンプリングの効果が向上します。これは大きな進歩です」。
科学が技術を進展させると、技術は科学のイネーブラーになります。科学の新たな疑問を探求する扉を開くことができるイネーブラーです。これは、あなたや私の個人的な話ではありません。海洋の気候変動を監視し、地球が現在どのような状態にあるかを把握することなのです」。とSullivan氏は述べています。
「技術とは、科学する方法を変えることができるものであるべきです」。
著者: Ronni Shendar
※Western Digital BLOG 記事(JANUARY 10, 2023)を翻訳して掲載しています。原文はこちらから。