2023年02月24日
DNAデータストレージ: 次のステージへ

DNA(デオキシリボ核酸)は「自然界の記憶媒体」と呼ばれ、数十億年にわたって地球上のすべての生命に対する命令セットを正確に保存してきました。さらにDNAは、爆発的に増加するデータを管理し、将来の幾世代にもわたってアーカイブデータを保存するための鍵も握っているのです。
DNAにデジタルデータを保存するというアイデアは、半世紀以上前に生まれましたが、近年のバイオテクノロジーの進歩とゲノム解読の低コスト化により、一段と現実味が増しています。
Dave Landsmanは、ウエスタンデジタルの業界標準担当シニアディレクターであり、著名なエンジニアでもあります。過去2年にわたって、彼はウエスタンデジタルのDNAデータストレージに関する調査責任者の一人でした。
Landsmanは次のように述べています。「より多くの情報をデジタル化し、保存し、マイニングしたいという欲求から爆発的に増加したデータの保存方法を模索する中で、今日のストレージ階層を補完する新たなストレージ技術を探求する必要があります。DNAデータストレージ技術は、現実として商業的な面では未だ初期段階に過ぎません。しかし、膨大な量のデータを低コストで、数十年あるいは数世紀にわたって保存する能力が開花する可能性があります」。
2020年後半、技術リーダー企業のTwist BioscienceIlluminaMicrosoft、そしてウエスタンデジタルが共同でDNAデータストレージアライアンスを設立しました。この組織は60社以上のメンバー企業を抱えるまでに成長し、最近ではStorage Networking Industry Association(SNIA)によるSNIA Technology Affiliateに加盟しました。そこでは、アライアンスメンバーの知見とSNIAの標準化制定の経験が活かされています。
「データセンターのフロアにDNAデータストレージラックを設置できるようになるには、最終的に規格に則したエコシステムが必要になります。」とLandsmanは述べています。「DNAデータストレージアライアンスがSNIAと提携したことで、エコシステム構築の取り組みが加速するでしょう」。

DNAストレージの「ATGC」

Landsmanは、DNAデータストレージ技術が化学と生物学の構成要素に依存している様子を説明しました。
DNA分子はヌクレオチドの長い鎖からできています。各DNAヌクレオチドには塩基(アデニン、チミン、グアニン、シトシン)が含まれており、これらの塩基は、人間の細胞機構がヒトゲノムを発現させるために使用する情報をコード化しています。
ここ数十年の飛躍的な進歩により、今では塩基同士を自由に並べて結合した、合成DNA分子を作ることができるようになりました。
ファイルや画像などのデジタルオブジェクトの「1」と「0」を4つのDNA塩基にマッピングすることで、合成されたDNAは元のデジタルデータをコード化したバージョンになります。そのデータを読み取る際は、DNAシークエンシングプロセスを実行し、塩基を抽出して「1」と「0」にデコードします。

「DNAを分子レベルで操作する技術は、30年以上前から医学やその他の科学に応用されてきました。デジタルデータをDNAに保存することは、もはやSFではなく、現実になるところまで進歩しています」とLandsmanは述べています。
この技術は実用的であることが実証されています。2年前、Twist BioscienceはNetflixのBIOHACKERSシリーズの最初のエピソードをDNAに保存しています
Landsmanによれば、この技術の現時点での課題は拡張性です。「これはテック業界が得意とするところであり、今後5~10年の間に解決できるでしょう」と彼は述べています。

なぜDNAデータストレージなのか?

記憶媒体としてのDNAには多くの特徴があり、それらのおかげでゼタバイト規模のアーカイブストレージとして魅力的な選択肢になっています。
DNA密度の高さは、今日のどのメディアと比べても桁違いです。データのアーカイブに使用される最も一般的なメディアは、LTOテープカセットです。最新世代のLTO-9では、カートリッジあたり18TBまで格納できます。同じカートリッジサイズにDNAビットを詰め込むと、2エクサバイト近くものデータになります。これはLTO-9カートリッジ10万個以上に相当する容量です。
Landsmanは、DNAビットは非常に小さいことに加えて、寿命が長く、保存コストが安く、リフレッシュする必要もないと説明しています。DNA分子は、水や酸化を避けた状態で保存する限り、数千年も安定します。
また、このDNAの耐久性により、時間が経過してもアーカイブしたデータを新しいメディアに書き直す必要がなくなります。さらに、DNAのフォーマットは不変です。したがって、将来になって読み取る際に、どの世代の読み取りデバイスでも制約なく使用できます。
これらすべての要因により、記憶媒体としてのDNAは、TCOや環境に大きなメリットをもたらします。100MW(メガワット)の広大なデータセンターを次々と建設する代わりに、小さくまとまったカプセルの中に、ごくわずかなエネルギーでデータを保存することができるのです。これにより、今日私たちがデジタル化した情報の海から、価値を維持し、獲得するための新しい方法が誕生します。
合成DNAツールの製造を専門にする企業Twist Bioscienceのデータストレージ事業開発担当SVPであるSteffen Hellmold氏は、次のように述べています。「バックアップが安価にできれば、世界中であらゆるデータをバックアップするようになるでしょう」。
Hellmold氏は、DNAが長期的TCOを最小限に抑えると考えており、彼のチームは現在、合成DNAに保存するデータ用のGBスケールのチップに取り組んでいます。

DNAの中のストレージ

アナリストによる最近の調査では、「2024年までに、デジタル企業の少なくとも30%がDNAストレージを試行するようになる」と推定しています。
「DNAデータストレージの初期段階での市場には、デジタル保存、メディアとエンターテインメント、ビッグサイエンス、ビッグデータ、およびヘルスケアが含まれ、これらはすべて長期的なアーカイブ要件を抱えています」とHellmold氏は語っています。
しかし、ガラスやホログラムのようなSF的な記憶媒体の概念とは異なり、DNAストレージを現実のものとするには、バイオロジカルコンピューティングの概念について市場を啓蒙するという、別の独自な課題も伴います。
「DNAデータストレージとは、自分の音楽コレクションを愛犬にアップロードすることかと、誰かが冗談半分に尋ねてきたことがあります」とLandsmanは述べています。「私はその人に、DNAデータストレージの製造には、いかなる細胞、生物、生命体も必要とせず、使用することも創造することもしないと説明しました。 これまでのように、電磁気的または光学的メカニズムを使ってシリコンや磁性体などの材料にデジタルビットを保存する代わりに、化学的なメカニズムを使って、ビットをDNA分子に保存しているにすぎないのです」。

著者: Anne Herreria

※Western Digital BLOG 記事(AUGUST 16, 2022)を翻訳して掲載しています。原文はこちら

戻る