
当記事は、TechTargetに掲載のScale Out Network Attached Storage(SONAS) に関する同名の記事より転載しております。大容量データの管理・格納にお悩みのお客様の課題解決にお役立てください。
クラウド時代のNAS
IBMがHPC分野で培った技術を盛り込んだ“スケールアウトNAS”。クラウド技術の3要素―仮想化・標準化・自動化を兼ね備え、その上、従来のNASにないスマートな機能が盛り込まれている。
ファイルデータが急増し続けている。IDC Japanによれば、ストレージシステム需要容量の年間平均成長率は2008~2013年で49.9%だが、ファイルベースのそれは72.3%。2011年にもファイルベースとブロックベースで構成比が逆転するという。当然、NAS製品の需要は伸びるだろう。特にファイルサーバ統合やマルチメディアコンテンツの増大、ファイバーチャネル対応ストレージが担ってきた領域への浸透などにより、ミッドレンジ以上のNAS製品が相対的に伸びるとみられる。ただ、NASをエンタープライズ規模で運用すると、幾つかの問題に突き当たる。端的にいえば、「簡単にスケールアウトできない」ことである。NASは基本、1つのディスク部分に対して1つのコントローラーが稼働する(冗長構成で2つのコントローラーを搭載、両方とも稼働系にする場合もあり)。つまり、コントローラーがI/O性能、ディスク容量の限界を決する。それを超えて拡張するには、筐体を増やしてスケールアウトするか、上位製品にスケールアップするしかない。前者ではデータの分断を生み、ユーザーの使い勝手を損ない、運用管理も複雑にする。後者では本質的な解決にならず、さらなる上位製品への買い換えを強いられる。
こうした問題に対して、単一システムで拡張性に優れる"スケールアウトNAS"と呼ばれるジャンルが確立されようとしている。日本アイ・ビー・エム(以下、IBM)が2010年2月にリリースした「IBM Scale-Out NAS(SONAS)」もその1つだ。後発ながら、そこはIBMらしい先行製品をしのぐ付加価値を盛り込んでいる。
SONASの主な特徴は、(1)ディスク容量で最大14.4Pバイト、I/O性能で最大30ノードというスケーラビリティ、(2)標準搭載されたILM機能とそれを活用した階層ストレージ管理といえる。IBMでは、これこそがクラウドコンピューティング環境で求められる「仮想化」「標準化」「自動化」の三拍子を備えたストレージだとする。
1つのファイルシステムで最大10億ファイル
SONASでは、4UサイズのドロワーにHDDを60基格納し、これを最大4つ組み合わせて1つの「ストレージポッド」を形成する(コントローラーを搭載した基本ドロワーが1、2、搭載しない拡張ドロワーが0~2)。このストレージポッドを1システムで最大30まで束ねることができる。その結果、1システムで最小27Tバイト(450Gバイト SAS HDD×60)から最大14.4Pバイト(2TバイトSATA HDD×60×4×30)までスケールアウトするわけだ。
IBMによれば「14.4Pバイトは地上デジタル放送の録画で約240年分に相当する」という。それだけのディスク容量を"グローバル・ネームスペース"の下、どこを取っても均一な単一のストレージプールとして運用できる。細かく分散したストレージの管理に悩むIT担当者にとっては夢のような環境だろう。
また、1システムに格納できるファイルシステムは最大256。1ファイルシステムで最大10億ものファイルが扱える(1ファイルシステムの容量上限は2Pバイト、1システムのファイル数上限は20億)。なお、ファイルシステムには、IBMが高性能コンピューティング分野で培ったクラスタ対応ファイルシステム「GPFS(General Parallel File System)」を採用する。詳しくは後述するが、これがSONASの大きな差別化要素となっている。

IBM SONASアーキテクチャ:SONASの基本構造。最大で240個のHDDを格納する「ストレージポッド」と「インタフェースノード」を横展開することで容量・性能を拡張する
インタフェースとしては、各ストレージポッドに1あるいは2の「ストレージノード」が対応し、ポートごと20Gbpsの通信帯域を持つ高速・低遅延なInfiniBandインターコネクトを介して「インタフェースノード」とつながる。1G/10Gビットイーサネットとの接点を持つインタフェースノードは、最大30まで増やせる仕様であり、当然、どのノードからでも全データにアクセス可能である。1.44/3.84Tbpsのバックプレーン帯域を持つInfiniBandスイッチが基本ラックに組み込まれ、ノードを30まで増やしても潤沢なI/O性能が得られるだろう。
このようにSONASでは、用途によってディスク容量とI/O性能のバランスを図りながらスケールアウトできるのが特徴である。もちろん、可用性にも十分配慮している。すべてのコンポーネントが冗長構成であり(一部コンポーネントはオプションで冗長化対応)、ディスクはRAID 5/6構成が取れる。インタフェースノードが複数にわたるため、仮に一部ノードに障害が発生しても、ロードバランサやDNSラウンドロビンなどにより接続先が自動で切り替わるようにしておけば、ほかのノードを介してデータアクセスは継続される。
テープも含めた4階層のストレージ管理
スケーラビリティと並んで、SONASの魅力は、ファイルシステムのGPFSに実装されたILM機能である。ILMサーバを外付けすることなく、ストレージそのものでILMを実践できる。データ保護や運用の容易さでかなり分がある。
SONASのILM機能を使うと、ポリシー定義により、同一ディレクトリのファイルであっても物理的な格納先ディスクを自動的に分けられる(通常はディレクトリを分割して格納先を分けなければならない)。例えば、書き込み時に「作成ユーザー」や「ファイル形式」「タイトルが含むキーワード」などでファイルの格納先、格納法(ストライピングなど)を変えたり、保存後は一定期間が過ぎたり、アクセス頻度がしきい値を下回ったファイルをシステム稼働中に動的に移動させたりできる。

ILM機能 データの移動:SONASでは最大4階層のストレージ管理が可能。書き込み時にファイル属性に合わせて格納先を分けたり、アクセス頻度などのしきい値から動的に格納先を変えたりできる
つまり、SONASは"階層ストレージ管理"を容易に実現する。階層ストレージ管理では基本、アクセス頻度の高いデータを高速・高価なメディアに、アクセス頻度の低いデータは低速・廉価なメディアに格納し、ユーザー利便性とストレージコストの関係を最適化する。多くの企業ではこの考え方が取り入れられていないか、手作業や手組みプログラムでファイルを移し替えていることが多い。それがSONASを使うと自動化できるのだ。
SONASでは現在、450Gバイト SAS、1T/2Tバイト SATAと3種類のHDDをサポートしている。例えば、アクセス頻度の高いファイルは第1階層のSAS HDDで構成されるプールに置き、頻度が一定水準より下がってくれば第2階層の1Tバイト SATA、さらに下がれば、第3階層の2Tバイト SATAという運用が考えられる。さらにIBMのストレージ管理ツール「Tivoli Storage Manager(TSM)」との連携により、第4階層として外部のテープ装置を使うことも可能である。TSMはテープ装置へのファイル移動を仲介するだけでなく、ディスク上にスタブファイル(控えファイル)を残し、ユーザーが当該ファイルにアクセスしたときはテープ装置から呼び戻す。これでテープ移動後もオンライン運用でき、その上ディスク使用容量を抑えることができる。
なお、大規模ストレージでILMを実践する上で問題となりやすいのがファイルスキャンにかかる時間(システム負荷)だが、SONASは高性能スキャンエンジンを各インタフェースノードに搭載して並列実行するため、1000万ファイル/分×ノード数と非常に高速である。これならば、全社のファイルを一元管理するPバイト級ストレージでも実用的なILMを実践できそうだ。
増分バックアップのみで運用可能
高速ファイルスキャンとTSM連携は、データ保護の面でも効力を発揮する。SONAS側ではファイルスキャンで読み取った増分情報のリストをTSMサーバ(バックアップサーバ)へ送信するだけ。後はTSM側でリストを基に変更ブロックを配下のストレージに複製する。この方法ではファイルを特定するディレクトリ構造解析が不要かつ変更ブロックの複製にかかる時間を短縮しているため、一般より短いバックアップ時間で済む。加えてTSMでは、IBM独自の「永久増分バックアップ技術」により、増分バックアップの世代数が増え続けても正常なリストアが可能である。つまり、初回にフルバックアップを取得した後は常に増分バックアップで済む。大容量ストレージであっても、バックアップ時間の長さに悩まされることはないだろう。

TSMによるバックアップの高速化:各インタフェースノードにTSMクライアントをインストールしたSONASとTSMサーバが連携して増分バックアップを行う(初回のみフルバックアップ)
なお、そのほかのデータ保護機能として、ファイルシステム当たり最大255世代のスナップショットを保存できたり、メタデータとファイルデータの同期レプリケーションに対応したりしている。今後は災害復旧対策として、システム全体の非同期レプリケーションにも対応する計画である。
以上のようにSONASは、企業全体でNASを一元運用する上で必要な機能が一通りそろっている。確かに、コンテンツサービスなど一部業種を除けば、今すぐ14.4Pバイトもの容量を必要とする企業は少ないかもしれないが、SONASの最小構成は27Tバイト。これなら社内に分散しているファイルサーバやNASを統合すればすぐに埋まるという企業は少なくないはず。そしてファイルデータの激増、クラウドコンピューティング環境への移行を考えれば、NASでもスケーラビリティを重視したい。ペタバイトクラスの大容量を提供できながら、一方で、あまり使用されないファイルをすぐ取り出させる形でテープにマイグレートすることで、費用やエネルギー、発熱を抑える。今の時代にふさわしい他社にないスマートなNASだ。SONAS導入は検討してみる価値が十分にある。
IBM、IBMロゴ、ibm.comは、世界の多くの国で登録されたInternational Business Machines Corporationの商標です。他の製品名およびサービス名等は、それぞれIBMまたは各社の商標である場合があります。現時点でのIBMの商標リストについては、www.ibm.com/legal/copytrade.shtml(US)をご覧ください。
