本文へジャンプ

ヘルスケア / ライフサイエンス > ソリューション・コラム > 

ソリューション・コラム

研究開発を活性化する情報共有環境

企業がグローバル化し研究開発が国際化するにつれ情報を共有するための環境作りが活発な研究を実現する上でたいへん重要になります。
そのカギとなるのがフェデレーテッド・データベースとグリッド・コンピューティングです。




DiscoveryLink:情報共有の基盤、フェデレーテッド・データベース
情報活用の新標準:XQuery、現実になる透過的な情報共有
IBMとグリッド・コンピューティング
グリッド・コンピューティングとライフサイエンスへのインパクト



DiscoveryLink:情報共有の基盤、フェデレーテッド・データベース

IBMは1995年にData Joinerを発表して以来、異なる複数のデータソースに統合的にアクセスできる環境を発展させてきました。この技術は、オラクル、インフォーミックス、サイベース、マイクロソフトのリレーショナル・データベースやフラット・ファイルなどに対して、同じSQL文を発行してデータを透過的に検索することができます。2000年に発表されたフェデレーテッド・データベースというミドルウェアと種類が異なるデータソースに対してラッパー(wrapper)を提供するRelational Data Connectにより、透過的なアクセスが可能になりました。コンテンツ管理のDocumentumやBLASTデータに対するラッパーも用意されています。Discovery LinkとLife Science Data Connectは、IBMが開発したフェデレーテッド・データベースの技術をベースに、ライフサイエンスのデータ統合を推進するソリューションの重要な構成要素です。

フェデレーテッド・データベースは、SQL文によるクエリの変換と最適化により、複数のデータソースから共通の手法でデータを検索する仕組みを提供しています。フェデレーテッド・データベースは、個々のデータソースの状態情報を監視して接続を管理し、クエリを異なるデータベースが処理できるように分解して書き換えます。そして、クエリを最短時間で処理できるように最適化して、ラッパーに送り出します。個々のデータソースごとに用意されたラッパーは、特定のデータソースのデータ構造を、フェデレーテッド・データベース側で生成した検索結果のビューと合致するようにマッピングする役割を担っています。そしてラッパーは、フェデレーテッド・データベースから受け取ったクエリを、データソースのAPIに翻訳し、実行結果を受け取ります。データソースがフェデレーテッド・データベースのサポートしていない機能を提供していても、その機能を利用できるようにユーザー関数を定義することができます。

フェデレーテッド・データベースは、このような仕組みにより、ベンダーごとに異なるリレーショナル・データベース、JDBCやODBCではアクセスできないファイルに対して透過的なアクセスを可能にします。この環境では、オラクルのデータベースに格納されている疾病に関するデータと、Documentumで管理されている患者のテキストデータや病状の画像データをジョインして表示することもできます。利用者は、データソースのハードウェア、OS、データベースのスキーマを意識する必要がありません。また、分散環境でデータベースごとに異なる通信手段を利用していることも、意識する必要がありません。フェデレーテッド・データベースは、SQLとデータベース・エンジン自体を異なるデータソースの統合に利用しているため、既存のデータベース・アプリケーションに大きな変更を加えずに、分散したデータソースを利用することができます。さらに、このモデルでは、異なるデータソースを形成しているリレーショナル・データベース特有の機能性もデータの整合性もトランザクションの信頼性も損なうことはありません。加えて、複数のデータベース・エンジンに処理負荷を分散できますので、性能面では相乗効果を発揮させることができます。 Aventisやエーザイ等の製薬会社が採用している他、Accelrysなどのソフトウェア企業も市販パッケージとのリンクに高い関心を持っています。

DiscoveryLinkによる複数の異なるデータ・ソースへのアクセス

次へ進む
上に戻る

ソリューション・コラム
目次一覧  

参考リンク
データ統合ソリューション【Discovery Link】  
グリッド・コンピューティング