|
 |
|
|
|
|
 |
| 2006年2月15日(水) |
 |
 |
現在の企業内には、日々の業務より作り出される多くのデータが蓄積されています。これらのデータは、企業経営を最適化するための貴重な情報源になります。多くの企業では、データウェアハウスやデータマートを構築して、企業活動によい判断や決定を迅速に行うために、蓄積されたデータ資産を戦略的に活用しています。これをビジネス・インテリジェンス(BI)と呼んでいます。企業の経営戦略やマーケティング・営業施策の立案に企業内外のデータを効果的に活用することは、もはや当たり前になってきています。
以前は、この仕組みを構築するのに何種類もの製品を組み合わせて、多くの時間やワークロードをかけていました。しかしながら、構築することが本来の目的ではありません。構築されたデータウェアハウスやデータマートを利用することで、PDCA (Plan/Do/Check/Action)のサイクルを回し、いかに会社の業績を上げていくことに貢献できるかということが重要になります。DB2 UDB Data Warehouse Edition (DWE)は、データウェアハウス構築・活用に必要な機能を集約してパッケージ化されているため、効果的に効率よく構築。活用が実現できます。
|
DB2 UDB Data Warehouse Edition
DB2 UDBをベースにビジネス・インテリジェンス(BI)を実現するために必要な機能とデータウェアハウス構築機能を集約したオールインワン・ソリューションです。データウェアハウス、データマートの構築・開発・運用を効率的かつ低コストで実現します。
データウェアハウス本体にはDB2 UDBを採用し、DB2とシームレスに連携するBI機能群とウェアハウス機能群を集めました。BI機能としては、フロントエンド分析ツール、OLAP(多次元分析)、データ・マイニング・ツールを装備。そしてウェアハウジング機能として、ETLツールや異種混合のデータソースからデータを抽出するための情報統合ツール、およびデータウェアハウス運用監視機能が組み込まれます。
これらの機能群は全て必要になる訳ではありません。データウェアハウスの使用目的や活用方法、システムの規模に応じて必要な機能は変わってきます。そこでDB2
UDB DWEでは、3種類の製品構成を用意しています。
|
Standard Edition
エントリーモデル、データウェアハウスおよびデータマートのインフラ構築とビジネス・インテリジェンスを実現する基本機能を装備
|
Base Edition
中規模から大規模向けデータウェアハウスおよびデータマートのインフラ構築とOLAP機能に特化したコンポーネント
|
Enterprise Edition
大規模データウェアハウス構築のために必要な機能を全て装備
|
| それぞれの製品に含まれる機能については、表1を参照してください。 |
 |
| コンポーネント |
概要 |
Standard
版 |
Base
版 |
Enterprise
版 |
| DB2 UDB |
実績のあるリレーショナル・データベース。データの格納、操作を行う強力なエンジン |
○*1
(WSUE) |
○*2
(ESE) |
○*2
(ESE) |
| DB2 Cube Views |
DB2データベース上に、多次元分析に適合した機能を実装 |
○ |
○ |
○ |
| DB2 Intelligent Miner Modeling |
データ・マイニング・モデルを作成する機能を提供 |
○ |
|
○ |
| DB2 Intelligent Miner Visualization |
作成済みのマイニング・モデルを入力として、結果をグラフィカルに表示 |
○ |
|
○ |
| DB2 Intelligent Miner Scoring |
マイニング・モデルを適用して、アプリケーションを実行するインターフェースを提供 |
○ |
|
○ |
| DB2 Alphablox |
DB2 Cube Viewsと連携し、Webブラウザー上での多次元分析機能や、RDBの検索インターフェースなどを実現する開発機能 |
○ |
|
○ |
| DB2 Data Partitioning Feature |
単一のサーバー内、または複数のサーバー間で複数のデータベース区分を作成。DB2
UDB Enterprise Server Editionの拡張性を向上 |
|
|
○ |
| DB2 Query Patroller |
クエリーのワークロードを監視する管理機能を提供 |
|
|
○ |
| DB2 Information Integrator |
他社データベースなど、さまざまなデータソースへの一元的なアクセスを実現(本製品に使用限定) |
|
|
○ |
ビジネス・インテリジェンスを実現するために必要なもの
ビジネス・インテリジェンスを実現するために前提となるものは、何があるでしょうか。
企業活動によりよい判断や決定を、迅速に行うために、元となる情報を得られる仕組みが必要になります。
データウェアハウスやデータマートを構築することは、そのために必要な手段となります。
それでは、データウェアハウスやデータマートを構築するためには、何が必要でしょうか。
よい判断を行う上で前提となるアウトプット(今回のシステム化の目的の1つ)を定義したら、そのアウトプットを出すために必要なインプット・データをどこから持ってくればよいのかを考えます。
元になるデータ(ソースデータ)は、基幹系システムかもしれませんし、情報系のデータかもしれません。さらに、今までは、企業内に存在しなかったデータを、新たに取り込まなくてはいけないかもしれません。ソースデータを確定したら、いつのタイミングでどのようにソースデータにアクセスしてデータを取り込むかを決めなくてはいけません。
その他、以下についても検討が必要です。
|
 |
取り込むデータソースの種類と方法(基幹系、情報系、外部データ、非構造データなど) |
 |
 |
データ統合に用いる手段と加工方法(抽出、変換、ロード、同期など) |
 |
 |
取り込み先のデータの持ち方(データウェアハウス、データマート、一時領域、メタデータなど) |
 |
 |
分析手法と方法(検索、レポート、マイニングなど) |
 |
 |
各ユーザーのアクセスする手段(ブラウザー、ポータル、デバイスなど) |
 |
|
| データウェアハウス構築における各階層(レイアー)で必要となる機能をまとめたものが、以下の概念図になります。 |
 |
 |
 |
DB2 UDBの先進テクノロジーMQTと連携
DB2 Cube Viewsは、DB2上のデータを高速に多次元分析するツールです。DB2 Cube Viewsが高速に多次元分析処理できるのは、DB2の先進テクノロジーであるマテリアライズド・クエリー・テーブル:MQT(Materialized Query Table)と連携するからです。MQTはデータを多次元分析に適応した形に集約して持つことができます。ドリルスルーを使ったレポートや非定型の分析など、分析パターンに適したデータがMQT上にあらかじめ保管されますのでハイ・パフォーマンスな多次元分析を実現します。さらに、クエリー実行時には、効果的にMQTを利用してパフォーマンスを向上させるように、SQL文を自動的に書き換えることもできます。
DB2 Cube Viewsでは、詳細データやメタデータの定義、キューブの定義などから最適なMQTを構築します。また、これらの定義・作成はウィザードを使って行います。人手で個別に作るのではなく、ウィザードが最適化されたMQTを簡単に作成するようガイドします。
|
OLAPセンター
RDBMSから分かりやすいGUIの画面を使って簡単にメタデータやキューブの定義を行うことができます。RDBMSの表、視点、列の定義情報から、どのような名称でユーザーに公開するか、ということを含めて定義していきます。定義されたマッピング情報、次元、階層、計算ロジック、ビジネス・ルールやビジネス名などは、多次元メタデータとしてDB2内部に保管されます。
保管後はメタデータを一元的に管理して情報の再利用もできるため、開発や保守の生産性が向上します。
|
多様なアプリケーションに対応
RDBMSの中にあるデータへのアクセスはSQLを介して行われます。SQLを生成するのは実績のあるさまざまな分析フロントエンド・ツールなどです。
また、Essbaseと組み合わせて、Hybrid OLAPを実行することも可能です。つまり、上位の部分は多次元データベースに、明細部分をDB2 Cube Viewsで管理することにより、明細部分データを引き出す際のパフォーマンスをアップさせることも可能となるのです。
|
最適化アドバイザー+ デザインアドバイザー
クエリー実行時のレスポンスやMQTリフレッシュのパフォーマンス向上のため、DB2
Cube Viewsは最適なMQTを構築する「最適化アドバイザー」というウィザードを提供しています。OLAPメタデータ情報や関連する表の統計情報、元の表のデータ分析などのさまざまな要素によって、最適なMQTをどのように構築すべきかの判断が変わってきます。最適化アドバイザーを使うと、MQTの集約のレベルやサイズなどを適切なガイドに従いながら設計することができます。
また、DB2 Cube Views V8.2より、DB2のデザインアドバイザーを合わせて使用することにより、どのようなSQLが実行されるのか、ということも事前に含めてMQTを設計できるようになりました。
|
データウェアハウスにおける上流〜下流工程のツールと連携
規模の大小に関わらず、データウェアハウスは、いくつものツールと連携して形成されます。データウェアハウスの構築は、一般的には、モデリング・ツール(データ・モデルを作成・管理)や、ETLツール(さまざまなデータ・ソースからデータを抽出、トランスフォーム、ロード)など、他の多くのツールを組み合わせることになります。また、データウェアハウスに保管されたデータを活用するためには、検索や分析を行うためのツールも必要となります。ここでキーとなるのが、さまざまなツールとデータウェアハウスをいかに効率よく連携して、スムーズにデータを活用していくかの仕組みです。多次元分析(OLAP)システムの構築においては、多次元メタデータを共用できることがスムーズなデータ活用実現への最初のステップとなります。(図1)
|
従来のメタデータ管理
データウェアハウスにおいて、RDBMSに接続して検索や分析を行うためには、各ツールごとにデータベースに接続して、オブジェクトを作成・操作するための定義をする必要があります。特にOLAPデータの場合はメタデータが一元的に管理されておらず、構造が複雑であるという問題があります。分析ツールでは、それぞれのツール独自の方法で多次元メタデータを定義・管理する仕組みを持ち、それぞれが個別にデータウェアハウスと連携をとることになります。従って、メタデータに変更があった場合には、個別の対応が必要となるのです。
|
DB2 Cube Viewsのメタデータ・ブリッジ
DB2 Cube Viewsによって、DB2上に構築・定義されたメタデータは、XMLファイル形式で保存し、エクスポートすることができます。そのXMLファイルは、各ツール間でやりとりすることができます。つまり、メタデータを共有できるのです。ブリッジと呼ばれるDB2と各ツールとの間で橋渡しをする製品でXMLファイルをインポートすることで、DB2で構築されたメタデータは、それぞれのツールで使用できる形のメタデータに自動的に変換されます。
DB2上で管理される多次元メタデータ情報を一元管理することにより、システム全体で整合性のとれた運用を実現することができます。複雑な多次元メタデータを各ツールごと個々に理解しながら保守していく必要がないため、メタデータ構成に変更があった場合でも容易に対応することが可能です。(図2) |
| 図1: |
高パフォーマンスを容易に実現 |
|
-分析に適したMQT(Materialized Query Table)を容易に構築- |
 |
| 図2:様々なBIツールとのシームレスな統合-メタデータの共有- |
 |
 |
| データ・マイニングを業務システムに組み入れることによって、CRMなどの領域で新しいビジネス・チャンスを発見したり、リスクを回避したりするソリューションを構築することができます。このような業務システム組込型データ・マイニング・ソリューションを構築するための製品がIntelligent Miner製品群です。 |
- DB2を使用した業務アプリケーションの一部として組み込むことができます。
- DB2のデータを直接マイニングの対象にできるため、対象データをデータウェアハウスからマイニング・システムへ抽出、ロードする必要がありません。
- DB2の全データをマイニングの対象にできるため、サンプリングでは得られない正確かつ詳細な結果を得ることができます。
- DB2の並列処理パフォーマンス、スケーラビリティーなどの特長を享受できます。
- DB2がサポートする他社主要データベースにもアクセスできます。
- DB2の管理機能が利用できます。
- アプリケーションの開発者は、使い慣れたSQLやJavaプログラム・インターフェースを使用して開発ができます。
 |
DB2 Intelligent Miner Modeling
DB2のエクステンダーとして提供され、次のマイニング・モデル作成機能が提供されます。 |
 |
 |
相関関係分析
マーケット・バスケット分析、e-コマース・サイトのサイト訪問パターン、金融商品の購入パターンの発見など |
 |
 |
デモグラフィック・クラスター分割
顧客のセグメンテーション、購買行動のパターン分析、店舗のプロファイリングなど |
 |
 |
決定木クラス判別
ダイレクト・メールへの反応予測、購買傾向予測、離反顧客の予測 |
 |
 |
変換回帰
売り上げ予測など数値予測 |
 |
DB2 Intelligent Miner Visualization
Intelligent Miner Modelingなどで作成したマイニング・モデルを入力として、相関関係分析、デモグラフィック・クラスター分割、決定木クラス判別、および変数回帰の結果を、対話的かつグラフィックに表示するためのJavaビジュアライザーです。
Intelligent Miner Visualizationは、独立したフロントエンド・ツールとして、またWebブラウザーから利用できるアプレットとしても表示機能を提供できます。
|
DB2 Intelligent Miner Scoring
DB2のエクステンダーまたはOracleカートリッジとして提供されます。アプリケーション・プログラムから、Intelligent
Miner Scoringを使用して、大規模データベースに対しても、高速でマイニング・モデルの適用を行い、セグメンテーションや予測などを実行することができます。
Intelligent Miner Modelingによって開発された全モデル、または他のアプリケーションで開発されたPMML形式のモデル、およびIntelligent
Miner for Dataの次のアルゴリズムをサポートします。 |
- ニューラル・クラスター分割
- デモグラフィック・クラスター分割
- ニューラル・クラス判別
- 決定木クラス判別
- ニューラル予測
- Radial Basic Function(RBF)予測
- 変数回帰
- 線形回帰
- ステップワイズ多項式回帰
- ロジスティック回帰*
*他のPMML対応のアプリケーションで作成されたモデルをインポートします。
Javaアプレットを使用して、メモリー内のデータに対するスコアリング機能も提供します。この機能は、データベースに記録される前の新規データに対し即座にマイニング・モデルを適用する場合に有用で、e-コマースまたはコール・センターのアプリケーションにおけるリアルタイムのマイニング活用を実現します。
 |
| オンデマンド世代のBIフロントエンド |
 |
高度なWeb用フロントエンド
Alphabloxを使用するとWebアプリケーションからDB2の分析データに簡単にアクセスできるようになります。AlphabloxはDB2
Cube Viewsで定義したキューブにもアクセスができます。操作性に優れたGUIによりインタラクティブなキューブ操作が可能です。またグラフやトラフィックライト、傾向線機能などの豊富な視覚化機能により、販売や在庫などの状況を容易に把握することができます。また、Alphabloxからスプレッドシート形式やPDF形式でデータを取り出して、報告書やメールに利用してデータ活用の幅を広げたり、画面上のデータにコメントをつけてチームのコラボレーション作業に役立てるなど、Alphabloxは充実した分析サポート機能を提供します。 |
 |
オープンスタンダード
AlphabloxはJ2EEやMDXなどの標準規格を採用しているため、エンタープライズ・アーキテクチャーに対応することが可能です。Alphabloxはコンポーネント化技術によりデータアクセスやデータ表現や分析メニューなどの機能をBloxという形で構成しています。Webアプリケーションを構成するJSPのカスタムタグとして、Bloxは使用できるようになっており、BloxによるサーバーサイドのJavaコンポーネントとクライアントサイドで実行されるスクリプトの連携は、操作性の優れた分析データへのアクセスをユーザーへ提供します。
また、Alphabloxの機能を利用するためのJSPカスタムタグは、製品に付属しているクエリービルダーという開発サポートツールを用いて生成できるので、それをコピー&ペーストするだけで手軽にアプリケーションとして実装することが可能です。また、サーブレットやJava
Beanなどを利用するWebアプリケーション開発においても、WebSphere Studio Application
Developerなどのツールを利用しAlphabloxをJSPへ組み込むことも可能です。 |
 |
業務プロセスへの統合
データウェアハウスへ蓄えられるビジネスデータは、分析データに加工され、企業レベルの意思決定に活用されます。従来は限定された部門の特定業務に限定されていた分析データへのアクセスは、Alphabloxを利用することにより、その対象を一般ユーザーの日常業務にまで拡大し、企業のビジネスプロセスの一部として分析データを活用していくことが可能になります。 |
 |
|
効率的なクエリー処理を実現
大規模なデータウェアハウスが実現されても、そこに多くのユーザーからのアクセスが集中してレスポンスが非常に遅くなったり、システムのキャパシティーを超えたりすれば、有効な活用は困難になります。
DB2 Query Patrollerはユーザーが発行したクエリーを受け取り、制御しながら、データベースに対するクエリー発行を代行します。大規模なシステムで多数のユーザーがクエリーを発行しても最適なパフォーマンスを維持します。(図3) |
 |
コスト別・優先順位別にクエリー実行を制御
データウェアハウス、データマートといった分析環境にはさまざまなユーザーがアクセスします。例えば業務担当者は比較的小規模で定型的なクエリーを発行し、業務システムと同等のレスポンスを期待します。データ・アナリストはアドホックに大規模で不定型なクエリーを発行することがありますが、緊急性は比較的高くありません。エグゼクティブやコンプライアンスなど、特に優先順位の高いユーザーからの処理もあります。
Query Patrollerは種々のクエリーの実行コストを事前に計算し、実行コストに応じて同時実行のバランスを保ちます。単純にクエリーが発行された順に処理されると、時々小規模なクエリーの応答が悪くなることがあります。Query
Patrollerにより、コストによる分類を設定し、それぞれ別のキューで実行制御されます。
コストだけでなく、データベースのユーザー・グループごとに優先順位、同時実行数、結果の最大行数などを設定することができます。
著しく大規模なクエリーを保留してオフピーク時にスケジュールしたり、ランナウェイ・クエリーの追跡や取り消しを行うことも可能です。
Query Patrollerが代行受信したクエリーの履歴を保存することができますので、各テーブル・カラム・利用者単位の使用頻度を調査し、データベースの設計へ反映させることもできます。 |
 |
コストベースによる最適化を行うDB2だからこそ実現できた、クエリー監視機能 |
 |
 |
負荷の高いクエリーを一度に投入しないなど全体のバランスを図る |
 |
 |
負荷の大きなクエリーはオフピーク時間 |
| 統計情報&実行履歴情報 |
 |
データウェアハウス/データマートの利用状況 |
 |
 |
ユーザー、テーブル、カラム、実行時の負荷情報を取得 |

|
|
|
|
|