|
テレコム業界において、競争力を確保する上で顧客や製品、それらの利潤性に関する情報が、なにより重要であると認識されるようになってきました。乱戦模様を呈する今日の環境下では、データ・ウェアハウジングを狭い意味でとらえるのではなく、データ・ウェアハウス・アプリケーションに新しい基準を適用しなければなりません。
はじめに
1996年通信改革法案の通過に伴い、米国のテレコム業界には、「混乱」とか「加速度的な変革」に加えて、「競争」という言葉が当たり前になっています。
前世紀のランド・ラッシュ以来、誰でも容易に手に入る商圏は少なくなってきました。事業者は体勢を立て直し、他を併合し、買収し、あるいは身売りし、再編成の道を辿っています。そして、RBOCに始まり長距離通信、有線、セルラ各社に至るまで、誰もが競争参入をもくろんでいるかに見えます。
この混乱期が終わったとき競争環境がどのような姿を呈しているものか、予測を試みるオブザーバは少ないようですが、いずれにしても、勝者となるのは、必ずしも技術的に最も進んだ者や、現在最も有名な事業者とは限らないことは明らかです。
新たな成功要因
トップクラスの顧客が誰で、それら顧客が何を必要とするか、また顧客を引きつけ、つなぎ止めておく手法はどんなものかといったマーケティング活動は、いっそうクリティカルな成功要因になってきました。
投資に対する見返り(ROI: return-on-investment)もまたしかりです。刻々と状況が移り変わっていく現在の環境下で、戦略的投資はそれ自身ペイし、しかも早期に回収可能なものでなくてはなりません。料金基盤の上に単純に戦略的投資を重ねていくことなど、もはや通用しません。規制緩和・自由化に伴い、料金基盤そのものが徐々に競争環境下に解放されつつあります。
したがって、テレコム各事業者は、投資に関してこれまで以上にスマートでなければなりません。一方、既に運用中のシステム基盤についても、頻繁に見直しを図り、最大限の収益を上げ得る状態にあるか、また上げているか確認していくことが必要です。
いまは行動すべき時期です。答が出るまでじっと待っている事業者は取り残されてしまいます。大きな課題は市場リーダに、そしてイノベーション・リーダになることです。出遅れたために犠牲者にならないためにも。
データ・ウェアハウスの必要性
幸いにも、過去数十年の間、自動化に邁進してきたテレコム事業者各社は、世界で最も強力な競争力の1つを備えています。それは詳細なデジタル・データです。
各顧客について、すべての通話、すべての課金処理、すべての障害受付または製品サービスの問合せなど、顧客が製品やサービスを使用する事象1つ1つが、すべてこのデジタル・データに格納されています。
多くの業界がこの種のデータを渇望している中で、テレコム事業者はふんだんにデータを保有しています。ここがポイントです。これらの情報をコスト効率よく効果的に活用するには、いったいどうすればよいでしょうか。
他の業界のほぼすべての企業同様に、テレコムの世界でも、各社がデータ・ウェアハウス・システムを評価し、あるいは積極的に配備しています。データ・ウェアハウスは、従来からの運用システムやデータベースから引き出された通話明細や加入者情報など各種データを融合し、完全で信頼できる形に変換し、情報利用者が変更や傾向を容易に識別・反映できるよう一定期間にわたり保管します。
テレコム事業者にユニークな事情
しかし、データ・ウェアハウス・ソリューションから利益を得るとなると、テレコム事業者は、独自の機会と数多くの問題に直面することになります。
本ホワイトペーパーでは、以下について検討します。
- テレコム事業者が顧客の利潤性とROIの最大化に対し前向きなスタンスをとれるよう支援するための、特定のデータ・ウェアハウス利用型ビジネス・アプリケーション。
- レガシー・システムの運用、およびテレコム事業者が利用可能な大量情報の効率的な処理など、データ・ウェアハウジング活用に関してテレコム業界に固有の要件。
- テレコム業界の情報要件に対応するために、レッドブリックがどのようにユニーク位置にいるかの具体的な詳細事項。
データ・ウェアハウジングの有用性
30年以上にわたり、テレコム業界は、信頼性確保および効率化を求めて事業運営を自動化・コンピュ−タ化してきました。今日、その自動化の副産物である世界最大の、コンスタントに補充されてきた詳細業務データの集まりを、ビジネス・インテリジェンスにどうやって変えるかが焦点となっています。
データ・ウェアハウジングは、そのようなデータすべてを利用して、事業者が向かう方向や向かうべき方向を分析するうえでの支援を提供します。さらに、プロアクティブな方法で、事業者が向かうべきところへ歩を進めるための支援を提供します。
顧客ライフサイクル管理
たとえば、Technology Research Institute1の最近の調査によれば、テレコム事業者の間では、顧客プロファイリングがデータ・ウェアハウスを導入する際の「投資最優先目標」にあがっています。この目標とは、誰が顧客になるかを知るにとどまらず、どの顧客が最も利益をもたらしてくれるのか、最も乗り換えしそうなのはどの顧客か、またつなぎ止めておきたい顧客はどの顧客か、などを掴みとることです。
この種の知識で武装すれば、事業者は製品、サービス、それにインセンティブを束ね、州立大システムや大手企業クライアントなど、最も利益を生む顧客層に狙いを定めることができます。
多くの家庭も同じ機会を提供します。現在には一軒の家に、私設電話回線、業務用回線、ファックス/モデム回線、中・高生の使用、親族間の使用、それに家庭内での携帯電話が複数回線存在することも珍しくありません。このような状況での大きな課題は、いかにして顧客の全貌を掴むかです。電話番号だけでその個人を特定することは、もはや無理です。その人とその周りとのつながりを把握し、それをトータル・ユニットとして捉える必要があります。
現在のレガシー環境では、このような顧客情報について多数のレプリカが存在し、その料金請求書はあちこちのメインフレームで作成されており、ビジネス・チャンスの「全体を写した写真」を得るのは不可能です。これに対し、データ・ウェアハウスは、事業者が顧客と顧客のつながりを把握し、事業者がもつポテンシャルを勇断をもって実行に移すことができるよう、必要な総合・広角的視野を提供することのできる統合された詳細データを格納しています。
ターゲットとされるマーケティングとサービスの高度化
ビジネス・チャンスと潜在的に利益につながる顧客グループが特定されたら、即座に利用可能な情報を活用して、ターゲットとなるダイレクト・マーケティング活動を展開し、しかもリアルタイムでその効果を測定することができます。
複数商品の同時売り込みの機会も明確にし、営業や顧客サービス、テレマーケティングそれぞれの代理店が売り込みやすいように製品・サービスをパッケージ化することができます。
いっそうスマートな投資
貴社の場合について考えてみて下さい。貴社の既存顧客を狙う競合会社が増える中で、域外の有線通信会社を買収する、またはバックヤードでのISDN回線容量拡張に投資するのが良いのでしょうか?あるいは、別のレベルでインフラに投資するため、トレンド分析を行ったり、パターンを認識したり、問題を予見したりとネットワークを最大限に活用できていますか?
顧客、製品・サービスの利潤性、ネットワーク効率・業績など、膨大な履歴データを統合することで、事業者は、投資をする上での前述の疑問点、さらには以前には抱くことすらなかった疑問点にいっそう的確に答を出すことができます。
不正使用分析および管理
銀行や保険会社などは既に不正に対し、データ・ウェアハウジングを通じて積極的に対抗手段を実施していますが、これら企業が抱えるクレジットカード不正使用や保険申請時の不正申告といった問題の大きさは、テレコム業界での料金詐欺や携帯電話不正加入・使用の問題とは比べものになりません。
これもエキスパート・システムなどの技法を使用すれば、不正が大きくなる前にピンポイント攻撃し、また管理することができます。
ビジネスの変革
これまでに示した例は、データ・ウェアハウジングの活用がいかに幅広く企業の競争力および基盤を強化できるかについてのほんの一部に過ぎません。
データ・ウェアハウジングを有効活用する利点とは、以前にアクセスできなかった情報に楽にアクセス可能になるにつれ、顧客はさらに新規アプリケーションの構想や新クエリーの定式化などをスピードアップできるようになることです。これはテレコム事業者にとっては特に重要です。
なぜなら個々のシステムの周囲にあまりにも多くのデータが散在しているため、これまで利用者は自社の事業の問題を正面から捉えていなかったというのが実情であり、現在のビジネス環境にあって、この点は改善しなければならないからです。
目で見える新しい情報を提示してデシジョン・メーカの力を引き上げることにより、データ・ウェアハウジングはもはや生残りに必須となった変革のテコ入れを支援します。
データ・ウェアハウジングの課題
データ・ウェアハウジングが解決しなくてはならない基本的な問題は、テレコム事業者も他業種も違いはありません。しかし、テレコム事業者の場合は、データの量と複雑さ/粒度の細かさにより問題は増幅されます。最近まで、このような大量のデータの取り扱いコストは大規模のデータ・ウェアハウジング構築を検討する多くのテレコム事業者にとって、行く手を阻む大障害となっていました。
多くの業界とは異なり、テレコム事業者にとって、データの確保には問題はありません。日常的に数百万という通話記録などからデータが流れ込んでくるからです。しかし、どのデータをどのくらいの期間保持しておくかが問題です。また、大部分のテレコム事業者にとって、多数の異種システムからのデータ・フローの管理も大きな課題です。
テレコム市場のデータ・ウェアハウジング・アプリケーション
マーケティング
- 顧客ライフサイクル管理
- 顧客プロファイリング
- 顧客奪回
- プロモーション分析
- 市場普及率分析
- 販売チャネル分析
- 製品・サービス利潤性
- 課金分析
- 統合化サービス分析
- ハウスホールド分析
- 乗り換え分析および予測
- クレジットカードなどの新型製品の導入および管理
業務分析
- 利用効率分析
- 供給
- サービス障害分析
- ネットワーク・トラフィックおよびプラニング
- 容量分析
- 予算分析
- 在庫分析
- 調整期間への報告義務との適合
- 財務分析
情報の津波
通常、データ・ウェアハウスは中規模サイズからスタートし、大規模サイズへと発展していきますが、テレコム業界では、最初から特大規模でスタートする傾向にあり、より多くの詳細データや履歴データが必要になったときに拡張されていきます。Technology
Research Institute2によれば、調査した大手通信事業者のうち26%が500ギガバイト以上のデータ・ウェアハウスを既に構築しており、この数字は1997年には63%に増加する模様です。
テラバイト、さらには数テラバイト級のテレコムデータベースも珍しくありません。これは、1つに長期間のトレンドを見たいという要求によるものであり、15年、20年も以前からの情報を保持している事業者もあります。また一方では個別通話を的確にドリルダウンする能力を含め、もっと詳細なデータを求める結果でもあります。
データの移動と洗浄
テレコム・データ・ウェアハウスを構築し、その情報を最新に保っておくことは、また別の課題です。一般に、所望のデータは、課金、サービス発注入力、回線開設など、いくつかの別々の運用系に分散されています。データ・ウェアハウスで活用するデータも、これらのシステムに圧倒的スピードで流入するのと同じ速度で、容易に選択的に洗浄され、データ・ウェアハウスに移動されなければなりません。
コストおよび作業負荷
しかし機会に限りはないからと言って予算が無限にあるわけではありませんから、テレコム事業者は、テクノロジを導入する時点でデータ・ウェアハウスの価格対性能比の問題に特に注意を払わなければなりません。これは有益な情報を生み出すために一般的に必要なデータ量が巨大なためであり、これほどのデータを蓄積・維持しておくことなど、従来はコストがかかりすぎて不可能でした。クライアント/サーバ型オープン、アーキテクチャ、ストレージ・コストの低下、CPUの高速化、それに機能をアップしたデータベース・エンジンなどにより様相は変わってきましたが、それでも事業者は慎重に事を運ばなければなりません。
もはや通用しない狭い考え方
技術革新のめざましい今日の環境下で、10年前からの考え方など意思決定の実行には通用しません。スマートなオープン・システム・アプローチに対し、「古い鉄製」パラダイムの上に構築されたデータ・ウェアハウスでは、適正なコストで所望レベルのエンドユーザ性能を実現することはできませんし、元来オンライン・トランザクション処理(OLTP)用に考えられたデータベース上に構築されたデータ・ウェアハウスでも多分不可能でしょう。
今日の業界がデータ・ウェアハウスに求める要件
これまでに述べてきた環境にあって効果を発揮するには、データ・ウェアハウスは下記の要件を満足しなければなりません。
- 大容量を常に高速でロードできる性能 - 最も洗練された意思決定を可能にするため、データ・ウェアハウス内の情報は絶対に最新に保たなければなりません。数億行およびギガバイト/時という尺度の初期およびインクリメンタル・ロード性能の実現こそが最も重要な要件です。
- 整合性の確保 - 様々なソースから取り込まれるデータ(特にテレコム・アプリケーションの場合)は、一貫したフォーマットに統合されて整合性の確保を示す前に洗浄され、変換されなければなりません。データ間に一貫性がないと、一貫性のない結果がもたらされ、誤った決定を生み出すことになります。
- 優れた検索性能 - 大量のデータおよび複雑さを増すアドホックなクエリーを処理するには、データ・ウェアハウスに最適化された高性能データベースが必要です。
- 多数の利用者 - 数百また数千もの同時アクセス利用者が(全社各所から)これらの複雑な、場合により対話型のクエリーを投入する訳ですから、システム性能には余裕が必要です。クエリー処理に時間がかかりすぎると、それに伴ってデータ・ウェアハウスの有用性も消滅してしまいます。
- スケーラビリティ - 利用者数増加、データの詳細化、データ量の増加に伴い、データベースのスケーラビリティが重要な要件となります。テレコム向けの意思決定支援データベースは巨大な容量にスケールアップが可能でなければならず、多くの場合超並列処理システムが必要です。
レッドブリック: データ・ウェアハウジングの申し子
レッドブリックは、テレコム事業者がまさに必要とするような、大型のビジネス・クリティカルなDWH専用に構築されたデータ・ウェアハウジング・ソリューションを提供します。OLTPデータベース上に構築されたDWHで一部のアプリケーション・ニーズを満足するケースもありますが、最適なデータ・ウェアハウジング性能を提供するには、さらに特化されたテクノロジが必要です。
データ・ウェアハウジング専用設計対OLTP
たとえば、元々OLTPアプリケーション用に設計され、その後にデータ・ウェアハウジング環境に無理に適応させられたデータベースは、以下の点で問題があります。
- システムにデータを取り込み、迅速にデータをロードし、データ品質を保証して最適なインデックスを作成すること。
- ビジネス・クエリーに迅速に応答すること、迅速な予測可能な応答時間を保証すること、アドホックなクエリーをサポートすること。
- 1つのデータベースでサマリおよび詳細データにアクセス可能な機能から、データに同時にアクセスする多数ユーザを収容可能なレベルまで、システムが拡張可能なこと。
これに対し、データ・ウェアハウスの専業であるレッドブリックのテクノロジおよび経験は、テレコム事業者に市場投入時間の短縮、高品質の実現、ユーザの生産性向上、システムの所有総コストの引き下げといった、スケーラブルな全社レベルのソリューションを提供します。
市場への製品投入時間短縮
現在の環境下で、迅速性はテレコム事業者にとって貴重な資産です。新たに開かれたビジネス・チャンスを活用し、あるいはいつも後からついて行くだけというリスクを負わないため、事業者各社はデータ・ウェアハウジングを早期に実現し、または早急に現在保有しているソリューションをアップグレードしなければなりません。さらに、市場のシェア拡大、リソースの有効利用、ROI実現およびコスト節減といったデータ・ウェアハウスのメリットが、導入したその日から発揮される事も重要です。
レッドブリックは:
- パイロット・システムをすばやく立ち上げ、コンセプト検証を迅速に実現します。
- フルスケール(実機)データ・ウェアハウスを迅速に実現します。さらに、
- データ・ウェアハウス・アプリケーション交替をスピードアップします。
セルラ、有線、PCS各業種の課題
テレコム業界の各業種は、独自の課題を抱えています。たとえば、セルラ通信事業者は、レガシー・アプリケーションからの大量データ処理という点で、地域電話会社に類似した課題をもっています。ただし顧客の乗り換えの問題や、代替回線の確保という問題は、それぞれの業種毎にユニークな問題です。このような環境下で、データ・ウェアハウジングは、それが最も多くの利益を生み出してくれる顧客を特定できるのと同じように、最も利益につながるチャネルを特定可能です。たとえば、XXXの顧客は回収率が平均以下であるとか、YYYの顧客はZZZより事業者乗り換えが速いなどといったことがわかっていれば、より多くの予備知識をもってチャネルを決定することができます。
有線サービス会社の課題
一方、有線サービス会社は別の問題を抱えています。電話会社とは異なり、有線サービス会社はあふれるほどの顧客データをもっている訳ではありません。そこで、戦略的提携を確立し、併合・買収活動を通じて、新規提携先からこのデータを取得するチャンスがありますが、バラバラなソースから得られるデータを統合するとなると、これは大きな頭痛の種です。
PCS会社の課題
PCS(Personal Communications Services)は、新しい業種であり、顧客データや利用データとなると、新米プレーヤにとって事実上ゼロからのスタートです。にもかかわらず、数十億ドルが投資され、特に携帯電話などの他の業種との顧客の取り合いが予想されます。ところがこれら潜在PCS顧客に関する分析対象データはまだないため、各社は攻撃的にデータ獲得に乗り出し、多くの場合、情報を購入しようと業界内の別業種にアプローチしています。ここでも、データの統合という問題が発生します。
同時にセルラ他の各通信事業者には、それぞれ自社の情報資源を最大限に活用して、台頭するPCSの脅威に対抗しなければならないというプレッシャがかかっています。
高品質システムの実現
データ・ウェアハウスの成否は、データベースおよびサーバ・プラットフォームだけでなく、フラット・ファイル、階層型ファイル、ネットワーク・システムや他のレガシー・アプリケーション環境など無数のソースから引き出されるデータの完全性に左右されます。
エンドユーザが生データを即アクセスできる情報に変換するには、多くのステップが必要になります。これらステップは、各種媒体からのデータの直接読み込み、データベース内部フォーマットへの変換、記録上の誤りを除去するためのフィルタリング、データ再編成、グローバルな一貫性の確保、それに整合性の確保、物理メモリへの効率的で適正な書き込み、さらにはシステム・メタデータの更新といった作業が含まれます。
レッドブリックは、これらすべてを統一されたプロセスとして実行する統合化ロード機能を提供しています。実用において、市販OLTPデータベースをベースとしたデータ・ウェアハウスの1/10以下にロード時間を短縮します。
ユーザ生産性の向上
同様に、真に効率的な対話型クエリー・アプリケーションには、アナリストの創造的思考活動をサポートするため、リアルタイムに近い応答性能が必要です。レッドブリックは、詳細さの度合いにも、同時アクセス・ユーザ数の増加にも影響を受けず、複雑な対話型のアドホックなクエリーに対し、秒単位の応答時間をサポートしています。これは、ジョイン、ソートやグルーピングなど、クエリー処理の計算集約的側面に対応した性能最適化機能を通じて実現されます。
分刻みの高品質データ生成と高性能クエリー応答性の両方を実現した結果として、エンドユーザの生産性と解答の品質向上をもたらします。
顧客プロファイル
企業ユーザ向けに、長距離通信事業者が対話型情報アクセスを提供
一連のMVSバッチ・レポーティングおよびデータ抽出システムを使用することで、ある大手長距離通信事業者は、コストのかかるメインフレーム型レポーティング・システムを対話型のレッドブリック・データ・ウェアハウスに切り替えました。
現在、同社の課金データ、通話明細データおよび顧客データは、オープンなUNIXシステム・プラットフォーム上に構築された単一800ギガバイト・データ・ウェアハウスに格納されています。処理コストは抜本的に削減され、ユーザからの要求条件変化への対応能力も飛躍的に向上し、週単位から時間単位に縮まります。企業ユーザはクリティカルな意思決定へ直接アクセスし、アドホックなクエリーを通じてデータを活用できます。
システム所有コストの低下
近年、ハードウェア・コストは下がってきましたが、データ・ウェアハウジングにはデータの格納に対してかなりの投資が必要になります。たとえば、OLTPデータベースで100ギガバイトの生データでは、最大500ギガバイトのディスク容量が必要です。これに対し、レッドブリックはデータ・ウェアハウスに最適化されているので、ハードウェア利用効率が高く、同じシナリオでの容量は130ギガバイトで十分です。
さらに、レッドブリックのデータ・ウェアハウスは操作し易いため、データベース管理面でのISサポートの必要性も少なくなっています。したがって、ISスタッフを、レポートの作成やデータベース操作ではなく別の業務に配置することができます。
エンタプライズ・ソリューションの真価
他の業界同様に、テレコム業界でのデータ・ウェアハウスも、しばしば、企業業務にソリューションがフィットするかどうかをほとんど検討しないまま、特定部門や意思決定サポート向けに設計された「ポイント」または「曲射砲」ソリューションとして実現されてきました。同時に、大型ウェアハウスも、多くの場合、比較的高価な独自仕様プラットフォーム上に構築されてきました。
レッドブリックのデータ・ウェアハウスなら、あくまでオープン標準に準拠し、全社レベルの統一データ・ウェアハウジング・ソリューションとして実現されるよう設計されていますので、UNIXオペレーティング・システムやMicrosoft
Windows NTを搭載した、デスクトップからシンメトリック・マルチプロセシング(SMP)サーバおよび超並列(MPP)システムに至るまでのプラットフォーム上で動作します。
サポートについても汎用性の高いソリューションの方が容易で、しかも時間と共にコスト効率のよい特質を発揮します。さらに重要な点は、汎用性の高いソリューションを利用することで、テレコム事業者の企業内全体にわたり、整合性のとれた情報が確実に利用可能になります。
テレコム向けのインテリジェント・ソフトウェア
データ・ウェアハウス用のインテリジェントなソフトウェアに注力することで、レッドブリックは、他のどんなデータベース・ベンダよりもデータ・ウェアハウスに必要とされるテクノロジを導入してきました。電気通信ニーズに固有な分野で、レッドブリックが提供するソリューションは、その斬新なインテリジェンスを下記テクノロジに適用しています。
- 並列処理テクノロジ
- インデックス・テクノロジ
- ロード・テクノロジ
- データ管理
- クエリーの表現性
顧客プロファイル
地域系電話会社(RBOC)、顧客の利益率確保と経費を削減
RBOCのマーケティングおよび販売グループでは、サービス提供地域または業種内の顧客収益パターンにアクセスし、長期顧客利潤性を判断し、ターゲットとなるデータベース・マーケティング・キャンペーンを実施するための方法が必要でした。レッドブリックとの協調体制を通じて、これらグループは、企業基幹データ、業務単位データ、部門別データの3層構造の意思決定支援戦略構築に成功しました。
ユーザは、ユーザ・タイプに適した多彩なフロント・エンド・ツールから、100ギガバイトのデータベースにアクセスします。
その結果、下記のような成果が得られました。
- 製品・サービス利潤性の向上
- 顧客の他社乗り換えの減少
- さらにコスト効率のよいプロモーション
並列処理テクノロジ
レッドブリックのソリューションは、SMP、MPPやクラスタ化を含む各種並列処理テクノロジを利用した大規模データ・ウェアハウスの実現を可能にします。しかし、並列処理技術は、データ・ウェアハウジング対応データベース・プラットフォームの重要な構成要素ではあるものの、OLTP用データベース・システムの限界を克服するには十分でないことも認識しておくことが大切です。
並列処理により、ユーザは、単一クエリーの処理時間の短縮を図る(スピードアップ)または性能を落とさずに別の作業を追加処理する(スケールアップ)ことができます。いずれの場合も、並列処理を成功させるにはコンピュ−タ資源(プロセッサ/ディスク)を追加投入する必要があります。計算上では、並列処理を行わずに通常500秒で実行可能なマルチテーブル・クエリーは、プロセッサ10台に分散ロードした場合、50秒で処理できることになります。しかし、常にそうなるわけではありません。
たとえばSMPシステムでは、プロセッサを追加することでオーバヘッドが追加発生し、プロセッサ正味の性能をシステムにもたらすことはできません。ある種のクエリーではスローダウンすることすらあります。これは作業者の人数(プロセッサ数)が多すぎて混乱するためにかえってスピードが落ちるのと同じです。同様に、クエリーを任意の個数に分割できない場合はプロセッサ資源の利用効率を落としてしまい、同じ作業をする作業者が多すぎるのと変わりありません。
つまり常に並列処理一本で実行することが、必ずしも最適なソリューションにはならないのです。これに対し、レッドブリックでは並列システムでパラレル・クエリー・オン・デマンドを使用しています。これは、当面のタスクが並列処理を実行することでメリットが発生するときに限り並列処理機能を起動するというやり方ですから、ある程度複雑な大型クエリーにのみ並列処理を割り当て、小型クエリーは並列処理にかけないようにすれば、システム・リソースの利用効率を最大化することができます。
実行には、それぞれの並列化可能なステップの直前で予測を行っていますので、システムは常にクエリー・サイズを正確に適応させる算定装置を持ち、クエリー毎に一度だけ静的な実行計画を立てるのではなく、自動的にシステム・リソースの動的最適化機能を利用します。
ロード操作に際し、ロード時間を最小限に抑え、限られたバッチ処理可能な時間帯にフィットさせるためには、全システム・リソースを効果的に利用する必要があります。レッドブリックは並列ロード機能を利用して、必要な場合はいつでも並列システムの処理能力を引き出し、こうしてコンピュ−タ・リソースを最大限に有効利用します。
インデックス技術
顧客および製品の行動/利潤性を分析するには、データベース・レコード・グループを選択的に特定する以上の機能が必要です。有用な洞察を得るには、今日のテレコム事業者にとって、単に「誰が」そして「いくつ」といった質問を投入するだけでは役に立ちません。選択された顧客グループが「何」をしてきたのか、その行動パターンはどうだったのか、今後何をする可能性が高いかといったことを質問として投入するには、選択的識別と高度ジョイン処理を実行可能なテクノロジとして統合化する必要があります。
レッドブリックは、TARGETindexとSTARindexを含む、高度統合化インデックス技術を開発しました。その機能を以下に示します。
- 動的最適化方式を最大限に活用して、スピーディなクエリー応答時間を実現
- 様々な範囲(低、中、高)の属性制約条件処理に比類のない柔軟性を提供
- 多数属性の制約条件をミックスおよびマッチさせるアドホックなクエリーをサポートするため、同一クエリー内で他のアクセス・テクノロジ(従来型Bツリーなど)も併用
- 処理速度を犠牲にしないでインクリメンタル・ロードおよびインデックス化処理機能をサポート
- ディスク・スペース/メモリ・サイズの最適利用を実現(たとえばTARGETindexでは従来型Bツリー・インデックスの数分の1)
ロード技術
データ・ウェアハウスに格納されたデータのほぼすべては、外部システムから引き込まれたものです。だからこそ、このデータをデータ・ウェアハウスに取り込み、完全に利用可能な形に整えるプロセスが重要になるのです。
ほとんどのデータ・ウェアハウスで、更新作業はデータのバッチ処理として行われ、毎日、または週単位などでスケジュールに従って定期的に実行されます。これらの各バッチは何十ギガバイトという巨大なもので、その中には数千万または数億の新規レコードや更新されたレコードが含まれます。
この生の外部ソース・データを意思決定のための材料に変換するために必要なステップは次のようになります。
- データは、ディスク・ファイル、ネットワーク、メインフレーム・チャネル接続、磁気テープなどの各種媒体から直接読み込まれなければなりません。
- データは、固定長/可変長のレコード、キャラクタ、バイナリ・フォーマット、IBM EBCDICデータ、パック化10進、ゾーン化10進など各種の外部表現形式から、データベースの内部フォーマットに変換されなければなりません。
- データは、無効データ値、キーのダブリ、その他誤ったレコードを除外するためフィルタリングされなければなりません。
- レコードは、外部フラットファイル表記から、データ・ウェアハウスのリレーショナル・スキーマにマッチするよう再編成されなければなりません。
- レコードは、テーブル・レベルの整合性およびグローバルな整合性を確保するため、さらには完全な参照整合性を維持するため、既存データベースと照合チェックされなければなりません(すなわち、全テーブル間整合性が常に有効であること、たとえばトランザクション詳細テーブルの顧客ID番号は顧客情報テーブル内の同一顧客ID番号カラムに整合しなければなりません)。
- レコードは、データ・セグメント化、物理デバイス配置、ディスク間平衡化など構成要件を遵守して物理メモリに書き込まれなければなりません。
- レコードは、十分にインデックス化されなければなりません(上述の通り)。
- システム・メタデータ(データに関するデータ)は更新されなければなりません。
データ・ウェアハウスの更新は、これらの全ステップが首尾よく実行されるまで完全とは言えません。このため、レッドブリックは、このような全アクティビティを統一プロセスとして実行するローディングおよびデータ表記方式を開発しました。
このプロセスは、必要なすべての管理制御およびリカバリ/リスタート機能も含んでいます。従来型OLTPリカバリ手法は、データ・ウェアハウス環境では機能的に不足です。なぜなら、一般的なデータ・ウェアハウス更新に含まれるレコード数およびデータ・ボリュームの収容が、不可能なトランザクション・ログおよびロールバック機能に依存しているからです。
したがって、データ・ウェアハウスの更新専用に特化されたリカバリおよびリスタート技術として、レッドブリックは割込みをかけられた操作がクリーンにかつスピーディに再開・完遂されるよう、チェックポイントと迅速なリスタート機能を提供しています。
顧客プロファイル
セルラ事業者、チャネル管理と製品パッケージングを改善
バッチ処理/1晩がかりのレポーティング環境に代えて、いま、100以上のユーザが、利用法に関するデータ、顧客別収益および製品混合データ、チャネル販売データ、および人口統計データを格納した200ギガバイトのレッドブリック製データ・ウェアハウスに対話方式でアクセス可能です。アナリストは事業者乗り換えや販売チャネル活動状況について迅速な見通しを得て、これから先の顧客寄与率を判断することができます。
その結果、マーケティング部門は、どの販促活動がどのサプライヤについて有効に機能しているかをよりよく理解できます。通信事業者はその製品・サービスの組み合わせをさらにうまく管理し、また販促活動の修正をスピーディに行うことで売上げを最大化することができますし、アナリストは購買パターンを予測し、それに応じてセル容量を計画することができます。
データ管理
データ管理は、ロード手順におけるデータ品質管理に始まり(前セクション参照)、データベース管理、ストレージ管理へと続きます。
前述したように、多くの場合、テレコム事業者のデータ・ウェアハウスは最初から大型規模でスタートし、そこからさらに拡張されていきます。5ギガバイト・クラスのデータベースでは日常的に行えるデータベース管理(DBM)アクティビティも、テラバイト規模のデータベースでは非現実的になります。なぜなら、5ギガバイトのデータベースで45分かかる単純なデータベース再編成も、テラバイト・クラスではほぼ1週間が必要だからです。
そこでレッドブリックはストレージ管理に新たな手法を適用し、データ再編成を不要にしました。また、いまだに残されているDBAアクティビティに対応するため、レッドブリックはモジュール管理および並列管理をサポートしています。
- モジュール管理とは、アンロード、バックアップ、リストアなどのDBAアクティビティが、グローバル整合性を維持しつつ、一回の実行ではテーブルの一部分だけに突き合わせて行なうことを言います。
- 並列管理とは、マルチプロセッサ・システム上で、データベースの異なる部分に対し同時に同じ管理操作を適用可能なことを言います。
ストレージ管理の分野では、古いデータは新しいデータに比べてアクセス頻度が低いため、古い履歴データは廉価な記憶媒体に移す方がコスト効率がよくなります。レッドブリックは、光ディスクなどの大量記憶装置、ならびにロボティックなストレージ・システムを使用した階層構造ストレージ・システム(HSM)環境をサポートしています。レッドブリックは、オフライン・デバイス上のデータの目録作成、トラッキングを行い、古いデータを低コストの光デバイスやHSMデバイスに移行させるための自動化されたメカニズムを提供します。レッドブリックは、必要なデータがSQLクエリーで参照される時点で、それを自動的にステージしオンラインで取り込みますので、ユーザはHSMデータに透過的にアクセス可能です。
クエリーの表現性
データ・ウェアハウジングに不可欠の言語であるSQLは、ユーザに豊富で複雑な要求の表現を可能にしますが、高度のビジネス分析を表現し実行するには、能力の上で欠点があります。
標準SQLが集合指向型の言語であるというところに問題があります。すべての操作は順序のない、あるいは順序が決定されていないデータ上で行われるよう定義されています。他の処理がすべて完了するまでソートは許されません。この制約があるため、標準SQLは、多くの有益なビジネス上の質問への解答の妨げになってしまいます。
たとえば、ビジネス分析で一般に行われている操作に移動平均という手法があります。移動平均の算出は平均化されるデータの順序に左右される順序依存型の演算であり、それ故に標準SQLでは実行できません。これ以外にも、ランキング、nタイル・オーダリングなどがあります。また、標準SQLは、バラツキや標準偏差といった重要な統計演算をサポートしていません。
このために、データベース結果の集合全体が、各種PCベースのツールやプログラムで再処理されながら高度の分析が、クライアント・ワークステーションに任されることになります。
レッドブリックは、「なぜ?」、「その場合は何を?」とか「どうすれば自分にできる?」といった、テレコムのアナリストがビジネス環境で提示する重要な質問に答えるための、業界で最も幅広い総合的なビジネス分析ソフトウェア・ソリューションをサポートしています。
テレコム市場で最も有用な決め手になるツールは、ユーザに、定量的またはファクトとしての情報を、製品、地理的エリア、顧客、期間などのビジネス・コンセプトを中心に構成されたデータの「ディメンショナル(次元的)」な見方として提供できるツールです。これはオンライン・アナリティック・プロセシング(OLAP)の領分です。
OLAPでは、ユーザは、製品/月毎の売上げ、州/年毎の売上げなどといった具合に、異なる視点からデータを見ることや、またこれらの視点を対話形式で切り替えることができます。ざっと見通しを立てるための検索サマリ・データに始まり、様々な細密度にわたって容易にデータを調査し、そして原因や異常事態を把握するための細密度にまでドリルダウンすることができます。
OLAPへのアプローチは2通りあり、レッドブリックはこの両方をサポートしています。
- 自己保持型多次元データベース(MDDB)システム
- リレーショナル・データベースに直接植え込まれた次元分析ツール
MDDBシステムにはサマリ・データしか記載されていません。ユーザが詳細を「ドリルダウン」しなければならない場合、SQLクエリーを介してデータ・ウェアハウス内の詳細データに直接クエリーをかけなければなりません。レッドブリック・プラットフォームは、元来、次元性というコンセプトをサポートしています。
これは、MDDB内に使用されている同じ次元的構成が、レッドブリックのリレーショナル・データベースでも利用できるということを意味し、データ・ウェアハウス内の詳細データは、MDDB内のサマリ・データとの対応が保証されていることになります。
この同じ次元的統合化は、次元的分析およびOLAPツールがリレーショナル・データベース上に直接植え込まれている場合、いっそう重要なものになります。このシナリオでは、サマリ・データと詳細データの両方に対する対話型クエリーすべてが、リレーショナル・データベースによって解答されなければならないからです。
レッドブリックは予め算出されたサマリ、他のサマリの動的な計算、および単一スキーマ設計内での詳細データの作成・維持をサポートし、どのレベルのサマリについても、対話型パフォーマンスを維持しています。
データ・ウェアハウジングの進化: 統合化データ・マイニング
テレコム業界であれ、他の業界であれ、あらゆるデータ・ウェアハウスは、ユーザ・ニーズが複雑化するにつれ、時と共に進化していくと考えられています。一般に、この進化は、だんだんと洗練・精細化されていく質問の型と、求められる解答がビジネスに与える価値の上昇との関連において、明確に区別された4段階で発生します。
- 何が起こっているか?
- なぜそれは起こったのか?
- もし何か別のことをすればどうなるか?
- 可能な最善の結果を達成するには何をすればよいか?
何が起こっているのか?
たとえば、家庭向けに2本目の電話回線を販売するマーケティング/販促活動を展開するとします。最初のレベルの質問は、普通、「追加回線を過去に何本販売したか?」、「昨年の販売実績はどうなっているか?」、「販促の結果得られた売上げ増加分は合計いくら?」といったことになるでしょう。
これらは単純な質問で、サービス発注入力システムから主にデータを引き出して、回数カウントや金額で解答が出せます。
なぜなのか?
次のステップは、「これら回線を販売した客先は?」「どのような顧客がこの製品/サービスを購入している?」、「各種人口統計グループにわたり、この販促の成功率は?」といった質問がでてきます。
マーケティング活動でこの種の見通しを得るには、サービス発注入力データに加え、顧客人口統計情報が必要です。「何が」タイプの質問に比べ、かなり多くのデータを調べる必要がありますが、それに見合った解答が得られます。
もし何か別のことをしたら?
3番目のレベルの質問では、さらに多くのデータが必要になります。たとえば使用した媒体に対する販促の利潤性を測定することにより、マーケティング活動を微調整できるようになるのです。「ラジオ、印刷物、ダイレクトメール、テレビのうち、どのメディアが最も高い利潤性を引き出したか?」、「どの人口統計市場区分、どの地理的市場区分が、どのアプローチに対し最も反応があったか?」などの質問が投入されることになります。そして、「もし転送電話機能と家庭内第2回線をバンドルした販促に切り替えていたらどうなったか?」、「10ドル値引きの約束を付け加えていたらどうなったか?」といった質問について解答を判定することで当初のコンセプトを操作することが、この段階から可能になります。
最良の活動とは、どうすればよいか?
上記に述べたすべての情報と同じくらい重要なのは、競争環境が依然として存在するという事実です。その結果、テレコム事業者のデシジョン・メーカは、益々洗練された質問を投げかけ続けることになります。具体的には、「販促を通じて最高の受注率を最もうまく達成する方法、最も売上げを伸ばす方法、最も高い利潤をあげる方法は?」、「あるいは、設置コストや人員配置、交換機容量確保などの点から、家庭内第2回線の販促が良いアイデアと言えるのか?」といった質問を投じることになります。
この種の質問に解答を得る、すなわちリソースを最大限にし、事業運営方式を変更開始するための支援となる解答を得るには、前述の全データに加えて高度なデータ・マイニング技術が必要です。
意思決定の展望を変えるデータマイニング
問題は、「入手可能な最良の方法とは?」というタイプの質問に答を出すために必要なデータは極めて広範で、極めて複雑であり、あまりにも多方面の資源から引き出されなければならないため、それらすべての入手方法を知っている者はいないということです。この場合、ユーザは直感や推量であちこちをつつきまわるのが普通で、多くの重要な関係を見落としがちです。
そこでデータ・マイニングの出番です。データ・マイニング・ソフトウェアは履歴データのあらゆる部分に存在する関係を見つけ出し、既に既知の分野だけを見るという先入観をもちません。言い換えれば、価値の高いビジネス情報の提供から推量を廃絶します。既に使用されているドリルダウン技法と組み合わせて使用すれば、ユーザは総合的なデータ分析の環境を獲得することができます。
まとめ
競争環境下でのプレッシャやビジネス・チャンスから、ますます加速するテクノロジ変革に至るまで多くの問題を抱えながら、今日のテレコム事業者は保有情報を完全・効率的に活用する必要に迫られています。したがって、何らかの形でデータ・ウェアハウジングを導入が必要なのは議論の余地がありません。
情報リソースを配備していくうえでテレコム事業者が直面する特に困難な課題として、大量データ、以前からの異種システムの融合、マイグレートされマッピングされるべき連続的なデータストリーム、ますます複雑化する分析条件などなどにより、事業者各社は、他のビジネス戦略と同様にデータ・ウェアハウジング活用についても前向きな取り組みをすることが必要不可欠になってきました。後ろ向きな考え方はもはや通用しません。
テレコム事業者にとって必要なのは、ユーザ情報に基づく予測を加速し、かつてない大量のデータを駆使してそのユーザ情報を早期に取得することであり、その時、現在のテレコム業界が置かれた環境下でのデータ・ウェアハウジングには、一般の小売業界向発想で構築されたソリューションが通用しないことを認識することです。
最適なソリューションだけが、テレコム事業者各社の情報資源を最大限に有効利用可能であり、投資への正当な見返り、すなわち市場での成功を約束できます。
脚注参照文献:
- Data Warehousing and Decision Support Systems in
Telecommunications(Technology Research Institute, Executive Summary、1995年10月、p.5)
- Data Warehousing and Decision Support Systems in
Telecommunications(Technology Research Institute, Executive Summary、1995年10月、p.8)
|