1.大容量のデータに対応
- 高度な並列化アーキテクチャーと言語処理能力により、数百万規模のデータに対応
- 複数ノード構成により、文書数や分析者数の増加にも対応
図1. 大量データ一括分析の
メリット(拡大図)
一般的に、マイニングはデータの母集合が大きいほど、よい分析結果を得ることができます。大量データの分析は、マイニングの重要な機能といえます。
CCAは、分析対象のデータが大容量であっても、データを細切れの集合体に分割する必要なく、一括分析します。さらに、データ量が多くてもサクサク分析できるのも大きな特長です。
将来のデータ量の増加も、心配する必要がありません。
2.高度な構文解析機能の搭載
テキスト分析でもっとも重要な機能が言語処理です。正確で有用な分析の実現には高い精度の言語処理が必要となります。
IBM東京基礎研究所において長年研究された機械翻訳技術で裏打ちされた構文解析エンジンを搭載、日本の大和ソフトウェア開発研究所を開発拠点とし、高度な日本語高い精度の構文解析を実現します。その技術は各種の学会受賞という形でアカデミックでも評価されている上、2008年に米国の顧客サポート・サービス技術団体SSPA(*)から「Innovation in Voice of Customer Award」を受賞しました。
言語処理にはオープンソース技術であるUnstructured InformationManagement Architecture(UIMA)インターフェースを採用しており、複数の業界やアプリケーションにまたがるシステム連携を可能にします。
(*) Service & Support Professionals Association (サービス/サポート・コミュニティの業界団体)
3.情報の収集から分析までの自動化
図2. テキストマイニングの
3つのステップ(拡大図)
非構造化コンテンツから必要な情報を収集し、「苦情」「質問」「修理依頼」などの属性ごとに分類し、経営に必要な情報を抽出する分析機能を、1つの製品として提供いたします。従来は、収集・分類・分析を行う機能を個別の製品として提供していましたが、世界で初めてこれらの機能を統合しました。これにより、各機能間の連携が容易になり、従来と比べ分析結果を得られるまでの期間が短縮されました。
収集できる情報は、リレーショナル・データベースやファイルサーバーに加え、ブログなどのインターネット上の書き込み(*)など、30種類以上の社内外の格納元を対象とし( (Lotus Domino®, DB2®, File Server, Webなど)、さらに200以上の情報のデータタイプ(PDF、Microsoft® WordやMicrosoft Excel®、XML/HTMLなど)を分析します。
4.充実した分析機能
1.ファセット分析

特許取得技術を利用
2.時系列分析

3.偏差分析

4.トレンド分析

5.ファセット・ペア分析

特許取得技術を利用
動的なユーザーインターフェースで、大量データをさくさく快適に分析できるのも大きな魅力です。
時系列におけるデータの出現頻度の推移を把握
動的なUI : 囲んだ領域をズームイン、ズームアウト

同じファセット内のキーワードを比較し、時系列で顕著な現象を自動検出
動的なUI : 選択したキーワードで、グラフを結合

各キーワードにける 時系列での顕著な現象を自動検出
動的なUI : 同時に複数のグラフを表示して1画面上で比較

分析対象となっているデータの実内容を、即時に表示
動的なUI :アイコンのクリックにより、さらに詳細表示

5.豊富な拡張性
- 業務アプリケーションとの連携
ポータルやコールセンターなど、さまざまな業務アプリケーションに組み込むことにより、分析結果を、確実に経営に活かすことができます。 - レポート機能の拡張
IBM Cognos® BIとの連携により、さらに充実したレポート機能を提供します。 - Business Intelligence (BI) ソフトウェアとの組み合わせにより、定型情報と非定形情報の統合分析を実現します。
- 分析結果の配信機能の拡張
IBM Cognos BIとの連携により、分析結果をさまざまな媒体に配信します。 - 分類機能の拡張
IBM Classification Module (ICM)との連携により、自己学習機能をもつ、よりインテリジェントな分類機能を組みこむことができます。
Cognos BI連携による分析レポート例1

Cognos BI連携による分析レポート例2

Cognos BI連携による分析レポート例3

Cognos BI連携による分析レポート例4

IBM、IBM ロゴ、ibm.com、Cognos、DB2、Lotus DominoおよびOmniFindは、世界の多くの国で登録されたInternational Business Machines Corp.の商標です。他の製品名およびサービス名等は、それぞれIBMまたは各社の商標である場合があります。現時点での IBM の商標リストについては、www.ibm.com/legal/copytrade.shtml (US) をご覧ください。
Microsoft および Excel は Microsoft Corporationの米国およびその他の国における商標です。
他の会社名、製品名およびサービス名等はそれぞれ各社の商標です。
