掲載月 : 2011年12月
日々刻々と、ATMやネットバンキング、コールセンターなどから顧客に関する大量のデータが生まれ続けており、企業においてはその大量データ=「Big data(ビッグ・データ)」を活用し競争力を高めていくことが絶えず求められています。成功している企業に共通するのは、新しい商品提供や顧客サービス向上の源泉にこのBig dataを活用している点です。IBMは、チャレンジし続ける企業がより効果的にBig dataを活用できる技術を提供し続けていきます。
Big dataとは何か?
ある米国のクレジットカード会社では、昨今の金融詐欺行為や犯罪組織による資金流通を阻止するために、全世界約5億人の会員すべての利用履歴を記録し、金融犯罪防止のために不正取引の分析・検知を行うシステムを構築しています。モバイル端末など通信機器の発達により、従来の店舗購入から、コンビニエンスストアやタクシーなどの小口決済まで、クレジットカードの利用対象は拡大の一途を辿っています。それに伴いカード会社に蓄積される顧客の利用データも増加し続け、従来の分析基盤で不正取引の洗い出し処理を行おうとすると、実に1カ月近くも時間を要していました。このカード会社では、人口増加や通信機器の多様化による今後のさらなるデータ増加に備え、処理時間を抜本的に短縮できるようIBMと共同実証実験を行いました。その結果、1時間の処理を13分にまで短縮することに成功しました。それだけではなく、こうした取引の履歴データは、実は顧客の動向を最も詳細に把握できるデータでもあり、同社は金融犯罪防止だけでなく、マーケティングや顧客動向に基づいた商品開発などへの2次利用についての検討も開始しています。
このように、単に大量データを高速処理するインフラを構築するだけではなく、それを有効に活用することによって、まだ他社が実現できていない新しい付加価値やサービスを実現する、ここにBig dataの真の価値があります。
加えてここ数年は、企業が取り扱うべきデータ量は爆発的な勢いで増加を続けています。インターネット機器、非接触型認証、GPS、センサー機械などの進化によりデータの発生源が急激に多様化したため、2020年には今日の44倍のデータ量(35兆ギガバイト)に達するといわれています。その8割はテキストやログファイル、オフィス文書、インターネット上の音声や動画などの非構造化データであるともいわれており、こうしたデータは、例えばTwitterやYouTubeなどのように、リアルタイムもしくは準リアルタイムでの活用にこそ価値を持つものが多くを占めます。
Big dataの活用におけるIBMの取り組みと実績

「IBM Watsonシステム」※
このような「大量」、「多様」、「リアルタイム」を特徴とするBig dataについて、IBMでは2000年代前半から各種機関と基礎技術の共同研究を始め、実績を残してきました。例えば、米国の同時多発テロ事件に関連し当時関心の高かった国際的な金融犯罪組織への早期対処や、異常気象の続発による大型ハリケーンの襲来予測などです。これらはいずれも膨大なデータ処理を短時間に実施することが求められている例です。
また2000年代後半には、インターネットを通じた大量の情報流通が日常化し、これを日々の生活や企業活動に活用することは当たり前になりました。しかし同時に情報量が膨大になりすぎ、本当に欲しい答え、正しい答えを見つけ出すことに大変な時間と手間がかかるようにもなってきました。IBMはこうした情報氾濫時代に対応して、大量で多様なデータの中からより正確な答えを選択できる、質問応答技術に着目し研究を進めてきました。それが、究極の非構造化データともいえる「人間の言葉」を瞬時に解釈し最も近い回答を探し出すことで、「何かを知りたい」人の要求を解釈し、回答することができる質問応答システム「Deep QA」です。
自然言語の構造を理解し、数十テラバイトのデータから回答を数秒で引き出すシステムは、「Watson(ワトソン)」と名付けられ、2011年、米国のクイズ番組において、人間よりも人間の言葉を即時に理解し、コンピューターが史上初めて人間のクイズ王に勝利するという史上初の記録を樹立しました。(写真参照)
※ 幅広いカテゴリーより自然言語で出題されるクイズ内容を瞬時に理解し即座に解答する仕組みで、Big Data活用の新たな可能性を示した。
金融機関での新しいサービスの可能性
もちろん、金融機関においてもBig dataの効果的な活用は喫緊の課題です。
例えば、ある銀行が他社と差別化するため顧客サービスを向上しようとすれば、これまで以上に緻密に顧客の関心や動向をとらえることが必要になります。その結果は個人顧客を対象とすれば、預金・振替・為替などの日常取引や新しい金融商品の取引数、あるいは預け資産の変化、取引頻度や来店回数に表れるでしょう。
また法人顧客を対象とした場合には、融資業務などに如実に表れてくるでしょう。こうした顧客の興味や関心、動向変化をつぶさにとらえようとすればそのデータ量は膨大なものになります。
さらに、もしこのようなデータが収集・分析できれば、従来のような顧客層(年齢、資産形成、等々)別の見方だけでは得ることのできなかった、顧客一人一人、個別のよりきめ細かな顧客対応・営業販売施策の実現が可能になります。
カード会社の例でも触れたように、従来はこのような膨大な大量データを処理するためには数日、多ければ数カ月を要していました。しかし顧客視点に立てば、一カ月前に関心のあった商品やキャンペーンについて翌月情報を得ても、その時点では既に興味を失っているでしょう。そういった事態を防ぐために、金融機関がBig dataを効果的に経営施策に取り込んでいくためにはどのような技術的装備が必要なのでしょうか。それは、「巨大な容量」、「データの多様性への対応」、「リアルタイムにまで対応できる処理スピード」です。
まず、誰もが考えるのはデータを蓄積できる巨大な“器”が必要ということです。それもテラバイトの単位ではなく、将来的にはペタバイトまで拡張できるものであるべきでしょう。また、一人の顧客から発生するデータは取引明細のような定型的、構造的なデータから、Webサイトでの行動ログ、来店履歴、コールセンターの通話記録、またはアンケートハガキに至るさまざまで非定型なものまで、実に多種多様なものがあります。つまり、顧客という視点で多様なデータを一元に扱えることが必須となります。加えて、これらの超大量データを翌月ではなく翌日、場合によっては数時間後、数分後に処理できるスピードも必要とされます。
Big dataの将来可能性とIBMのロードマップ
図 IBMのBig dataソリューション一日に数ペタバイトのデータを処理するGoogleやFacebookは世界中に数千台規模のサーバーでシステムを構築しており、常にそれらを並列に稼働させながら何台かは故障しながらもそのサービスを継続しているといいます。およそ金融機関では考えられないような運用ですが、IBMの「Hadoop」という分散並列ソフトウェア技術では、これと同様の環境を構築することができます。Big dataの世界においては、サーバーやストレージなどのハードウェア装備は必ずしもハイエンドである必要はなく、むしろ大量であっても安価、1台あたりの可用性は低くてもそれをカバーできる技術、とにかく同時処理できるデータ量を増やすという考え方が最も重要になります。
IBMでは、2つのミドルウェア製品と1つのアプライアンス製品によりBig dataに対応するソリューションを展開しています。(図) これら3つのソリューションは、データの処理量(スルー プット)と応答速度(レイテンシー)に応じて、選択できるようになっています。またこれらにかかるコストは従来のサーバーCPUの処理能力に比例するコスト・モデルではなく、蓄積するデータ 容量に比例するモデルとなっていることで投資を抑制できる特徴を持っています。
こういった、研究開発に裏打ちされたIBMの技術と、それを踏まえて開発された新たなソリューション群を用いて、IBMでは、Big data活用を目指す金融機関の皆様をご支援し続けていきます。
掲載されている情報は2011年12月現在のものです。内容は事前の予告なしに変更する場合があります。
ソリューション情報は、すべての場合において同等の効果が得られることを意味するものではありません。効果はお客様の環境その他の要因によって異なります。
掲載内容の無断転載・複製を禁じます。
製品・サービス等詳細については、弊社もしくはIBMビジネス・パートナーの営業担当員にご相談ください。
IBM、IBMロゴ、ibm.com、IBM WatsonおよびInfoSphereは、世界の多くの国で登録されたInternational Business Machines Corp.の商標です。他の製品名およびサービス名等は、それぞれIBMまたは各社の商標である場合があります。現時点での IBM の商標リストについては、http://www.ibm.com/legal/copytrade.shtml(US)をご覧ください。

