本文へジャンプ

解説

「PROVISION Winter 2007 No.52」 特集 インフォメーション・オンデマンド のご紹介

Tab navigation

テキストマイニング
- 非構造データからの知見抽出技術 -


日本アイ・ビー・エム株式会社
東京基礎研究所
Senior Technical Staff Member
武田 浩一

[プロフィール]
1983年、日本IBM入社。以後、東京基礎研究所において自然言語処理やテキストマイニングの研究開発に従事。英日機械翻訳システム「インターネット翻訳の王様」、インターネット情報収集ツール「mySiteOutliner」、テキストマイニング・ツール「IBM TAKMI」などの研究開発に貢献した。2002年には、約1,200万件のMEDLINE生医学文献抄録すべてを対象としたマイニングを実現した。現在は電子カルテなど医療情報のマイニングや新しいビジネスインテリジェンスの実現に取り組んでいる。


  インフォメーション・オンデマンド(IOD)という新しいコンセプトの下で、企業におけるより効果的でタイムリーな意思決定を可能にするべく、情報資産の活用方法が大きく変化しつつあります。特に企業内情報の85%を占めるといわれる非構造データ(テキストや画像など)の有効活用がポイントです。テキストマイニングは、このような非構造データの中心となるテキスト情報から適切な情報を抽出し、それをさまざまな統計的処理や可視化手法によって知見といえるレベルに集約する技術です。現状ではまだ人手による知見の獲得を支援する段階ですが、コンタクトセンターからライフサイエンス研究機関などに至るまでの広い範囲で応用されるようになっています。
  日本アイ・ビー・エム株式会社 東京基礎研究所では、1997年にテキストマイニングのプロジェクトをスタート。以来、多数のお客様プロジェクトを経てIBM TAKMIと呼ぶテキストマイニング・ツールを研究開発しており、学会や商業誌などの活動を通じてこの分野をリードしてきたと自負しています。2006年11月には、これまでの事例とテキストマイニングの成功の秘訣を1冊の本にまとめることができました[1]。本稿では事例を中心に、テキストマイニング技術を紹介します。