 |
|
|
|
|
 |
テキストマイニングとは、技術論文、特許資料といった膨大な量の文書から、情報や知識を効率的に抽出するための大変高度なIT技術です。要素技術には、自然言語解析を駆使した概念抽出、マイニング技術、そして視覚化に基づいた対話処理等が活用されています。
MEDLINEで代表される大量の研究論文、医薬品特許情報が日々精力的に産み出されているライフサイエンス分野では、研究作業の効率化と研究管理支援などにテキストマイニングが大変有効と考えられています。
まず研究者にとっては、学術論文や特許を対象としたテキストマイニングを利用して、情報の海の中から効率よく有用な知識を抽出し、研究を効率的に進めることが期待できます。
次に研究管理者や企画担当者にとっては、特許や論文を対象としたテキストマイニングをおこなうことで、研究テーマ全体の管理や特許戦略の策定をより客観的な観点で検討できるようになることが期待されます。
実際、IBMのテキストマイニング・ツールMedTAKMIのデモを見学された方のコメントでも、
「すでに明らかになっている情報・知識が何か効率よく調べ、今後の可能性を追求するのに便利」、「実験系をプランする場合、大局的な立場から現状と将来の可能性を調査・分析し、実験のプライオリティ付け、分類などをおこなう手助けになる」、「非常に狭い分野では従来の検索ツールと手作業による分析でも間に合いそうだが、さらに周辺のあまり知らない分野まで広げて調査・分析しようとするとテキストマイニング・ツールは役立つ」とテキストマイニング・ツールへの期待が述べられています。 |
 |
IBMのテキストマイニング・ツールMedTAKMIは、日本アイ・ビー・エム株式会社
東京基礎研究所でのテキストマイニング研究の成果として開発されたIBM TAKMITM (Text Analysis and Knowledge Mining)をライフサイエンス分野に拡張したものです。
ライフサイエンスで著名な論文アブストラクト(約1,100万論文)であるMEDLINEを対象に稼動しています。
ゲノム創薬ベンチャー企業のセレスター・レキシコ・サイエンシズ株式会社と共同で拡張を進め、テキストマイニング・ソリューションとして提供されています。
IBM MedTAKMIはMEDLINEの大量文書を分析者と対話しながらマイニングすることにより、「医薬品Aについて、肝臓と腎臓に関連した副作用報告が顕著である。その理由は化合物Xと推定される」、あるいは「ここ4~5年で少年の糖尿病の報告が急増しており、最近1年間の投薬で多いのはAとBである」といった知識を利用者に返します。
MedTAKMIはIBM をサーバーとするクライアント・サーバー・システムで実行し、クライアントはIEになります。
|
 |
 |
 |
| * |
IBM、は、IBM Corporationの商標。 |
| * |
他の会社名、製品名およびサービス名等はそれぞれ各社の商標。 |
|
 |
|
|