<ご参考資料>
2004年4月12日
株式会社三省堂書店
日本アイ・ビー・エム株式会社
三省堂書店が全店舗の書誌検索システムを一新
−芥川龍之介は「竜之介」でも「龍之助」でも1秒以内で検索−
株式会社三省堂書店(本社・東京都千代田区、社長・亀井忠雄)は、全国24ヶ所の店舗および営業所で利用する書誌検索システムを再構築し、日本IBM(本社・東京都港区、
社長・大歳卓麻)の検索用ソフトウェアを利用することで、書店の店頭検索端末で初めて「あいまい検索」に完全対応させました。新システムは3月22日に神田本店(神保町)
で稼動を開始し、4月8日より全店舗での稼動を開始しました。新システムの導入により、書籍検索時間が約1秒と大幅に短縮されました。そのため、神田本店では、1日約
7,800件だった検索件数が約3倍(約22,000件)に増え、お客様の利便性と販売機会が向上しました。
売場面積の拡張が続く大型書店では、書籍の在庫が150万から200万点にまで達します。このため、お客様サービスの向上を目的に、タッチパネル式の書誌検索システムを店
頭に設置し、在庫の有無から収納されている棚の位置情報までを提供するサービスが相次いで導入されてきました。著者名やタイトル等を正確に記憶していなくても検索可能にす
るためには「あいまい検索」機能が不可欠ですが、件数が膨大なため絞込みの対象を広げてしまうと、検索処理に時間がかかってしまうことが課題です。
語句の区切りが難しい日本語を検索するためのエンジンは、例えば「長野市役所」という言葉が含まれる書籍を検索できるようにするために、「長野」と「市役所」に言葉を分解
する「複合語処理」を行うことが一般的です。この場合、この書籍は「長野」というキーワードでは検索できるが「長野市」では呼び出せない、「市役所」ではひけるが「役所」
では検索対象外になるということが発生します。また、全角/半角や大文字/小文字の区別、長音「ー」の有無や、「ヂ」と「ジ」などの濁音の違いなど、表記方法が複数ある日
本語の検索はシステムの処理能力への負荷が高いとされています。
三省堂書店は、検索システムを再構築するにあたり、このような日本語検索に対応するために「Nグラム(N-gram)」方式と呼ばれる全文検索エンジンを利用した、日本
IBMのデータ高速検索ソフトウェア「DB2(R) Net Search Extender
(NSE)」を採用することで、店頭の書誌検索システムに高速のあいまい検索機能を初めて搭載しました。Nグラム方式は、長野市役所を「長野」「野市」「市役」のように、
言語的側面と無関係に、接続詞や助詞などを捨てることなく、与えられた全文字を高速検索できる形に変換・圧縮する方式です。
このため、三省堂の新システムでは「芥川龍之介」の正確な表記を忘れて「竜之介」や「龍之助」と入力しても、わずか1秒以内で芥川全著作を検索でき併せて店内在庫も表示で
きるようになりました。また読みがなで「ぜいこうかいけい」と誤入力しても「税効果会計」と正しい書名の書籍を検索できます。
三省堂の新システムは、IBM(R)のUNIX(R)サーバー「IBM
(R)
pSeries(R) 620」に搭載されたデータベース・ソフトウェア「DB2
Universal DatabaseTM」内の在庫データとDB2 NSEと検索用の書誌イン
デックスが導入されている「IBM
pSeries 630」を基盤に、株式会社セイノー情報サービス(本社・岐阜
県大垣市、社長・孫工昇嗣)が構築しました。両データベースは、ウェブ・アプリケーション・サーバー・ソフトウェア「WebSphere(R)」を介してインターネットに接続され、全国店舗の店頭タッチパネル端末や、営業所の社員用検索システムから検索でき
ます。
以 上
IBM、DB2、e-businessロゴ、
、pSeries、
WebSphere、DB2 Universal Databaseは、IBM Corporationの商標。
UNIX は、The Open Groupの米国およびその他の国における登録商標。
その他の会社名、製品名はそれぞれ各社の商標または登録商標。
<ホームページ>
日本IBMトップページ:http://www.ibm.com/jp/
プレスリリース:http://www.ibm.com/jp/NewsDB.nsf/p
ress
