あおい情報システムロゴ

連想キーワード検索の特徴

日本語の文章をすばやく検索

日本語の文章から自動的に「キーワード」を抽出し、検索用インデックスを作成します。
検索のスピードは、従来の文字列検索とは比較にならないほど速くなっています。

テスト結果

Blogで公開された10万件の情報から「ヘッドフォン」を検索
(テストマシン: Windows XP、Pentium 4 1.4GHz、1.0GB RAM)

  • 従来の文字列検索 → 30件を 約18秒で検索
  • キーワード検索 → 28件を 0.01秒で検索

表記の揺らぎを包含

日本語の「揺らぎ」を同一視

「ヘッドフォン」と「ヘッドホン」など、日本語にはどちらが正しいともいえない曖昧な言葉、いわゆる「表記の揺らぎ」が多数存在します。これをキーワード検索では、同一のものとして扱えます。
「ヘッドフォン」を検索するだけで、「ヘッドホン」と記述されているデータも検索結果に表示。入力する言葉に悩む必要もなく、Hit数が少ないといった検索漏れも防ぐことができます。

検索スピードへの影響

揺らぎを同一化することによる検索スピードへの影響は、ほとんどありません。

テスト結果

(前記同条件)

  • キーワード検索
    → 28件を0.01秒で検索(ヘッドフォンのみ結果表示)
  • 連想キーワード検索
    → 52件を0.01秒で検索(ヘッドフォンとヘッドホンを結果表示)

同一視するキーワードの設定

「揺らぎ」以外の同一視設定

同一視できるのは、上記のような表記の揺れだけではありません。
検索イメージ画 例えば、

1.英語表記とカナ表記
  「ウィニー」と「Winny」
2.略称と正式名称
  「損保」と「損害保険」
3.類義語
  「家」と「住宅」

などの違いも同一の言葉として扱うことができるので、従来の文字列検索に比べて、関連性の高い情報をすばやく手に入れることができます。

同一視のキーワード数は無制限

「家」と 「住居」「部屋」「アパート」「マンション」「住まい」「建築」「ハウス」・・・

同一に扱えるキーワードの数に制限はありません。
人がひとつの言葉からいくつものキーワードを連想するように、ひとつひとつの単語を連動させていけるので、より人の思考に近い検索が可能です。

連想キーワードの管理は簡単

キーワードのカテゴリー登録

連想キーワードをカテゴリで分けて登録するだけで、後は自動的に関連付けを行います。

カテゴリ登録例

カテゴリ1 … ヘッドフォン/ヘッドホン

カテゴリ2 … ウィニー/Winny

例えば、社内ベースの検索エンジンなどで、品番と製品名を同じカテゴリーで登録するなど、用途に合わせて様々な使い方ができます。

連想キーワードの抽出

検索時の頻出キーワードや、同時に指定されたキーワード等、連想キーワードを抽出するための機能も実装予定です。

システム構築への影響

連想キーワード検索の組込み

連想キーワード検索を組込むのに、特別なシステム構築の期間は必要ありませんが、次の点にご留意ください。

  • データベースのテーブル設計時に連想キーワードに対する考慮が必要です
  • 検索部分のプログラムを決まった形式で記述する必要があります

ただし、これらはシステム構築の作業に大きな影響を与えるものではありません。

システム要件

現在の連想キーワード検索はWindows 2003 Server上にASP.NET 2.0とSQL Server 2005を用いて構築しています。
Linux/UNIX プラットフォーム上での実装および MySQL、PostgreSQL、Oracleなどの各DBについても順次対応予定です。

ページTop

価格へ

ページ終了