Blogot - 旅とF1と車と男の嗜み

旅とF1と車と男の嗜みをテーマとした後藤康成のブログ。

blogWatcher と GETA

blogWatcher

9月9日~10日に開催されたIPAX Autumn 2004では、基調講演やパネルディスカッションのほかに、IPAが主催する次世代ソフトウェア開発事業、未踏ソフトウェア事業などの開発成果に関する展示やプレゼンテーションが行なわれた。今回はその中からいくつか注目のソフトや技術に関する情報をお伝えしたい。

IPAX Autumn 2004 の中で blogWatcher に注目してみました。

blogWatcher は、8月16日に公開を開始した東工大・奥村研究室が運営するブログ限定サーチエンジンで、RSSのようなメタデータを必要とせず、直接HTMLをパースします。これにより検索対象のサイトがBlogサイトだけに限定されず、レガシーなWebサイトの情報も検索可能です。

特に注目したいのは、検索システムに汎用連想計算エンジン(GETA)を採用しているのも大きな特徴です。「汎用連想計算エンジン(GETA)」は、情報処理振興事業協会(IPA)が実施した「独創的情報技術育成事業」の研究成果です。GETAのは、文書検索における頻度付き索引データ(どの文書にどの単語が何回出現するというような)を典型とする大規模かつ粗な行列を対象として、文書間および単語間の類似度を高速計算するツールです。

さらに、キーワードのパース度/頻度の推移を検索、ホットキーワードの検索、キーワードの評判情報を検索などの機能も装備しており、今後注目のサーチエンジン

blogWatcher

SoftEther、blogWatcherなどIPAソフトウェア開発事業の成果