ブログ検索サイト「blogWatcher」
実は開設はまだ。夏ごろにベータ版の公開が予定されているものだが、興味深いので見ていただきたい。
HTML解析によって、RSSベースではない“ブログ収集”が可能に
blogWatcherは、平成15年度未踏ソフトウェア創造事業「blogページの自動袖手と監視に基づくテキストマイニング」によって、東京工業大学精密工学研究所の奥村研究室で開発されたものだ。現在試作版を運用中で、夏頃までにはベータ版をWebサイト上で公開したいとしている。
詳しくは上の記事を読んでもらいたいのだが、なかなか面白い。RSSベースでなく、HTMLを解析することによってできるということは・・・
blogWatcherでは、時系列に沿って書かれたコンテンツを“ブログ”と判定し、entry(記事)単位で検索することができる。その際、日付情報も取得することで、日時を指定した検索も可能だ。特徴的なのは、RSSベースの収集ではなく、HTML解析をして“ブログかどうか”を判定しているため、一般的なブログ作成ツールを利用して作成したブログでなくとも、ブログと認識して検索対象とする点だ。したがって、過去記事に対しても検索できる。
ブログツールを使ってかかれたものだけでなく時系列でかかれたコンテンツはすべてブログとみなして検索することができるということ。つまりブログツールで作られてない普通の日記サイトもすべて検索対象になるということ。
ブログツールを神格化している人はカチンと来るかも(笑)。ちなみに私は神格化とまでいかないまでも「トラックバック」という機能がある以上、日記サイトを持っている人には横のつながりを持つためにもブログツールは推したい。日記サイトがTB機能付けたら私的にはブログツールとも呼べます。
キーワードの頻度推移検索を利用すると、例えばキーワードに「Winny」で検索した場合、ブログの中で「Winny」という文字列が出現した頻度を、時系列のグラフで表示することができる。Hot Keyword検索では、プルダウンで年月を指定することにより、その月に流行した(出現頻度の多かった)キーワードを知ることができる。
いまどきの話題に取り残されないという観点で、このBlogWatcherを見ているだけでも十分。これとにらめっこしながら記事を書くだけで卒の無いコンテンツ作りができそうですよ(笑)
また、キーワード評判情報検索では、ブログの中からキーワードに対して評価をしていると分析された文字列の“良い、悪い”を識別し、表示できる。例えば、キーワードに「INTERNET Watch」と入力したとすると、「INTERNET Watchは面白い」「INTERNET Watchは最近退屈だ」「INTERNET Watchの記事数が増えてきた」といった、「INTERNET Watch」に対する評価を抜き出し、プラスマイナスの評価を自動的にするといったものだ。
これが一番の注目。本当に買いたい商品とか、店の情報に関する「人の噂」を一手に見ることができますよね。逆に怖いかも。いい物に関しては評判が評判を呼び、悪いものはとことんつるし上げ、なんてことが起こるかも。BlogWatcherが一般的に市場何かしらの影響を与えるのは間違いない、一般的になればね。
ビジネス提携を考えているようなので有料になったり、一般の人が普通に使えなくなったりするかも・・・。さらに詳しいことはBlogWatcherの「blogWatcherの特徴」の部分を読むと判ると思います。スクリーンショットとか見れます。今後、注目のため右のリンクに加えておきます~。
blogWatcher
http://www.lr.pi.titech.ac.jp/blogwatcher/