blogWatcher

ある特定のブログを検索することもあると思いますが、Googleだとブログ以外も引っかかってくるので検索しにくい場合も少なくないと思います。
下記検索サイトはブログに特化したものなので特定のブログを探すのにはたいへん便利です。

blogWatcher
http://blogwatcher.pi.titech.ac.jp/

blogWatcher
http://www.lr.pi.titech.ac.jp/blogwatcher/

現在すでに、blogの検索サービスを提供しているサイトはいくつか存在しますが、それらは、更新通知サービス(pingサーバ)やRSSなどのメタデータを利用することによって収集を行っています。これらのサービスやメタデータを利用すれば、blogツールと呼ばれるソフトウェアによって作成されているblogの収集は容易に行うことが出来ます。しかしながら、日本では、blogツールが普及する以前から、Web上にたくさんの日記が存在しました。これらは、「Web日記」、「テキスト系サイト」と呼ばれ、非常に大きなコミュニティを形成しています。これらのWeb日記は、blogとは呼ばれていませんが、内容はとてもblogと似ているという特徴を持っています。しかし、これらの「Web日記」は、Webページの一部ととして書かれることが多く、またWeb上に分散して存在するため、これまで網羅的な収集は行われてきませんでした。

そこで、blogWatcherでは、これらのWeb日記も含めて「blog」と呼び、それらの網羅的な収集に取り組みました。具体的には、Webページ中の日付表現に注目し、HTML文書の構造解析を行うことで、あるページがblogかどうかを判定することができる技術を開発しました。これらの技術を用いることにより、Web上にあるあらゆる日記的なコンテンツを収集することが可能になりました。

とのこと。

日本独自の文化や歴史からこういうツールが開発されるのはとても好感が持てるし、すごく必然な気がしてなりません。

ちなみに、「アクセシビリティ」で検索したらこのブログもひっかかってくれたので安心したってのは秘密。

# 某日記から引用しますた。

コメントを残す