備忘録か日記のようなもの

システム設定や日々感じたことを忘れないように

人気BLOGランキング
<< VNCの日本語対応版 | main | チェーンメール >>

atom.xmlとindex.rdf

 Webサーバーのアクセスログをチェックしていて、atom.xmlとindex.rdfファイルへのアクセスが非常に多いのに気がつきました。
 RSS,ATOMをチェックしている人がいるのに記事へのアクセスがほとんどありません。変だなと思い、アクセスログを確認すると、検索サイトのロボットがファイルを取得に来ているようです。
 なるほど、これならば記事へのアクセスは無いはずです。
66.249.71.xx - - [07/Jul/2005:14:24:57 +0900] "GET /index.rdf HTTP/1.0" 200 25476 "-" "Googlebot/2.1 (+http://www.google.com/bot.html)"
207.46.98.xx - - [08/Jul/2005:05:32:09 +0900] "GET /index.rdf HTTP/1.0" 200 25476 "-" "msnbot/1.0 (+http://search.msn.com/msnbot.htm)"
207.46.98.xx - - [06/Jul/2005:11:43:22 +0900] "GET /atom.xml HTTP/1.0"200 24139 "-" "msnbot/1.0 (+http://search.msn.com/msnbot.htm)"
66.249.71.xx - - [07/Jul/2005:11:06:29 +0900] "GET /atom.xml HTTP/1.0"200 24768 "-" "Googlebot/2.1 (+http://www.google.com/bot.html)"

 なぜ検索サイトがと思いWebで調べたところ同じ疑問を持っている人がたくさんいることがわかりました。

  Googleによる atom.xml 検索
  Googlebot tries atom.xml
  Googlebot is looking for rss.xml
  Search "rss.xml" by Googlebot
  Googlebotの巡回頻度がすごいことになってる
  GoogleでRSS検索のテスト?
  Googlebotがatom.xmlを探している話

 これらのサイトをチェックしてみたら、Googleは結構前から取得していたようですね。誰もMSNに対して言及していないことからMSNが取得を始めたのは最近のことのようです。
 Blogの検索サービスか、Blog自身をはじめるのではないかとのことですが、誰も正確な情報はわからないようです。
 もしかして、各Webページのランキングをつける時にBlogの情報を使っていたりして。

入門RSS―Webにおける効率のよい情報収集/発信
関連Blog (Blogランキング)
玄箱(apache) | comments (0) | trackback (0)

Comments

Comment Form

Trackbacks