Google モバイルウェブクローラー
Google モバイルウェブクローラー - Kimura.Memoに書いたGoogleモバイルウェブクローラの判別方法ですが、Googlebot - Search Console Helpを見るとIPアドレスではなく、逆引きホストのドメインで判断した方が良さそうです。
これは、Google Japan Blog: Google モバイル検索についてのウェブマスター向け情報に書いてあるIPアドレスの範囲に収まらないGoogleモバイルボットが存在するためです。
USER_AGENT | SAMSUNG-SGH-E250/1.0 Profile/MIDP-2.0 Configuration/CLDC-1.1 UP.Browser/6.2.3.3.c.1.101 (GUI) MMP/2.0 (compatible; Googlebot-Mobile/2.1; +http://www.google.com/bot.html) |
---|---|
REMOTE_ADDR | 66.249.69.111 |
REMOTE_HOST | crawl-66-249-69-111.googlebot.com |
Google Japan Blog: Google モバイル検索についてのウェブマスター向け情報
- IPアドレス帯域が以下のいずれか
- 72.14.199.0/25
- 209.85.238.0/25
- ユーザーエージェントに、"Googlebot-Mobile"が含まれる
Googlebot - Search Console Help
You can verify that a bot accessing your server really is Googlebot by using a reverse DNS lookup, verifying that the name is in the googlebot.com domain, and then doing a forward DNS lookup using that googlebot name.
(訳:本当にGoogleボットであるどうか判断するには、DNS逆引きがgooglebot.comドメインになり、さらにその結果を正引きして元のIPアドレスになることを確認すればよい)
と言うことで、自分勝手にまとめると
- ユーザーエージェントに、"Googlebot-Mobile"が含まれる
- 逆引きがgooglebot.comになり、その正引きが元のIPアドレスになる
ものがGoogleボットであると判断することにする