IsCrawler en browscap.iniHet herkennen van de o.a. zoekmachines is in asp.net vrij eenvoudig. De boolean Context.Request.IsCrawler geeft dit weer. Er is echt wel een maar, want blijkbaar herkend hij (Mono in dit geval) niet alle, vooral recentere zoekmachines. Last, maar zeer makkelijk op te lossen. Het herkennen van deze crawlers staat gedefinieerd in het
browscap.ini bestand. Deze staat op mijn werkstation (Ubuntu 11.10) onder /etc/mono, maar op een andere machine vond ik hem onder /usr/share/mono/browscap.ini. Het blijkt dat dit bestand uit 2009 stamt. Na een kleine zoektocht, vond ik een recentere versie op het volgende url:
Even downloaden, over de originele browscap.ini file heen kopieren en dan na een herstart toont mijn log mij Bing en Baidu nu wel herkend worden!
[23-12-2011 0:53:53|10] Debug: request is crawler: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
[23-12-2011 0:53:55|7] Debug: request is crawler: Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)
Dit is overigens niet alleen voor Mono, maar ook voor Windows+IIS een oplossing!
