Was ist nutch-?
indexiert und analysiert Inhalte von Webseiten.
Der Webrobot nutch- indexiert und analysiert Inhalte von Webseiten. Er zeigt sich meistens mit der IP Adresse 104.42.159.61 und unter Verwendung des User Agent MaxPointCrawler/Nutch-1.10 (maxpoint.crawler at maxpointinteractive dot com). Mit 0.0009% Marktanteil ist nutch- auf Platz 162 der aktivsten Webrobots im Internet.
robots.txt – nutch- blockieren
Füge diese Zeilen in deine robots.txt ein, um nutch- den Zugriff auf deine Website zu verwehren:
User-agent: nutch-
Disallow: /
Du kannst den Zugriff auch gezielt einschränken, statt ihn komplett zu blockieren:
User-agent: nutch-
Disallow: /wp-admin/
Disallow: /wp-includes/
Allow: /
IP-Adressen 16 bekannte IPs
Diese IP-Adressen wurden bisher von nutch- verwendet:
104.42.159.61
114.115.190.4
13.230.38.41
13.78.32.25
13.82.188.248
137.116.119.98
141.41.35.178
18.182.28.128
192.99.2.195
204.2.255.145
27.38.250.89
40.112.68.8
52.199.186.107
52.231.152.77
63.216.156.60
94.130.162.92
User Agents
Mit diesen User-Agent-Strings identifiziert sich nutch-:
MaxPointCrawler/Nutch-1.10 (maxpoint.crawler at maxpointinteractive dot com)Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36 QIHU 360SE/Nutch-1.13Honeso Spider/Nutch-1.15nutch-1.4/Nutch-1.4Toshiba Digital Solution TDSL/Nutch-1.8Naaraa/Nutch-1.14