Was ist kraken?
indexiert und analysiert Inhalte von Webseiten.
Der Webrobot kraken indexiert und analysiert Inhalte von Webseiten. Er zeigt sich meistens mit der IP Adresse 176.31.123.139 und unter Verwendung des User Agent Mozilla/5.0 (compatible; Kraken/0.1; http://linkfluence.net/; bot@linkfluence.net). Mit 0.232% Marktanteil ist kraken auf Platz 23 der aktivsten Webrobots im Internet.
„Listen to your customers and understand consumer trends with our social media intelligence software and social data research. Leverage social media data to measure brand equity, predict consumer trends, target the right audience, manage crises, and more."
— Offizielle Beschreibung des Betreibers
Technische Einordnung von kraken
kraken wurde in Webserver-Logs als Bot oder Crawler erkannt. Die wichtigsten technischen Hinweise findest du auf dieser Seite: bekannte User-Agents, beobachtete IP-Adressen, Aktivitätsdaten und passende robots.txt-Regeln.
Für eine konkrete Entscheidung solltest du zusätzlich prüfen, welche URLs kraken abruft, wie häufig die Zugriffe sind und ob der Bot deine robots.txt-Regeln respektiert.
Gefahreneinschätzung und Bewertung
Sollte man kraken blockieren?
Prüfe zuerst Zugriffshäufigkeit, aufgerufene URLs und User-Agent. Danach kannst du entscheiden, ob eine Blockierung sinnvoll ist.
robots.txt – kraken blockieren
Füge diese Zeilen in deine robots.txt ein, um kraken den Zugriff auf deine Website zu verwehren:
User-agent: kraken
Disallow: /
Du kannst den Zugriff auch gezielt einschränken, statt ihn komplett zu blockieren:
User-agent: kraken
Disallow: /wp-admin/
Disallow: /wp-includes/
Allow: /
Häufige Fragen zu kraken
Ist kraken gut oder schlecht?
Das hängt vom Einsatzzweck ab. kraken ist als Web-Crawler eingeordnet. Entscheidend sind Nutzen, Serverlast, Crawl-Verhalten und ob der Bot deine robots.txt-Regeln respektiert.
Wie erkenne ich kraken in Server-Logs?
Suche nach dem User-Agent-Namen kraken. Ein beobachteter User-Agent ist Mozilla/5.0 (compatible; Kraken/0.1; http://linkfluence.net/; bot@linkfluence.net). Vergleiche ausserdem IP-Adressen, Zugriffsmuster und aufgerufene URLs.
Reicht robots.txt zum Blockieren?
robots.txt ist ein Hinweis für regelkonforme Crawler. Unerwünschte oder aggressive Bots können diese Regeln ignorieren. In solchen Fällen helfen zusätzlich Firewall-Regeln, WAF-Regeln oder Blockierungen im Hosting/CDN.
Kann ein Bot seinen User-Agent fälschen?
Ja. Ein User-Agent ist leicht zu fälschen. Für wichtige Entscheidungen solltest du zusätzlich IP-Adresse, Reverse-DNS, Zugriffsmuster, Häufigkeit und aufgerufene URLs prüfen.
IP-Adressen 28 bekannte IPs
Diese IP-Adressen wurden bisher von kraken verwendet:
176.31.123.139
176.31.230.76
178.33.236.214
178.33.236.26
198.148.15.126
198.148.15.20
198.148.15.50
198.148.15.54
37.59.32.175
37.59.33.191
37.59.34.187
37.59.35.153
37.59.35.202
46.105.120.36
5.135.137.164
5.135.137.207
5.135.138.217
5.135.139.130
5.135.140.59
5.39.64.74
5.39.64.85
5.39.66.178
94.23.220.79
94.23.23.202
94.23.27.149
94.23.27.155
94.23.38.59
94.23.42.98
User Agents
Mit diesen User-Agent-Strings identifiziert sich kraken:
Mozilla/5.0 (compatible; Kraken/0.1; http://linkfluence.net/; bot@linkfluence.net)Kraken/Nutch-2.2.1 (Nutch crawler launched by Integral Ad Science, Inc.; TBD; TBD)