Was ist urlfilterdb-crawler?
indexiert und analysiert Inhalte von Webseiten.
Der Webrobot urlfilterdb-crawler indexiert und analysiert Inhalte von Webseiten. Er zeigt sich meistens mit der IP Adresse 5.79.65.6 und unter Verwendung des User Agent Mozilla/5.0 (URLfilterDB-crawler/1.1) ufdb/1.0. Mit 0.0013% Marktanteil ist urlfilterdb-crawler auf Platz 158 der aktivsten Webrobots im Internet.
Gefahreneinschätzung und Bewertung
Sollte man urlfilterdb-crawler blockieren?
Prüfe zuerst Zugriffshäufigkeit, aufgerufene URLs und User-Agent. Danach kannst du entscheiden, ob eine Blockierung sinnvoll ist.
robots.txt – urlfilterdb-crawler blockieren
Füge diese Zeilen in deine robots.txt ein, um urlfilterdb-crawler den Zugriff auf deine Website zu verwehren:
User-agent: urlfilterdb-crawler
Disallow: /
Du kannst den Zugriff auch gezielt einschränken, statt ihn komplett zu blockieren:
User-agent: urlfilterdb-crawler
Disallow: /wp-admin/
Disallow: /wp-includes/
Allow: /
Häufige Fragen zu urlfilterdb-crawler
Ist urlfilterdb-crawler ein guter oder schlechter Bot?
Das hängt vom Einsatzzweck ab. urlfilterdb-crawler ist als Web-Crawler eingeordnet. Entscheidend sind Serverlast, Crawl-Verhalten, Nutzen für deine Website und ob der Bot deine Regeln respektiert.
Wie erkenne ich urlfilterdb-crawler in Server-Logs?
Suche nach dem User-Agent-Namen urlfilterdb-crawler. Ein beobachteter User-Agent ist Mozilla/5.0 (URLfilterDB-crawler/1.1) ufdb/1.0. Vergleiche ausserdem IP-Adressen, Zugriffsmuster und aufgerufene URLs.
Reicht robots.txt zum Blockieren?
robots.txt ist ein Hinweis für regelkonforme Crawler. Unerwünschte oder aggressive Bots können diese Regeln ignorieren. In solchen Fällen helfen zusätzlich Firewall-Regeln, WAF-Regeln oder Blockierungen im Hosting/CDN.
IP-Adressen 1 bekannte IPs
Diese IP-Adressen wurden bisher von urlfilterdb-crawler verwendet:
5.79.65.6
User Agents
Mit diesen User-Agent-Strings identifiziert sich urlfilterdb-crawler:
Mozilla/5.0 (URLfilterDB-crawler/1.1) ufdb/1.0