Wie kann ich urlfilterdb-crawler per robots.txt blockieren?

Fuege in der robots.txt die Zeilen "User-agent: urlfilterdb-crawler" und "Disallow: /" ein. Pruefe danach, ob der Crawler robots.txt-Regeln respektiert.

Woran erkenne ich urlfilterdb-crawler?

Typische Hinweise sind der User-Agent-String, bekannte IP-Adressen, Betreiberinformationen und wiederkehrende Zugriffe in Server-Logs.

urlfilterdb-crawler: User-Agent, IPs & robots.txt blockieren

Q: Was ist urlfilterdb-crawler?

Was ist urlfilterdb-crawler?, Infos zu User-Agent, 1 IP-Adressen, 1 bekannte User-Agent-Varianten und robots.txt-Regeln zum Erkennen oder Blockieren des Cr

146Zugriffe

0,001%Marktanteil

Nov. 2014Erstmals gesehen

11.03.2015Zuletzt aktiv

Was ist urlfilterdb-crawler?

indexiert und analysiert Inhalte von Webseiten.

Der Webrobot urlfilterdb-crawler indexiert und analysiert Inhalte von Webseiten. Er zeigt sich meistens mit der IP Adresse 5.79.65.6 und unter Verwendung des User Agent Mozilla/5.0 (URLfilterDB-crawler/1.1) ufdb/1.0. Mit 0.0013% Marktanteil ist urlfilterdb-crawler auf Platz 158 der aktivsten Webrobots im Internet.

Gefahreneinschätzung und Bewertung

Sollte man urlfilterdb-crawler blockieren?

Prüfe zuerst Zugriffshäufigkeit, aufgerufene URLs und User-Agent. Danach kannst du entscheiden, ob eine Blockierung sinnvoll ist.

urlfilterdb-crawler im Log prüfen

robots.txt – urlfilterdb-crawler blockieren

Füge diese Zeilen in deine robots.txt ein, um urlfilterdb-crawler den Zugriff auf deine Website zu verwehren:

robots.txt

User-agent: urlfilterdb-crawler
Disallow: /

Du kannst den Zugriff auch gezielt einschränken, statt ihn komplett zu blockieren:

robots.txt (selektiv)

User-agent: urlfilterdb-crawler
Disallow: /wp-admin/
Disallow: /wp-includes/
Allow: /

Häufige Fragen zu urlfilterdb-crawler

Ist urlfilterdb-crawler ein guter oder schlechter Bot?

Das hängt vom Einsatzzweck ab. urlfilterdb-crawler ist als Web-Crawler eingeordnet. Entscheidend sind Serverlast, Crawl-Verhalten, Nutzen für deine Website und ob der Bot deine Regeln respektiert.

Wie erkenne ich urlfilterdb-crawler in Server-Logs?

Suche nach dem User-Agent-Namen urlfilterdb-crawler. Ein beobachteter User-Agent ist Mozilla/5.0 (URLfilterDB-crawler/1.1) ufdb/1.0. Vergleiche ausserdem IP-Adressen, Zugriffsmuster und aufgerufene URLs.

Reicht robots.txt zum Blockieren?

robots.txt ist ein Hinweis für regelkonforme Crawler. Unerwünschte oder aggressive Bots können diese Regeln ignorieren. In solchen Fällen helfen zusätzlich Firewall-Regeln, WAF-Regeln oder Blockierungen im Hosting/CDN.

IP-Adressen 1 bekannte IPs

Diese IP-Adressen wurden bisher von urlfilterdb-crawler verwendet:

5.79.65.6

User Agents

Mit diesen User-Agent-Strings identifiziert sich urlfilterdb-crawler:

Mozilla/5.0 (URLfilterDB-crawler/1.1) ufdb/1.0

urlfilterdb-crawler

Was ist urlfilterdb-crawler?

Sollte man urlfilterdb-crawler blockieren?

Betreiber

Auf einen Blick

robots.txt – urlfilterdb-crawler blockieren

Häufige Fragen zu urlfilterdb-crawler

IP-Adressen 1 bekannte IPs

User Agents

7 Fälle in denen hohes Keyword Suchvolumen eine Falle ist (und warum es sich dennoch lohnen kann)

Domaininhaber ermitteln mit der Whois-Abfrage: Wem gehört die Domain

Freie Domains finden und die Vorteile einer eigenen Domain für Blogs

Was ist urlfilterdb-crawler?

Sollte man urlfilterdb-crawler blockieren?

Betreiber

Auf einen Blick

robots.txt – urlfilterdb-crawler blockieren

Häufige Fragen zu urlfilterdb-crawler

IP-Adressen 1 bekannte IPs

User Agents

Weitere nützliche Bot-Checks

7 Fälle in denen hohes Keyword Suchvolumen eine Falle ist (und warum es sich dennoch lohnen kann)

Domaininhaber ermitteln mit der Whois-Abfrage: Wem gehört die Domain

Freie Domains finden und die Vorteile einer eigenen Domain für Blogs