ia_archiver

Der Webrobot ia_archiver indexiert und analysiert Inhalte von Webseiten. Er zeigt sich meistens mit der IP Adresse 149.172.109.186 und unter Verwendung des User Agent ia_archiver. Mit 0.0125% Marktanteil ist ia_archiver auf Platz 75 der aktivsten Webrobots im Internet.

1.372Zugriffe
0,013%Marktanteil
Okt. 2014Erstmals gesehen
26.07.2019Zuletzt aktiv

Was ist ia_archiver?

indexiert und analysiert Inhalte von Webseiten.

Der Webrobot ia_archiver indexiert und analysiert Inhalte von Webseiten. Er zeigt sich meistens mit der IP Adresse 149.172.109.186 und unter Verwendung des User Agent ia_archiver. Mit 0.0125% Marktanteil ist ia_archiver auf Platz 75 der aktivsten Webrobots im Internet.

„Information regarding our privacy policy, company, and technology can be found on the following pages Privacy Policy and About Us. Alexa…"

— Offizielle Beschreibung des Betreibers
Basisanalyse

Technische Einordnung von ia_archiver

ia_archiver wurde in Webserver-Logs als Bot oder Crawler erkannt. Die wichtigsten technischen Hinweise findest du auf dieser Seite: bekannte User-Agents, beobachtete IP-Adressen, Aktivitätsdaten und passende robots.txt-Regeln.

Für eine konkrete Entscheidung solltest du zusätzlich prüfen, welche URLs ia_archiver abruft, wie häufig die Zugriffe sind und ob der Bot deine robots.txt-Regeln respektiert.

Tipp: Wenn der Bot viel Traffic erzeugt oder sensible Bereiche abruft, prüfe neben robots.txt auch Firewall- oder WAF-Regeln.

Gefahreneinschätzung und Bewertung

Sollte man ia_archiver blockieren?

Prüfe zuerst Zugriffshäufigkeit, aufgerufene URLs und User-Agent. Danach kannst du entscheiden, ob eine Blockierung sinnvoll ist.

Erst Logdaten prüfen

Betreiber

Organisation
Noch nicht geprüft

Auf einen Blick

Typ
Web-Crawler
Häufige IP
149.172.109.186
User-Agent-Varianten
2
Marktanteil
0,013%

robots.txt – ia_archiver blockieren

Füge diese Zeilen in deine robots.txt ein, um ia_archiver den Zugriff auf deine Website zu verwehren:

robots.txt
User-agent: ia_archiver
Disallow: /

Du kannst den Zugriff auch gezielt einschränken, statt ihn komplett zu blockieren:

robots.txt (selektiv)
User-agent: ia_archiver
Disallow: /wp-admin/
Disallow: /wp-includes/
Allow: /

Häufige Fragen zu ia_archiver

Ist ia_archiver gut oder schlecht?

Das hängt vom Einsatzzweck ab. ia_archiver ist als Web-Crawler eingeordnet. Entscheidend sind Nutzen, Serverlast, Crawl-Verhalten und ob der Bot deine robots.txt-Regeln respektiert.

Wie erkenne ich ia_archiver in Server-Logs?

Suche nach dem User-Agent-Namen ia_archiver. Ein beobachteter User-Agent ist ia_archiver. Vergleiche ausserdem IP-Adressen, Zugriffsmuster und aufgerufene URLs.

Reicht robots.txt zum Blockieren?

robots.txt ist ein Hinweis für regelkonforme Crawler. Unerwünschte oder aggressive Bots können diese Regeln ignorieren. In solchen Fällen helfen zusätzlich Firewall-Regeln, WAF-Regeln oder Blockierungen im Hosting/CDN.

Kann ein Bot seinen User-Agent fälschen?

Ja. Ein User-Agent ist leicht zu fälschen. Für wichtige Entscheidungen solltest du zusätzlich IP-Adresse, Reverse-DNS, Zugriffsmuster, Häufigkeit und aufgerufene URLs prüfen.

IP-Adressen 10 bekannte IPs

Diese IP-Adressen wurden bisher von ia_archiver verwendet:

DE 149.172.109.186
US 174.129.228.67
US 174.129.237.157
US 204.236.226.210
CN 221.225.39.110
CN 222.93.170.237
US 34.207.98.73
US 50.19.137.190
US 54.165.59.7
US 54.87.176.206

User Agents

Mit diesen User-Agent-Strings identifiziert sich ia_archiver:

  • ia_archiver
  • ia_archiver ( http://www.alexa.com/site/help/webmasters; crawler@alexa.com)

Weitere nützliche Tools