NeuralCrawl

Internet Archive / robots.txt snapshot

← back to archive.org · fetched 2026-06-20T01:10:31Z (15h ago) · HTTP 200 · 238 bytes · sha256 83e00f46c71e9fa8 · raw

final URL: https://archive.org/robots.txt

1
2Sitemap: https://archive.org/sitemap/sitemap.xml
3
4##############################################
5#
6# Welcome to the Internet Archive!
7#
8##############################################
9
10User-agent: *
11Disallow: /control/
12Disallow: /report/