Анализ User-Agent: Arquivo-web-crawler (compatible; heritrix/3.4.0-20200304 +https://arquivo.pt/faq-crawling)
User-Agent идентифицирован как официальный веб-краулер Arquivo.pt (Португальский веб-архив). Это не браузер пользователя, а специализированный робот для архивации веб-контента.
Детали парсинга и оценка рисков
- Клиент/Бот: Arquivo-web-crawler
- Движок/Ядро: Heritrix/3.4.0-20200304
- Операционная система: Не указана (типично для серверных краулеров)
- Движок рендеринга: Отсутствует (не браузер)
- Валидность: Строка корректна, соответствует формату и содержит ссылку на политику сканирования.
- Риск-факторы: НЕТ. Это легитимный архивный краулер с публичной идентификацией и политикой (+https://...). Heritrix 3.4.0 - стабильная версия известного открытого краулера.
- Сравнение с браузерами: Неприменимо, так как это не пользовательский браузер.
- Решение основано на: Публичная, не скрывающаяся принадлежность к национальному архиву, наличие ссылки на FAQ по сканированию, использование известного ПО с прозрачными целями (архивация).