Инструмент «Анализ исходного кода и HTTP-заголовков» показывает, как именно Netpeak Spider анализирует текст при расчётах количества слов или символов на странице и помогает понять, почему иногда данные в Netpeak Spider отличаются от тех, что вы видите при посещении сайта в браузере. Больше информации по этому вопросу вы сможете найти статье «Почему Netpeak Spider и браузер показывают разные данные?».
1. Запуск инструмента
Открыть инструмент вы можете двумя способами:
1.1. С помощью контекстного меню (горячих клавиш). В таблице результатов выделите интересующий вас URL и воспользуйтесь комбинацией клавиш Ctrl+U либо выберите в контекстном меню пункт «Исходный код и HTTP-заголовки».
1.2. Запуск через панель управления. На панели управления выберите «Запустить (Инструменты) → Анализ исходного кода и HTTP-заголовков».
В открывшемся окне инструмента введите URL интересующей вас страницы и нажмите «Старт».
Netpeak Spider сохраняет подсказки для быстрого повторного ввода URL в будущем.
2. Работа с результатами
Перечень данных, которые вы можете увидеть в левой части окна, а также их описание приведены в таблице ниже. Тип и количество этих полей могут быть разными для разных страниц, поэтому в таблице собраны самые распространённые.
Название поля |
Описание |
Общие данные, полученные при обращении к URL |
|
Page Type |
Тип запрашиваемой страницы (HTML, JSON, Изображение и т.д.). |
Request URL |
URL-адрес запрашиваемой страницы. |
Request Method |
Метод запроса (например, GET). |
Status Code |
Код ответа страницы. |
Response Time |
Время (в миллисекундах) до получения первого байта от сервера. |
Content Download Time |
Время (в миллисекундах), за которое сервер возвращает HTML-код страницы. |
Proxy Server |
IP-адрес и порт прокси, с которого был отправлен запрос странице, если прокси задан в настройках программы. Если вы не использовали прокси, будет отображаться значение «(Not Set)». |
Remote Address |
IP-адрес и порт домена, на котором расположена запрашиваемая страница. |
HTTP-заголовки ответа сервера |
|
Date |
Дата генерации отклика. |
Content-Type |
Тип контента страницы. |
Content-Encoding |
Способ кодирования элементов на запрашиваемой странице. |
Connection |
Параметры управления для текущего подключения. |
Vary |
Оповещает запрашивающий сервер, как сопоставить будущие заголовки запросов, чтобы решить, можно ли использовать кэшированный ответ вместо того, чтобы запрашивать новый ответ с оригинального сервера. |
Set-Cookie |
Данные cookie. Используется для отправки cookie от сервера к User Agent. Формат значения: =. |
HTTP-заголовки запроса к серверу |
|
User-Agent |
Текущий User Agent, который был использован при запросе указанной страницы. Вы можете изменять User Agent в настройках программы. |
Accept |
Список допустимых форматов ресурса. |
Accept-Encoding |
Список допустимых кодировок. |
Accept-Charset |
Список поддерживаемых кодировок для предоставления пользователю. |
Host |
URL-адрес домена, на котором расположена запрашиваемая страница. |
Cache-Control |
Директивы для управления кэшированием. |
Pragma |
Используется для обратной совместимости с кэшами HTTP / 1.0, где заголовок Cache-Control HTTP / 1.1 еще не присутствует. |
В левой части окна вы также можете увидеть список GET-параметров в том случае, если они присутствуют в URL страницы. Например, если URL-адрес страницы https://www.example.com/products?sort=popularity&os=windows, вы увидите следующие данные:
Get-параметры |
|
sort |
popularity |
os |
windows |
Просмотреть исходный код и извлечённый текст вы можете в правой части окна инструмента. Благодаря подсветке, нумерации и автопереносу строк вы легко можете распознать метатеги, канонические ссылки и другие важные элементы кода. На вкладке «Извлечённый текст» вы увидите весь текст на странице без HTML-тегов.
Обратите внимание: исходный код отображается только для страниц с кодом ответа сервера 2xx.
На вкладке «Исходный код» доступны следующие типы документов:
- HTML;
- PlainText (например, TXT-файлы);
- JavaScript;
- CSS (файлы стилей);
- XML;
- GZIP → Netpeak Spider может распаковать архив и открыть содержимое.
Чтобы найти нужные данные из любой вкладки, воспользуйтесь полем быстрого поиска или комбинацией Ctrl+E.
Для удаления всех результатов анализа нажмите кнопку «Очистить».
3. Экспорт результатов
Полученные результаты анализа можно выгрузить двумя способами:
- С помощью кнопки «Экспорт» → выгружает содержимое колонок «Название» и «Значение» в левой части окна.
- С помощью кнопки «Сохранить исходный код» → выгружает в файл исходный код в том виде, в каком он был получен от сервера.
Статья помогла?
Отлично!
Спасибо за ваш отзыв
Извините, что не удалось помочь!
Спасибо за ваш отзыв
Комментарий отправлен
Мы ценим вашу помощь и постараемся исправить статью