Аналіз вихідного коду та HTTP-заголовків

Змінено Mon, 09 Oct 2023 о 07:39 PM

  1. Запуск інструменту.
  2. Робота із результатами.
  3. Експорт результатів.

Інструмент «Аналіз вихідного коду та HTTP-заголовків» показує, як саме Netpeak Spider аналізує текст при розрахунках кількості слів або символів на сторінці та допомагає зрозуміти, чому іноді дані в Netpeak Spider відрізняються від тих, що ви бачите при відвідуванні сайту у браузері. Більше інформації з цього питання ви зможете знайти у статті ‘Чому Netpeak Spider і браузер показують різні дані?’.

1. Запуск інструменту

Відкрити інструмент можна двома способами:

1.1. За допомогою контекстного меню (гарячих кнопок). У таблиці результатів виділіть URL, що вас цікавить, і скористайтеся комбінацією клавіш Ctrl+U або виберіть в контекстному меню пункт «Вихідний код і HTTP-заголовки».

Запуск інструменту

Ви побачите вікно інструменту з детальними даними в HTTP-заголовках запиту та відповіді сервера, інформацією про сторінку, її вихідний код і необроблений текст на сторінці без елементів HTML.

1.2. Запуск через панель керування. На панелі керування виберіть «Запустити (Інструменти) → Аналіз вихідного коду та заголовків HTTP»

Source code and HTTP headers analysis

У вікні інструмента введіть URL сторінки, яка вас цікавить, і натисніть «Старт».

click on the Start button

Netpeak Spider зберігає підказки для швидкого введення URL у майбутньому.

2. Робота з результатами

Перелік даних, які можна побачити в лівій частині вікна, а також їх опис наведено в таблиці нижче. Тип і кількість цих полів можуть бути різними для різних сторінок, тому в таблиці зібрані найпоширеніші.


Назва поля

Опис

Загальні дані, отримані під час звернення до URL

Page Type

Тип запитуваної сторінки (HTML, JSON, Зображення тощо).

Request URL

URL-адреса запитуваної сторінки.

Request Method

Спосіб запиту (наприклад, GET).

Status Code

Код відповіді сторінки.

Response Time

Час (у мілісекундах) до отримання першого байта від сервера.

Content Download Time

Час (у мілісекундах), за який сервер повертає HTML-код сторінки.

Proxy Server

IP-адреса та порт проксі, з якого було надіслано запит сторінці, якщо проксі встановлено в налаштуваннях програми. Якщо ви не використовували проксі, буде відображено значення (Not Set).

Remote Address

IP-адреса і порт домену, на якому розташована запитана сторінка.

HTTP-заголовки відповіді сервера

Date

Дата створення відгуку.

Content-Type

Тип вмісту сторінки.

Content-Encoding

Спосіб кодування елементів на запитуваній сторінці.

Connection

Параметри керування для поточного підключення.

Vary

Сповіщає запитуючий сервер, як зіставити майбутні заголовки запитів, щоб вирішити, чи можна використовувати кешовану відповідь замість запитувати нову відповідь з оригінального сервера.

Set-Cookie

Дані cookie. Використовується для надсилання cookie від сервера до User Agent. Формат значення: =>.

HTTP-заголовки запиту до сервера

User-Agent

Поточний User Agent, який був використаний під час запиту вказаної сторінки. Ви можете змінювати User Agent у налаштуваннях програми.

Accept

Перелік допустимих форматів ресурсу.

Accept-Encoding

Список допустимих кодувань.

Accept-Charset

Список підтримуваних кодувань для надання користувачеві.

Host

URL-адреса домену, на якій розташована запитана сторінка.

Cache-Control

Директиви для керування кешуванням.

Pragma

Використовується для зворотної сумісності з кешами HTTP/1.0, де заголовок Cache-Control HTTP/1.1 ще не присутній.


У лівій частині вікна ви можете побачити список GET-параметрів у тому випадку, якщо вони присутні в URL сторінки. Наприклад, якщо URL-адреса сторінки https://www.example.com/products?sort=popularity&os=windows, ви побачите такі дані:


Get-параметри

sort

popularity

os

windows

Переглянути вихідний код та витягнутий текст можна у правій частині вікна інструмента. Завдяки підсвічуванням, нумерації та автоперенесення рядків ви легко можете розпізнати метатеги, канонічні посилання та інші важливі елементи коду. На вкладці "Витягнутий текст" ви побачите весь текст на сторінці без HTML-тегів.


Зверніть увагу: вихідний код відображається лише для сторінок із кодом відповіді сервера 2xx. На вкладці Вихідний код доступні такі типи документів:

  • HTML;
  • PlainText(наприклад, TXT-файли);
  • JavaScript;
  • CSS(файли стилів);
  • XML;
  • GZIP → Netpeak Spider може розпакувати архів та відкрити вміст.

Щоб знайти потрібні дані з будь-якої вкладки, скористайтеся полем швидкого пошуку або Ctrl+E.

Щоб видалити всі результати аналізу, натисніть кнопку «Очистити».

3. Експорт результатів

Отримані результати аналізу можна вивантажити двома способами:

  • За допомогою кнопки «Експорт» → вивантажує вміст колонок «Назва» та «Значення» у лівій частині вікна.
  • За допомогою кнопки «Зберегти вихідний код» → вивантажує вихідний код в файл у тому вигляді, в якому він був отриманий від сервера.

Results export

Ця стаття була корисною?

Чудово!

Дякуємо за відгук

Даруйте, що не вдалося допомогти вам

Дякуємо за відгук

Розкажіть, як ми можемо поліпшити цю статтю!

Виберіть принаймні одну причину
Необхідна перевірка CAPTCHA.

Відгук надіслано

Дякуємо за допомогу! Ми докладемо всіх зусиль, щоби виправити статтю