Інструмент «Аналіз вихідного коду та HTTP-заголовків» показує, як саме Netpeak Spider аналізує текст при розрахунках кількості слів або символів на сторінці та допомагає зрозуміти, чому іноді дані в Netpeak Spider відрізняються від тих, що ви бачите при відвідуванні сайту у браузері. Більше інформації з цього питання ви зможете знайти у статті ‘Чому Netpeak Spider і браузер показують різні дані?’.
1. Запуск інструменту
Відкрити інструмент можна двома способами:
1.1. За допомогою контекстного меню (гарячих кнопок). У таблиці результатів виділіть URL, що вас цікавить, і скористайтеся комбінацією клавіш Ctrl+U або виберіть в контекстному меню пункт «Вихідний код і HTTP-заголовки».
Ви побачите вікно інструменту з детальними даними в HTTP-заголовках запиту та відповіді сервера, інформацією про сторінку, її вихідний код і необроблений текст на сторінці без елементів HTML.
1.2. Запуск через панель керування. На панелі керування виберіть «Запустити (Інструменти) → Аналіз вихідного коду та заголовків HTTP»
У вікні інструмента введіть URL сторінки, яка вас цікавить, і натисніть «Старт».
Netpeak Spider зберігає підказки для швидкого введення URL у майбутньому.
2. Робота з результатами
Перелік даних, які можна побачити в лівій частині вікна, а також їх опис наведено в таблиці нижче. Тип і кількість цих полів можуть бути різними для різних сторінок, тому в таблиці зібрані найпоширеніші.
Назва поля | Опис |
Загальні дані, отримані під час звернення до URL | |
Page Type | Тип запитуваної сторінки (HTML, JSON, Зображення тощо). |
Request URL | URL-адреса запитуваної сторінки. |
Request Method | Спосіб запиту (наприклад, GET). |
Status Code | Код відповіді сторінки. |
Response Time | Час (у мілісекундах) до отримання першого байта від сервера. |
Content Download Time | Час (у мілісекундах), за який сервер повертає HTML-код сторінки. |
Proxy Server | IP-адреса та порт проксі, з якого було надіслано запит сторінці, якщо проксі встановлено в налаштуваннях програми. Якщо ви не використовували проксі, буде відображено значення (Not Set). |
Remote Address | IP-адреса і порт домену, на якому розташована запитана сторінка. |
HTTP-заголовки відповіді сервера | |
Date | Дата створення відгуку. |
Content-Type | Тип вмісту сторінки. |
Content-Encoding | Спосіб кодування елементів на запитуваній сторінці. |
Connection | Параметри керування для поточного підключення. |
Vary | Сповіщає запитуючий сервер, як зіставити майбутні заголовки запитів, щоб вирішити, чи можна використовувати кешовану відповідь замість запитувати нову відповідь з оригінального сервера. |
Set-Cookie | Дані cookie. Використовується для надсилання cookie від сервера до User Agent. Формат значення: =>. |
HTTP-заголовки запиту до сервера | |
User-Agent | Поточний User Agent, який був використаний під час запиту вказаної сторінки. Ви можете змінювати User Agent у налаштуваннях програми. |
Accept | Перелік допустимих форматів ресурсу. |
Accept-Encoding | Список допустимих кодувань. |
Accept-Charset | Список підтримуваних кодувань для надання користувачеві. |
Host | URL-адреса домену, на якій розташована запитана сторінка. |
Cache-Control | Директиви для керування кешуванням. |
Pragma | Використовується для зворотної сумісності з кешами HTTP/1.0, де заголовок Cache-Control HTTP/1.1 ще не присутній. |
У лівій частині вікна ви можете побачити список GET-параметрів у тому випадку, якщо вони присутні в URL сторінки. Наприклад, якщо URL-адреса сторінки https://www.example.com/products?sort=popularity&os=windows, ви побачите такі дані:
Get-параметри | |
sort | popularity |
os | windows |
Переглянути вихідний код та витягнутий текст можна у правій частині вікна інструмента. Завдяки підсвічуванням, нумерації та автоперенесення рядків ви легко можете розпізнати метатеги, канонічні посилання та інші важливі елементи коду. На вкладці "Витягнутий текст" ви побачите весь текст на сторінці без HTML-тегів.
Зверніть увагу: вихідний код відображається лише для сторінок із кодом відповіді сервера 2xx. На вкладці Вихідний код доступні такі типи документів:
- HTML;
- PlainText(наприклад, TXT-файли);
- JavaScript;
- CSS(файли стилів);
- XML;
- GZIP → Netpeak Spider може розпакувати архів та відкрити вміст.
Щоб знайти потрібні дані з будь-якої вкладки, скористайтеся полем швидкого пошуку або Ctrl+E.
Щоб видалити всі результати аналізу, натисніть кнопку «Очистити».
3. Експорт результатів
Отримані результати аналізу можна вивантажити двома способами:
- За допомогою кнопки «Експорт» → вивантажує вміст колонок «Назва» та «Значення» у лівій частині вікна.
- За допомогою кнопки «Зберегти вихідний код» → вивантажує вихідний код в файл у тому вигляді, в якому він був отриманий від сервера.
Ця стаття була корисною?
Чудово!
Дякуємо за відгук
Даруйте, що не вдалося допомогти вам
Дякуємо за відгук
Відгук надіслано
Дякуємо за допомогу! Ми докладемо всіх зусиль, щоби виправити статтю