Валідатор XML Sitemap

Змінено пн., 29 Лип. на 12:30 ПІСЛЯ ПОЛУДНЯ

  1. Як відкрити інструмент і розпочати роботу з ним.
  2. Функції інструменту.
  3. Помилки, що визначаються інструментом "Валідатор XML Sitemap".


Валідатор XML Sitemap — вбудований у програму інструмент, який допомагає вирішити такі завдання:

  • Знаходити помилки у мапі сайту.
  • Парсити посилання з XML Sitemap з можливістю передачі їх в основну таблицю для подальшого сканування та роботи з ними.
  • Надіслати ping у пошукові системи, щоб звернути їхню увагу на зміни у файлах XML Sitemap.


Перевірка мапи сайту може здійснюватися поза скануванням самого сайту.


1. Як відкрити інструмент і розпочати роботу з ним

Відкривається інструмент трьома способами:

  • Через панель керування в меню "Інструменти/Запустити" → "Валідатор XML Sitemap";


Валідатор XML Sitemap


  • скористатися гарячими клавішами Alt+X;
  • У головному меню оберіть «Список URL» → «Завантажити з Sitemap».


Завантажити з sitemap


Щоб розпочати пошук помилок:

1. Введіть URL-адресу мапи сайту в поле з відповідною назвою та натисніть кнопку «Старт». Після завершення сканування в основній таблиці з'явиться список сторінок, які містяться на мапі сайту. В інструменті вбудовано два режими перегляду:

  • URL (Вміст Sitemap) → відображає всі сторінки, які містяться на мапі сайту;
  • Мапи сайту → відображає файли з розширенням .xml.


2. У колонках таблиці перегляньте дані про наявність та відсутність атрибутів окремо для кожної URL-адреси. Атрибути та їх значення:

  • Loc → URL-адреса сторінки;
  • Lastmod → дата останньої зміни файлу;
  • Changefreq → ймовірна частота зміни цієї сторінки;
  • Priority → пріоритет URL щодо інших URL на сайті.


3. Ознайомитися зі знайденими помилками в мапі сайту ви можете на вкладці правої частини вікна інструменту. Помилки, представлені в цьому звіті, визначаються на основі офіційної документації Standart Sitemap Protocol, яка підтримується пошуковими системами Google, Яндекс і Bing .


4. Натисніть на назву помилки, щоб відфільтрувати результати та ознайомитися зі списком сторінок, на яких вона була знайдена. Також при натисканні на нижньому блоці «Інформація» відображається пояснення кожної помилки та її цільовий параметр.


sitemap звіти

5. Щоб задати індивідуальні (кастомні) налаштування фільтрів, скиньте застосований фільтр і натисніть кнопку «Налаштувати фільтр». Перед вами відкриється вікно, де можна встановити умови фільтрації.


2. Функції інструменту

За аналогією з роботою у бічній вкладці програми, в інструменті «Валідатор XML Sitemap» доступні функції:

  • Застосувати → застосовує поточний фільтр та оновлює дані у таблиці.
  • Розширене копіювання → копіює дані з будь-якої обраної категорії до буфера обміну, після чого їх можна вставити у зовнішню таблицю.

При необхідності ви можете надіслати мапу сайту до ping пошукових систем Google та Bing, та повідомити їх про додавання нового матеріалу на сайті.


Експортувати sitemap


Вивантаження результатів здійснюється за допомогою:

  • Функції "Експорт" → вивантажує поточну таблицю з усіма результатами;
  • Кнопки «Зберегти URL-адресу у файл» → зберігає список просканованих URL-мапи сайту в текстовий документ;


За допомогою кнопок «В таблицю» та «Перенести URL та закрити» ви можете додати результати, отримані під час аналізу Sitemap, до основної таблиці. 


Зберегти URL з sitemap у файл


Після закінчення роботи видаліть результати зручним для вас способом:

  • Натисканням кнопки «Нова мапа сайту».
  • Функцією «Очистити» у головному меню вікна інструмента.

Якщо виправлення помилок займе багато часу, ви можете створити нову мапу сайту. Мануал створення мапи сайту ви знайдете в статті «Генерація мапи сайту».


Новий sitemap


3. Помилки, що визначаються інструментом «Валідатор XML Sitemap»


Помилка

Опис

Висока критичність

Битий Sitemap

Показує недоступні мапи сайту або повертає код відповіді сервера 4xx і вище: по них не вдається отримати результати.


Цільовий параметр: Код відповіді сервера

Невалідний кореневий тег Sitemap

Показує мапи сайту з неправильним кореневим тегом: за вимогами він має бути або tag.


Цільовий параметр: URL 

Помилка парсингу XML-документа

Показує XML-документи, які не вдалося розпарсити.


Цільовий параметр: URL 

Невалідний Content-Type

Показує мапи сайту у файлі індексу Sitemap, у яких у заголовках HTTP-відповіді сервера поле Content-Type не містить "text/xml", "application/xml" або "text/plain". У разі стиснення файлів Sitemap за допомогою gzip, поле Content-Type повинно містити «application/gzip».


Цільовий параметр: Content-Type

Помилка стиснення

Показує мапи сайту, які були пошкоджені під час архівації або заархівовані не за допомогою gzip.


Цільовий параметр: Код відповіді сервера

Кодування не UTF-8 

Показує мапи сайту, кодування яких відрізняється від UTF-8.


Цільовий параметр: Кодування

Sitemap, заблокований у robots.txt

Показує мапи сайту, заборонені до індексації за допомогою інструкції disallow у файлі robots.txt.


Цільовий параметр: Закрито від індексації

Макс. розмір файлу Sitemap

Показує мапи сайту розмір яких перевищує 49,9 Мбайт.


Цільовий параметр: Розмір файлу

Макс. кількість посилань у файлі індексу Sitemap

Показує файли індексу Sitemap, які містять понад 49999 посилань на мапи сайту.


Цільовий параметр: Кількість URL

Макс. кількість URL у Sitemap 

Показує мапи сайту, які містять понад 49 999 URL-адрес.


Цільовий параметр: Кількість URL

Не знайдені посилання в Sitemap

Показує мапи сайту, в яких не було знайдено жодного посилання. Це може статися, якщо файл Sitemap порожній, або його вміст виключено на вкладці «Правила» в налаштуваннях сканування.


Цільовий параметр: Кількість URL

Неправильний формат Sitemap URL 

Показує URL всередині файлу індексу Sitemap, які не відповідають стандартному маскуванню схема:[//[логін:пароль@]хост[:порт]][/]шлях[?параметри][#якор].


Цільовий параметр: Loc

Неправильний формат URL

Показує адреси сторінок, які не відповідають стандартній структурі URL: схема:[//логін:пароль@]хост:[порт]][/]шлях[?параметри][#якорь]


Цільовий параметр: Loc

Макс. довжина Sitemap URL

Показує мапи сайту, які мають довжину URL-адреси понад 2000 символів (за замовчуванням). Зверніть увагу, що ви можете змінити значення на вкладці «Обмеження» в параметрах сканування.


Цільовий параметр: URL

Макс. довжина URL

Показує сторінки, які мають довжину URL-адреси понад 2000 символів (за замовчуванням). Зверніть увагу, що ви можете змінити значення на вкладці «Обмеження» в параметрах сканування.


Цільовий параметр: URL

Кодовані Sitemap URL

Показує мапи сайту, які містять кодовані (не ASCII) символи URL. Наприклад, URL типу example.com/приклад кодується як example.com/%D1%85%D0%BE%D0%B9.


Цільовий параметр: URL

Некодовані URL усередині Sitemap

Показує URL-адреси, які містять некодовані (не ASCII) символи в URL-адресі. Наприклад, URL типу example.com/приклад, який повинен кодуватися, як example.com/%D1%85%D0%BE%D0%B9.


Цільовий параметр: Loc

Спецсимволи в URL



Показує список URL, які містять символи "*", "{", "}"


Цільовий параметр: URL

Дублікати Sitemap 

Показує дублікати мапи сайту, якщо вони були виявлені в одному або кількох файлах індексу Sitemap.


Цільовий параметр: URL

Посилання на файл індексу Sitemap

Показує мапи сайту, що містять посилання на файл індексу Sitemap.


Цільовий параметр: Джерело посилання

Середня критичність

Перенаправлений Sitemap

Показує мапи сайту, які були перенаправлені за допомогою коду 3xx відповіді сервера. Зверніть увагу: на відміну від основної таблиці тут показуються кінцеві URL..


Цільовий параметр: Код відповіді сервера

Неправильне розташування Sitemap

Показує мапи сайту, які порушують вимоги щодо розташування з документації Standard Sitemap Protocol. Мапа повинна розміщуватися на тому ж хості й з тим самим протоколом, що і її вміст.


Цільовий параметр: URL

Неправильне розташування URL

Показує список URL-адрес, які порушують вимоги щодо розташування з документації Standard Sitemap Protocol. URL всередині мапи сайту повинні розміщуватися на тому ж хості й з тим самим протоколом, що і сама мапа сайту.


Цільовий параметр: URL

Невалідний URL Priority

Відображає список URL із неправильним форматом тегу .


Цільовий параметр: Priority

Priority поза діапазоном

IПоказує список URL із тегом поза допустимим діапазоном (від 0.0 до 1.0).


Цільовий параметр: Priority

Невалідний URL Changefreq

Відображає список URL з неправильним форматом тегу tag format.


Цільовий параметр: Changefreq

Невалідний URL Lastmod 

Відображає список URL із неправильним форматом дати .


Цільовий параметр: Lastmod

Невалідний Sitemap Lastmod

Відображає мапи сайту з неправильним форматом дати .


Цільовий параметр: Lastmod

Великий час відповіді сервера 

Показує сторінки, у яких час отримання першого байта від сервера перевищує 500 мс (за замовчуванням). Зверніть увагу, що ви можете змінити значення на вкладці «Обмеження» в параметрах сканування.


Цільовий параметр: Час відповіді сервера

Sitemap Index відсутня у robots.txt

Показує файли індексу Sitemap, посилання на які не було знайдено у файлах robots.txt.


Цільовий параметр: Вказано в robots.txt

Дублікати URL

Показує дублікати URL, знайдені на всіх Sitemap. У цьому звіті всі дані згруповані за параметром URL.


Цільовий параметр: URL

Містить Byte-Order Mark 

Показує мапи сайту, які містять Byte-Order Mark (BOM, мітка послідовності байтів) - Юнікод-символ, що використовується для індикації порядку байтів текстового файлу. Він викликає проблеми зі скануванням Sitemap, тому рекомендується його уникати.


Цільовий параметр: Кодування

Низька критичність

Кодовані URL

Показує сторінки, які містять кодовані (не ASCII) символи URL. Наприклад, URL типу example.com/приклад кодується як example.com/%D1%85%D0%BE%D0%B9.


Цільовий параметр: URL

Sitemap відсутня у robots.txt

Показує файли Sitemap, посилання на які не було знайдено у файлах robots.txt.


Цільовий параметр: Вказано в robots.txt

Ця стаття була корисною?

Чудово!

Дякуємо за відгук

Даруйте, що не вдалося допомогти вам

Дякуємо за відгук

Розкажіть, як ми можемо поліпшити цю статтю!

Виберіть принаймні одну причину
Необхідна перевірка CAPTCHA.

Відгук надіслано

Дякуємо за допомогу! Ми докладемо всіх зусиль, щоби виправити статтю