- Як відкрити інструмент і розпочати роботу з ним.
- Функції інструменту.
- Помилки, що визначаються інструментом "Валідатор XML Sitemap".
Валідатор XML Sitemap — вбудований у програму інструмент, який допомагає вирішити такі завдання:
- Знаходити помилки у мапі сайту.
- Парсити посилання з XML Sitemap з можливістю передачі їх в основну таблицю для подальшого сканування та роботи з ними.
- Надіслати ping у пошукові системи, щоб звернути їхню увагу на зміни у файлах XML Sitemap.
Перевірка мапи сайту може здійснюватися поза скануванням самого сайту.
1. Як відкрити інструмент і розпочати роботу з ним
Відкривається інструмент трьома способами:
- Через панель керування в меню "Інструменти/Запустити" → "Валідатор XML Sitemap";
- скористатися гарячими клавішами Alt+X;
- У головному меню оберіть «Список URL» → «Завантажити з Sitemap».
Щоб розпочати пошук помилок:
1. Введіть URL-адресу мапи сайту в поле з відповідною назвою та натисніть кнопку «Старт». Після завершення сканування в основній таблиці з'явиться список сторінок, які містяться на мапі сайту. В інструменті вбудовано два режими перегляду:
- URL (Вміст Sitemap) → відображає всі сторінки, які містяться на мапі сайту;
- Мапи сайту → відображає файли з розширенням .xml.
2. У колонках таблиці перегляньте дані про наявність та відсутність атрибутів окремо для кожної URL-адреси. Атрибути та їх значення:
- Loc → URL-адреса сторінки;
- Lastmod → дата останньої зміни файлу;
- Changefreq → ймовірна частота зміни цієї сторінки;
- Priority → пріоритет URL щодо інших URL на сайті.
3. Ознайомитися зі знайденими помилками в мапі сайту ви можете на вкладці правої частини вікна інструменту. Помилки, представлені в цьому звіті, визначаються на основі офіційної документації Standart Sitemap Protocol, яка підтримується пошуковими системами Google, Яндекс і Bing .
4. Натисніть на назву помилки, щоб відфільтрувати результати та ознайомитися зі списком сторінок, на яких вона була знайдена. Також при натисканні на нижньому блоці «Інформація» відображається пояснення кожної помилки та її цільовий параметр.
5. Щоб задати індивідуальні (кастомні) налаштування фільтрів, скиньте застосований фільтр і натисніть кнопку «Налаштувати фільтр». Перед вами відкриється вікно, де можна встановити умови фільтрації.
2. Функції інструменту
За аналогією з роботою у бічній вкладці програми, в інструменті «Валідатор XML Sitemap» доступні функції:
- Застосувати → застосовує поточний фільтр та оновлює дані у таблиці.
- Розширене копіювання → копіює дані з будь-якої обраної категорії до буфера обміну, після чого їх можна вставити у зовнішню таблицю.
При необхідності ви можете надіслати мапу сайту до ping пошукових систем Google та Bing, та повідомити їх про додавання нового матеріалу на сайті.
Вивантаження результатів здійснюється за допомогою:
- Функції "Експорт" → вивантажує поточну таблицю з усіма результатами;
- Кнопки «Зберегти URL-адресу у файл» → зберігає список просканованих URL-мапи сайту в текстовий документ;
За допомогою кнопок «В таблицю» та «Перенести URL та закрити» ви можете додати результати, отримані під час аналізу Sitemap, до основної таблиці.
Після закінчення роботи видаліть результати зручним для вас способом:
- Натисканням кнопки «Нова мапа сайту».
- Функцією «Очистити» у головному меню вікна інструмента.
Якщо виправлення помилок займе багато часу, ви можете створити нову мапу сайту. Мануал створення мапи сайту ви знайдете в статті «Генерація мапи сайту».
3. Помилки, що визначаються інструментом «Валідатор XML Sitemap»
Помилка | Опис |
Висока критичність | |
Битий Sitemap | Показує недоступні мапи сайту або повертає код відповіді сервера 4xx і вище: по них не вдається отримати результати. Цільовий параметр: Код відповіді сервера |
Невалідний кореневий тег Sitemap | Показує мапи сайту з неправильним кореневим тегом: за вимогами він має бути або tag. Цільовий параметр: URL |
Помилка парсингу XML-документа | Показує XML-документи, які не вдалося розпарсити. Цільовий параметр: URL |
Невалідний Content-Type | Показує мапи сайту у файлі індексу Sitemap, у яких у заголовках HTTP-відповіді сервера поле Content-Type не містить "text/xml", "application/xml" або "text/plain". У разі стиснення файлів Sitemap за допомогою gzip, поле Content-Type повинно містити «application/gzip». Цільовий параметр: Content-Type |
Помилка стиснення | Показує мапи сайту, які були пошкоджені під час архівації або заархівовані не за допомогою gzip. Цільовий параметр: Код відповіді сервера |
Кодування не UTF-8 | Показує мапи сайту, кодування яких відрізняється від UTF-8. Цільовий параметр: Кодування |
Sitemap, заблокований у robots.txt | Показує мапи сайту, заборонені до індексації за допомогою інструкції disallow у файлі robots.txt. Цільовий параметр: Закрито від індексації |
Макс. розмір файлу Sitemap | Показує мапи сайту розмір яких перевищує 49,9 Мбайт. Цільовий параметр: Розмір файлу |
Макс. кількість посилань у файлі індексу Sitemap | Показує файли індексу Sitemap, які містять понад 49999 посилань на мапи сайту. Цільовий параметр: Кількість URL |
Макс. кількість URL у Sitemap | Показує мапи сайту, які містять понад 49 999 URL-адрес. Цільовий параметр: Кількість URL |
Не знайдені посилання в Sitemap | Показує мапи сайту, в яких не було знайдено жодного посилання. Це може статися, якщо файл Sitemap порожній, або його вміст виключено на вкладці «Правила» в налаштуваннях сканування. Цільовий параметр: Кількість URL |
Неправильний формат Sitemap URL | Показує URL всередині файлу індексу Sitemap, які не відповідають стандартному маскуванню схема:[//[логін:пароль@]хост[:порт]][/]шлях[?параметри][#якор]. Цільовий параметр: Loc |
Неправильний формат URL | Показує адреси сторінок, які не відповідають стандартній структурі URL: схема:[//логін:пароль@]хост:[порт]][/]шлях[?параметри][#якорь] Цільовий параметр: Loc |
Макс. довжина Sitemap URL | Показує мапи сайту, які мають довжину URL-адреси понад 2000 символів (за замовчуванням). Зверніть увагу, що ви можете змінити значення на вкладці «Обмеження» в параметрах сканування. Цільовий параметр: URL |
Макс. довжина URL | Показує сторінки, які мають довжину URL-адреси понад 2000 символів (за замовчуванням). Зверніть увагу, що ви можете змінити значення на вкладці «Обмеження» в параметрах сканування. Цільовий параметр: URL |
Кодовані Sitemap URL | Показує мапи сайту, які містять кодовані (не ASCII) символи URL. Наприклад, URL типу example.com/приклад кодується як example.com/%D1%85%D0%BE%D0%B9. Цільовий параметр: URL |
Некодовані URL усередині Sitemap | Показує URL-адреси, які містять некодовані (не ASCII) символи в URL-адресі. Наприклад, URL типу example.com/приклад, який повинен кодуватися, як example.com/%D1%85%D0%BE%D0%B9. Цільовий параметр: Loc |
Спецсимволи в URL | Показує список URL, які містять символи "*", "{", "}" Цільовий параметр: URL |
Дублікати Sitemap | Показує дублікати мапи сайту, якщо вони були виявлені в одному або кількох файлах індексу Sitemap. Цільовий параметр: URL |
Посилання на файл індексу Sitemap | Показує мапи сайту, що містять посилання на файл індексу Sitemap. Цільовий параметр: Джерело посилання |
Середня критичність | |
Перенаправлений Sitemap | Показує мапи сайту, які були перенаправлені за допомогою коду 3xx відповіді сервера. Зверніть увагу: на відміну від основної таблиці тут показуються кінцеві URL.. Цільовий параметр: Код відповіді сервера |
Неправильне розташування Sitemap | Показує мапи сайту, які порушують вимоги щодо розташування з документації Standard Sitemap Protocol. Мапа повинна розміщуватися на тому ж хості й з тим самим протоколом, що і її вміст. Цільовий параметр: URL |
Неправильне розташування URL | Показує список URL-адрес, які порушують вимоги щодо розташування з документації Standard Sitemap Protocol. URL всередині мапи сайту повинні розміщуватися на тому ж хості й з тим самим протоколом, що і сама мапа сайту. Цільовий параметр: URL |
Невалідний URL Priority | Відображає список URL із неправильним форматом тегу . Цільовий параметр: Priority |
Priority поза діапазоном | IПоказує список URL із тегом поза допустимим діапазоном (від 0.0 до 1.0). Цільовий параметр: Priority |
Невалідний URL Changefreq | Відображає список URL з неправильним форматом тегу tag format. Цільовий параметр: Changefreq |
Невалідний URL Lastmod | Відображає список URL із неправильним форматом дати . Цільовий параметр: Lastmod |
Невалідний Sitemap Lastmod | Відображає мапи сайту з неправильним форматом дати . Цільовий параметр: Lastmod |
Великий час відповіді сервера | Показує сторінки, у яких час отримання першого байта від сервера перевищує 500 мс (за замовчуванням). Зверніть увагу, що ви можете змінити значення на вкладці «Обмеження» в параметрах сканування. Цільовий параметр: Час відповіді сервера |
Sitemap Index відсутня у robots.txt | Показує файли індексу Sitemap, посилання на які не було знайдено у файлах robots.txt. Цільовий параметр: Вказано в robots.txt |
Дублікати URL | Показує дублікати URL, знайдені на всіх Sitemap. У цьому звіті всі дані згруповані за параметром URL. Цільовий параметр: URL |
Містить Byte-Order Mark | Показує мапи сайту, які містять Byte-Order Mark (BOM, мітка послідовності байтів) - Юнікод-символ, що використовується для індикації порядку байтів текстового файлу. Він викликає проблеми зі скануванням Sitemap, тому рекомендується його уникати. Цільовий параметр: Кодування |
Низька критичність | |
Кодовані URL | Показує сторінки, які містять кодовані (не ASCII) символи URL. Наприклад, URL типу example.com/приклад кодується як example.com/%D1%85%D0%BE%D0%B9. Цільовий параметр: URL |
Sitemap відсутня у robots.txt | Показує файли Sitemap, посилання на які не було знайдено у файлах robots.txt. Цільовий параметр: Вказано в robots.txt |
Ця стаття була корисною?
Чудово!
Дякуємо за відгук
Даруйте, що не вдалося допомогти вам
Дякуємо за відгук
Відгук надіслано
Дякуємо за допомогу! Ми докладемо всіх зусиль, щоби виправити статтю