Як знайти орфографічні помилки на сайті

Змінено Fri, 16 Feb 2024 о 04:16 PM


У Netpeak Spider 3.9 ми впровадили перевірку правопису, яка включає:

  • ‘новий параметр «Орфографічні помилки» (у групі «Контент»),
  • помилку середньої критичності «Орфографічні помилки»,
  • таблицю «Орфографічні помилки» у внутрішній базі даних,
  • спеціальний звіт про помилки «Зведення помилок орфографії» в меню «Експорт»,
  • масивний звіт «Орфографічні помилки (XL)» у меню «Експорт».

1. Навіщо потрібна функція і чим корисна?

Функція допоможе знайти помилки орфографії на всіх сторінках сайту. У програмі можна обирати, які текстові блоки перевірятимуться на помилки.


Тексти перевіряються за допомогою Windows Spell Checking API, який використовується у багатьох програмах (Microsoft Edge, Google Chrome, Telegram тощо). Перевірка доступна 70 мовами, і одночасно можна використовувати кілька словників.


Щоб виключити з перевірки слова, яких немає у словнику Windows і які не потрібно вважати помилкою, додайте їх в ігнор-лист.


Можна додавати слова в словник користувача Windows прямо з програми.


Зверніть увагу, що функція перевірки правопису працює тільки для версій Windows 8 і вище.

2. Як налаштувати перевірку правопису

2.1. Активуйте функцію

Щоб активувати функцію, відкрийте вкладку «Перевірка орфографії» налаштувань сканування та позначте «Включити перевірку орфографії».

2.2. Додати мови

Далі необхідно додати мови, якими програма перевірятимемо тексти сторінок. Для цього по черзі оберіть потрібні мови у списку, що випадає, і натисніть кнопку «Додати мову». Після додавання вони відображатимуться у полі «Додані мови».


Перевірка відбувається одночасно з усіх вибраних мов. Це зручно, адже на одній сторінці часто можуть бути тексти різними мовами. Наприклад, на російськомовній сторінці можуть бути назви товарів з англомовними словами та коментарі українською мовою.


У випадаючому списку в настройках Netpeak Spider доступні мови та діалекти, для яких встановлені мовні пакети в налаштуваннях мови Windows .


Якщо там немає потрібної мови, встановіть відповідний мовний пакет. Після встановлення мова буде доступна у програмі.


Повний список мов та діалектів можна побачити у таблиці. Список може змінюватись в залежності від версії операційної системи (це особливість Windows).

2.3. Додати слова в ігнор-лист

Додайте слова, які слід пропускати під час перевірки.


Зазвичай потрібно ігнорувати сленгові слова та спеціальні терміни, які потрібно пропустити у конкретному проекті, але вважати помилкою в інших проектах. Наприклад, на блозі Netpeak Software допускається використання сленгових слів "адмінка", "фаундер", "розшарити" і т.д., але на інших сайтах може бути небажаним використання сленгу, тому там краще не пропускати ці слова.


Рекомендуємо регулярно поповнювати ігнор-лист, щоб слова не заважали вам під час подальших перевірок. А новий спеціальний звіт з помилок «Зведення помилок орфографії» допоможе швидше відібрати слова для ігнор-листа.


Ігнор-список застосовується лише з наступного сканування.

2.4. Позначте параметри на бічній панелі

Для перевірки орфографії необхідно обов'язково відзначити параметр «Орфографічні помилки». Якщо його не відзначити, перевірка не проводитиметься. Далі потрібно в параметрах відзначити місця, де ви хочете перевіряти помилки:

  • Title — перевірятиметься текст із тегу .
  • Description — перевірятиметься текст із тегу .
  • Заголовки H1 — перевірятиметься текст із тегів.
  • Заголовки H2 — перевірятиметься текст із тегів.
  • Заголовки H3 — перевірятиметься текст із тегів.
  • Заголовки H4 — перевірятиметься текст із тегів.
  • Заголовки H5 — перевірятиметься текст із тегів.
  • Заголовки H6 — перевірятиметься текст із тегів.
  • Зображення — перевірятиме текст з атрибутів alt зображень.
  • Кількість слів — перевірятиметься весь текст із блоку .


Налаштування перевірки орфографії у Netpeak Spider

Вибір конкретних параметрів дає гнучкість у перевірці: можна перевіряти орфографію лише у текстових блоках. Наприклад, на сторінках з UGC-контентом немає можливості виправляти помилки користувачів, тому там є сенс перевіряти помилки тільки в title, description та заголовках


Параметр «Орфографічні помилки» з'являється в бічній панелі, лише якщо в налаштуваннях увімкнено перевірку орфографії.


Чим більше вибрано параметрів для перевірки орфографії, тим повільніше відбувається сканування.


Текст у блоці включає текст із заголовків і атрибутів alt зображень.

3. Помилки

Якщо під час перевірки знайдено помилки орфографії, програма визначить їх як нову помилку:

    

    • Орфографічні помилки

    Показує URL-адреси, які містять слова з орфографічними помилками в одному або декількох текстових блоках (title, description, заголовки, атрибути alt зображень, весь текст у блоці ).

4. Таблиця у внутрішній базі даних

У стовпці "Орфографічні помилки" в основній таблиці вказано кількість знайдених помилок на конкретній сторінці з посиланням на нову таблицю у внутрішній базі даних "Орфографічні помилки".


У новій таблиці показані знайдені слова з помилками, варіанти виправлення для них та текстові блоки, де помилки були знайдені.


Рекомендуємо в таблиці робити групування за параметром «Слово» для зручності роботи з помилками: для цього потрібно перетягнути заголовок параметра трохи вище заголовка таблиці.


Чому деякі правильні слова програма вважає помилкою?


Програма може вважати помилковими деякі правильні слова. Так відбувається тому, що цих слів немає в словниках мов Windows. Це нормальна ситуація для будь-якого інструменту перевірки правопису, тому що мови змінюються і неможливо створити максимально повні словники.


На щастя, є можливість поповнювати словники користувача Windows. Слово, додане до словника, більше не вважатиметься помилковим у всіх програмах на комп'ютері, які використовують Windows Spell Checking API. Тому туди варто додавати слова, які ви не хочете вважати помилкою у всіх програмах.


Користувальницькі словники Windows зберігаються в папці → «C:Users\Username}AppDataRoamingMicrosoftSpelling». Ви можете у будь-який момент перевірити список усіх слів, які ви туди відправили, відкривши файл з назвою «default.dic».


Загальні рекомендації:

  • Додавати у словник користувача слова, які ви точно не хочете вважати помилкою у всіх програмах на комп'ютері.
  • Додавати в ігнор-лист слова, які не слід вважати помилкою лише у конкретному проекті.


Таблиця перевірки орфографії з внутрішньої бази даних

5. Звіти

Ви можете вивантажити два нові правописні звіти за допомогою меню «Експорт» над бічною панеллю.

    • «Експорт» → «Спеціальні звіти про помилки» → «Зведення помилок орфографії»

    У цьому повідомленні вказано список слів з помилками та приклади URL-адрес, де їх було знайдено. Він корисний для швидкого аналізу помилок та відбору слів для ігнор-листа.


    • «Експорт» → «Масивні звіти з бази даних (XL)» → «Орфографічні помилки (XL)»

    Це експорт таблиці «Орфографічні помилки» із внутрішньої бази даних.

Ця стаття була корисною?

Чудово!

Дякуємо за відгук

Даруйте, що не вдалося допомогти вам

Дякуємо за відгук

Розкажіть, як ми можемо поліпшити цю статтю!

Виберіть принаймні одну причину
Необхідна перевірка CAPTCHA.

Відгук надіслано

Дякуємо за допомогу! Ми докладемо всіх зусиль, щоби виправити статтю