Анализ текста, поиск плагиата, карта текста и вес ключевых слов

Анализ текста на плагиат, плотность ключевых словНашел интересный сервис — анализатор текста.
Что же он умеет? Перечислю по пункатам:

  • поиск копий текста указанного текста (поиск плагиата);
  • посторение карты текста (выводит список наиболее часто встречающихся слов в виде облака, как облако тегов например);
  • составление словаря текста (тот же список наиболее употребляемых слов);
  • анализ текста

На функции «поиска плагиата» думаю нет нужды останавливаться подробно. Разве что отметить, что копии текста ищутся при помощи механизма яндекс-xml, что ценно для оптимизатора (поскольку именно яндекс — основной ru-поисковик).

Проверка орфографии — тоже банальная вещь, прикручена там, по-моему, просто для галочки. Орфографию умеет проверять даже браузер, не говоря уже о любом более-менее серьёзном редакторе или блог-клиенте.

Карта текста — пригодна для быстрого анализа статьи на предмет плотности необходимых ключевых слов.
Словарю текста применения придумать не смог.

А вот функция анализа текста — вещь очень даже любопытная.
Во-первых, она выдаёт чисто статистические данные, такие как количество символов с/без пробелов или «водность текста» (насколько я понял — процен слов-связок).
Во-вторых, она подсчитает «тошноту» текста и выведет топ-10 использованных слов (вот где действительно просто и удобно проверять плотность ключевиков в статье).
В-третьих — приблизительно определит тематику текста (просто для интереса).
В-четвёртых — выдаст список наиболее часто встретившихся в тексте слов с количеством вхождений и процентом вхождений слова по отношению ко всему тексту (она выводит и ещё данные, с которыми я пока не разобрался). Процент вхождений как раз очень пригодится при проверке плотности ключевых слов в статье.

Например, если скормить анализатору текста мою статью из руководства «Пишем плагин для WordPress«, то вот что мы получим:

Общая статистика:

Длина с пробелами 3988 символов
Длина без пробелов 3475 символов
Всего слов 533
Водность текста 26/32
Тошнота 4,24
Топ10 слов плагина, wordpress, функция, событие, plugin, options, плагин, создание, публикация, hook
Словарь текста 253 слов
Словарь ядра 155 слов
Язык текста rus
Тематика текста (приблизительно) Дизайн, Работа, Программы

И первые две позиции списка наиболее встречающихся слов:
Рел. — релевантность слова

Срез Слово Колво раз Рел. Доля в ядре Доля в тексте
1 5 плагина 18 4,24 5,8% 3,3%
2 10 wordpress 13 3,06 4,2% 2,4%

Таким образом можно проверить, насколько хорошо целевая статья будет соответствовать запросам по словам «плагин» и «wordpress».

В завершение отмечу, что при анализе текста можно включить морфологию от Яндекса и задать семантическое ядро (список важных ключевиков).

Пользуйтесь 🙂

4 мысли о “Анализ текста, поиск плагиата, карта текста и вес ключевых слов”

  1. Программы по анализу ключевых слов могут только создать основную структуру, но экспертный анализ ключевых слов это нечто другое, что действительно важно для любого сайта. Читаем статью на тему [ссылка]

    1. Любопытно. Полезно при подготовке высокохудожественных текстов, коими интеренты не изобилуют и поисковики не сильно заботят с т.з. темы зметки. Чисто для самоконтроля и развития собственной грамотности — привлекательная утилита 🙂 Буду пользоваться.

  2. аха — офигенная прога — выдает, что текст не уникальный и найден на том же сайте — а в чем же тогда уникальность текста?
    анализировали наш сайт metal-gifts.ru

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *