Анализ текста по закону Ципфа и SEO

Оптимизация

25 мая 2016

0 2670

Привет, сегодня будет очень интересная статья по оптимизации текстов по закону Ципфа. Я расскажу как не переспамить и недоспамить текст ключами.

Закон Ципфа («ранг—частота») — эмпирическая закономерность распределения частоты слов естественного языка: если все слова языка (или просто достаточно длинного текста) упорядочить по убыванию частоты их использования, то частота n-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру n (так называемому рангу этого слова, см. шкала порядка). Например, второе по используемости слово встречается примерно в два раза реже, чем первое, третье — в три раза реже, чем первое, и так далее. Википедия

На картинке наглядно показан график распределения частотностей слов и рангов (то есть такой величины, которая имеет частоты).

grafic-zakona-cipfa

Закон Ципфа в действии

Применительно к тексту этот закон можно объяснить так:

Мы выбираем самое частотное слово в тексте, и в зависимости от его частотности (встречаемости) считаются все остальные слова. При этом идеально распределенные частотности слов должны совпадать с их порядковым номером относительно числа раз их повторяемости.

Да уж, сам ничего не понял.

На пальцах: первое (самое частотное слово) определяем мы – высчитываем по внутренним предубеждениям в зависимости от размера текста. Далее нам известна длина текста (мы ее тоже определяем сами по внутренним предубеждениям или пальцем в небо – хочу текст в 500 симв. Все. Это 2 цифры, которые мы должны знать, чтобы рассчитать все остальные показатели текста. Нам остается только собрать тезаурус для написания текста. Как, что и откуда собирать я уже рассказывал ранее, а если не рассказывал, то расскажу в следующей статье. Сейчас, он просто у нас есть.

Итак, у нас есть:

  • Объем текста (в словах);
  • Частотность самого высоко конкурентного ключа;
  • Словарь используемых ТОП-слов в тексте (тематические слова).

Далее, закон Ципфа нам поможет рассчитать все частотности тематических слов, чтобы у нас получился идеальный текст.

Расчет частотностей с помощью сервиса

Конечно же, руками просчитать все частотности и оптимизировать тексты по закону Ципфа будет очень сложно и долго. У сеошников и другой работы вагон. А если для этого есть бесплатный автоматизированный сервис для проверки текста по Ципфа, то это вообще огонь!

Лично я пользуюсь этим сервисом miratext.ru/seo_analiz_text (не реклама, это действительно полезный инструмент).

Функционал сервиса для проверки текстов:

  • Рассчитывать частотности слов по закону Ципфа;
  • Считать размер, тошноту и водянистость текста;
  • Строить облако слов;
  • Строить частотные словари слов;
  • Выделять стоп-слова.

Самый главный и мощный инструмент – это словарь частотностей по Ципфу. Так же сервис строит наглядный график, сравнивает его с идеальным графиком и предлагает рекомендации по вхождениям конкретных слов в тексте.

primer-zakona-cipfa

Далее идет сам словарь:

chastotniy-slovar

Словарь не полный. Сервис строит словарь по 20 наиболее встречающимся словам – каркасу текста.

Из таблицы видно, что самое частотное слово – это «квартиры». Оно и принято за 100%, сколько бы вхождений не было, хоть вы переспамите, хоть недоспамите – самое частотное слово все равно будет принято за 100%. Это суть закона.

Далее сервис сам строит частотности остальных слов в зависимости от объема текста и числа вхождений самого встречаемого слова, принятого за 100%.

Последний столбец самый главный – рекомендации, то есть сколько вам надо убавить/добавить слов в тексте в точном количестве, чтобы максимально распределить частотности. Это круто! Вы получаете точную цифру – количество вхождений конкретного слова в текст.

Вот в этом суть закона Ципфа и сервиса. То есть вы будете точно знать какие и сколько тематичных слов вам надо использовать в тексте.

Для SEO

Все просто – для SEO этот закон очень хорошо работает.

Судя из логики –

Объем текста для ПС значения не имеет (это факт), частотность самого часто встречаемого слова на вашей совести (уж извините), все остальные слова в тексте распределены так, чтобы дать понять поисковой системе, да и любому человеку о чем текст и какова его главная суть.

Даже если текст будет говно (такое часто бывает), ваши частотности слов будут все равно правильные и главный ключ будет в приоритете в тексте – текст, таким образом, будет заточен под этот ключ. Тут уж как ни крути.

Анализ ТОПа на соответствие закону Ципфа

Приводить какие-то размышления или скрины из выдачи я не буду. Вы сами все можете посмотреть и оценить. Скажу одно – закон работает.

Даже если мы не верим в то, что он работает, проанализировав тексты конкурентов из Топа (замечу, что почему-то мы анализируем именно ТОПы – странно да? Наверно потому что поисковые системы считают их наиболее релевантными) мы точно будем знать объем нужного нам текста, более-менее определимся со словарем тематических слов и количеством этих слов в тексте, а так же, узнаем стоп-слова, которые нежелательно использовать для написания текста.

Понятное дело, что следовать закону Ципфа на 100% не нужно – текст может получиться ужасным. Мы же всегда помним о посетителях, которые будут нас читать. Так что пишем читаемые, человеческие тексты и пользуемся этим законом.

Выводы

Я, признаюсь честно, недавно раскрыл для себя эту тему с Ципфом. Но с того времени использую ее в каждом тексте и не жалею:

  • Мне стало проще писать ТЗ копирайтерам (я пишу точные цифры по количеству слов в тексте);
  • Мои тексты быстрее заходят в ТОПы;
  • Мои посадочные страницы всегда определяются как релевантные (у меня не бывает неправильных страниц по запросам);
  • Мои тексты полностью отвечают на запросы и соответствуют им;
  • Мои страницы находятся по многим смежным запросам в ТОПах.

Мнение автора является его собственностью и не претендует на истину в последней инстанции.