Закон Ципфа

Американский лингвист Джордж Ципф из Гарвардского университета (George Kingsley Zipf) эмпирическим путем обнаружил закономерность распределения частоты слов естественного языка:

если все слова языка (или достаточно длинного текста) упорядочить по убыванию частоты их использования, то частота n-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру n (так называемому рангу этого слова). f * r = c, где f – частота слова в документе, r – ранг слова, c – константа.
Например второе по используемости слово встречается примерно в два раза реже, чем первое, третье — в три раза реже, чем первое, и т. д.

Ключевые следствия из закона Ципфа следующие:

  1. небольшое количество слов встречается в документах очень часто;
  2. среднее количество слов встречается со средней частотой;
    большинство слов встречается очень редко.

Комментарии

Нравиться полистать обзоры

Нравиться полистать обзоры эдакого плана.

Насущная тематика поста , да

Насущная тематика поста , да и портальчика в целом.