riftsh: (Default)

Уважаемая [livejournal.com profile] yucca правильно отгадала загадку! А еще несколько участников турнира подошли к правильному ответу на опасно близкое расстояние (причем с разных сторон)!

Текст загадки состоит из самых часто встречающихся слов в Национальном корпусе русского языка (а значит, с оговорками, и в русском языке). Слова эти расположены строго по рангу, в порядке убывания частоты. Я только добавил пунктуацию и капитализацию (для удобства чтения и подчеркивания нарратива;)

На самом деле, в загадке использована вторая сотня слов (101-200), потому что первая сотня состоит в основном из служебных слов и плохо подходила для моей цели. В ней всего 11 существительных (год, человек, время, дело, жизнь, день, рука, раз, работа, слово, место), 9 глаголов (быть, мочь, сказать, говорить, знать, стать, хотеть, идти, иметь) и 3 прилагательных (новый, большой, должен). (Признайтесь, вы знали, что "должен" - это прилагательное? Я об этом узнал вчера, и теперь не могу спать. Вот до чего может довести суверенное импортозамещение модальных глаголов!).

Вот фрагмент списка, который я использовал:



Загадка содержала несколько подсказок (не считая подсказок в комментах). Я думал, что самой серьезной подсказкой будет моя предыдущая запись про исторические флуктуации частоты слов. Вдобавок, я попросил не пользоваться Гуглом, чтобы все догадались, что у загадки есть осмысленный ответ (ведь если что-то можно найти в Гугле, то оно точно имеет смысл, правда?). И наконец, неожиданно, козел Фрэнк предложил еще одну подсказку, пометив запись категорией "Дети" (мне не очевидно, почему он так поступил). Ну а дети, как известно, начинают изучение языка с наиболее частых слов. По ходу, уважаемый [livejournal.com profile] klausnick выяснил, что кому-то такому же (а может быть, страшно сказать, и более) умному, чем я, немного похожая идея использования частотного словаря уже приходила в голову. Я этого не знал, но то, что всё уже украдено до нас - не новость.

Вот электронное издание использованного словаря, а здесь исходный список.

Дополнительный бонус для участвовавших в отгадывании. Несколько человек написали, что текст в загадке как-то связан с ивритом. Хотя это и не так, но иврит и русский отличаются от некоторых других языков распределением самых частых слов в длинных текстах. В обоих языках доля самых частых слов от всех слов длинных текстов меньше чем, например, в испанском, французском, итальянском, английском и немецком. В иврите этот эффект выражен сильнее, чем в русском:

Reply

This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting

April

SunMonTueWedThuFriSat
      1 2
 
3
 
4
 
5
 
6
 
7
 
8
 
9
 
10
 
11
 
12
 
13
 
14
 
15
 
16
 
17
 
18
 
19 20
 
21
 
22
 
23
 
24
 
25
 
26
 
27
 
28
 
29
 
30