Комментарий 144
к комментируемому месту / к оглавлению: диалогическому, хронологическому, монологическому
Автор: M
Дата: 20/11/2006 09:54
Резюме: Смысл константы и пр.

1. Насчет параметра b в формуле U = aL + b (где L -- длина слова). Прежде всего, на первом графике (по всем текстам, длина в буквах) она незначимо отличается от нуля (0.08 +/- 0.06). По прозе и с длиной в слогах -- значимо. Со слогами самое простое объяснение в том, что есть неслоговые слова (предлоги "к", "в", "с", частицы "ль", "ж"), поэтому длина 0 вполне физична. По прозе с длиной в буквах ничего лучше вашего объяснения я придумать не смог. Нестрого говоря, если каждое слово несет количество информации, пропорциональное длине, плюс еще немного, то эту добавку можно отнести только за счет того, что слово вообще есть. Или можно включить в состав слова пробел перед ним и отнести b к нему. Поскольку в стихах наличие слова гораздо предсказуемее, чем в прозе (благодаря метру), там эта добавка близка к нулю.

2. Как влияет на угадывание тот факт, что длина слова ограничена снизу 5 буквами? Я думаю, что очень мало. Если приглядеться к графикам 1 и 3, то можно заметить, что первая точка на ообих лежит чуть ниже прямой. Возможно, это и есть понижение непредсказуемости за счет подсказки L>4. Если так, то эффект явно слабый и испортить линейность не должен.

3. Работа [11], к сожалению, пока не дописана, лежит у соавтора.  


Чтобы добавить комментарий к любому предложению этого текста, щелкните мышью по точке, которой оно оканчивается