Комментарий 140
к комментируемому месту / к оглавлению: диалогическому, хронологическому, монологическому
Автор: Paulus
Дата: 19/11/2006 04:38
Резюме: Вопросы по публикации

Во-первых, у меня есть вопрос по результатам. На графиках непредсказуемости (обычной и для прозы) у прямых (ax+b) разные, причем ненулевые, b, и, по-видимому, разные a. Существенно ли это для сделанных выводов (особенно ненулевой b)? Я понимаю, что нарисованная прямая является всего лишь наилучшим приближением на данный момент и что по мере накопления экспериментальных данных может оказаться, что b действительно можно в пределах погрешности считать нулем. А если нет? Можно ли как-то интерпретировать подобную "остаточную непредсказуемость"? Например (пример совершенно непродуманный, сразу предупреждаю, только что в голову пришел), как вероятность определить, пропущено ли вообще какое-то слово? Тогда естественно ожидать, что на графике для прозы он будет выше, что пока что подтверждается экспериментальными данными.

Во-вторых у меня есть и вопрос по постановке данного конкретного (описанного в статье) эксперимента. Во всех рассуждениях непредсказуемость фигурирует как логарифм "чистой" вероятности угадать слово. Но дело в том, что эта вероятность условная ("угадать слово, в котором не менее 5 букв") и заведомо отличается от чистой! Мало того, есть основания полагать, что величина разницы зависит как от размера отсечки, так и от длины слова. Например, отсечка в 5 букв, очевидно, наиболее влияет на вероятность угадать именно пятибуквенное слово (игроки со стажем наверняка знакомы с ситуацией, когда на пропущенное место идеально подходит целая куча односложных слов из 3-4 букв, а чтобы выдумать хотя бы одно пятибуквенное, приходится долго ломать голову). Понятно, что проверить, каковы в действительности "чистые" вероятности, невозможно без отдельного эксперимента (впрочем, почему бы и нет? четвертый этап?), но умозрительно:

- Не очевидно, что зависимость чистой непредсказуемости от длины вообще линейна. 

- И даже если она линейна, естественно (см. выше) ожидать, что больше всего чистая непредсказуемость, по сравнению с определенной в настоящем эксперименте условной, возрастет для коротких слов, возвращая нас к заданному ранее вопросу о "физическом смысле" параметра b.

PS А нет ли возможности ознакомиться с [11] (Лейбов/Манин)? У меня есть еще кое-какие вопросы по постановке эксперимента (в данном случае - эксперимента в целом), но я подозреваю, что в статье уже есть значительная часть ответов.  


Чтобы добавить комментарий к любому предложению этого текста, щелкните мышью по точке, которой оно оканчивается