из песни ... не выкинешь |
Комментарий 140
к комментируемому месту / к оглавлению: диалогическому, хронологическому, монологическомуАвтор: Paulus Дата: 19/11/2006 04:38 Резюме: Вопросы по публикации Во-первых, у меня есть вопрос по результатам. На графиках непредсказуемости (обычной и для прозы) у прямых (ax+b) разные, причем ненулевые, b, и, по-видимому, разные a. Существенно ли это для сделанных выводов (особенно ненулевой b)? Я понимаю, что нарисованная прямая является всего лишь наилучшим приближением на данный момент и что по мере накопления экспериментальных данных может оказаться, что b действительно можно в пределах погрешности считать нулем. А если нет? Можно ли как-то интерпретировать подобную "остаточную непредсказуемость"? Например (пример совершенно непродуманный, сразу предупреждаю, только что в голову пришел), как вероятность определить, пропущено ли вообще какое-то слово? Тогда естественно ожидать, что на графике для прозы он будет выше, что пока что подтверждается экспериментальными данными.
Во-вторых у меня есть и вопрос по постановке данного конкретного (описанного в статье) эксперимента. Во всех рассуждениях непредсказуемость фигурирует как логарифм "чистой" вероятности угадать слово. Но дело в том, что эта вероятность условная ("угадать слово, в котором не менее 5 букв") и заведомо отличается от чистой! Мало того, есть основания полагать, что величина разницы зависит как от размера отсечки, так и от длины слова. Например, отсечка в 5 букв, очевидно, наиболее влияет на вероятность угадать именно пятибуквенное слово (игроки со стажем наверняка знакомы с ситуацией, когда на пропущенное место идеально подходит целая куча односложных слов из 3-4 букв, а чтобы выдумать хотя бы одно пятибуквенное, приходится долго ломать голову). Понятно, что проверить, каковы в действительности "чистые" вероятности, невозможно без отдельного эксперимента (впрочем, почему бы и нет? четвертый этап?), но умозрительно:
- Не очевидно, что зависимость чистой непредсказуемости от длины вообще линейна.
144) - И даже если она линейна, естественно (см. выше) ожидать, что больше всего чистая непредсказуемость, по сравнению с определенной в настоящем эксперименте условной, возрастет для коротких слов, возвращая нас к заданному ранее вопросу о "физическом смысле" параметра b.
PS А нет ли возможности ознакомиться с [11] (Лейбов/Манин)? У меня есть еще кое-какие вопросы по постановке эксперимента (в данном случае - эксперимента в целом), но я подозреваю, что в статье уже есть значительная часть ответов.
Чтобы добавить комментарий к любому предложению этого текста, щелкните мышью по точке, которой оно оканчивается