Комментарий 87
к комментируемому месту / к оглавлению: диалогическому, хронологическому, монологическому
Автор: M, manin@pobox.com
Дата: 06/10/2004 01:41
Резюме: "достоверность" статистики

Достоверность статистики -- понятие многомерное. Ваша претензия была бы справедливой, если бы моей целью было получить среднее значение угадываемости по всей русской литературе. Разумеется, выборка в первом этапе никак не может считаться репрезентативной в этом смысле. (Интересно, какая могла бы...) Но моя цель совсем другая -- меня интересует в первую очередь, в каких пределах меняются эти величины. Для этого нужна выборка, репрезентативная не в смысле среднего, а в смысле крайностей, т.е. представляющая все возможные (или хотя бы все типичные) крайности, наряду с умеренными или типичными случаями.

Далее, для достоверности статистики нужно, чтобы в каждой категории было "достаточно много" фрагментов, и чтобы по каждой категории было "достаточно много" попыток. Учитывая, что попытки -- ресурс ограниченный, приходится идти на компромисс между желанием охватить побольше материала (т.е. представить побольше авторов и текстов) и желанием получить побольше попыток на каждого. Состав и объем текстов первого этапа -- результат такого компромисса.

Зато во втором (а теперь и третьем) этапе мы занимаемся объятием необъятного, понимая при этом, что набрать там сколько-нибудь приличную статистику удастся очень нескоро.   


Чтобы добавить комментарий к любому предложению этого текста, щелкните мышью по точке, которой оно оканчивается