из песни ... не выкинешь |
[ЧАВО]
- Какой интерес в этой игре, если все задания находятся Гуголем с пол-оборота?
- Никакого. Вам сюда.
- Что в точности означает, что текст задания мне "знаком" или "незнаком"?
- Коротко говоря, если вы догадались, то ставьте "незнаком", а если вспомнили, то "знаком" (даже если потом оказалось, что вы все равно ошиблись).
В игре очки полагаются как за догадливость, так и за эрудицию. В эксперименте же меня интересует и то, и другое, но первое больше. А иного способа отличить одно от другого у меня нет. Конечно, вполне может быть так, что вы помните это место из текста, читали его, но какое там стояло слово -- не помните и угадываете, как заново. Тогда можно поставить "незнакомо". Но только если вы уверены на 200%, что вспоминание не играло совсем никакой роли -- можно ведь помнить не слово, но какая там была часть речи или стилистическая окраска, и т.д. Это считается "знакомо".- Мне попалось задание, в котором слово восстанавливалось однозначно, потому что я уже
видел(а) другой отрывок из того же стихотворения. Указывать ли, что отрывок "знакомый"?- Нет. Вы же его раньше не видели. Вы сопоставили его с другим и догадались, что тут должно стоять то же самое слово -- все честно.
- Почему иногда задание показывается с автором и заглавием, а иногда без?
- Чтобы хоть отчасти оценить роль внетекстовых факторов в восприятии текста. Очевидно, угадать слово, зная автора и название, должно быть несколько легче. Интересно, насколько именно.
- Мне попалось задание с подсказкой в заглавии стихотворения.
- Значит, вам повезло. Смело вписывайте подсказанное слово и не забудьте указать, что фрагмент "знакомый", если подсказка была прямая и недвусмысленная.
- Мне засчитали неправильный ответ из-за того, что в задании опечатка!
- Значит, вам не повезло. Напишите мне сразу же (на странице проверки задания есть ссылка) и скопируйте текст задания. Я исправлю опечатку и удалю вашу попытку. Имейте в виду, что после этого тот же фрагмент может вам выпасть повторно -- пожалуйста, на этот раз укажите, что он вам знаком.
- Мне предложили два варианта, из которых один был очевидной заменой, потому что в нем опечатка.
- Я еще не решил, как лучше бороться с опечатками в ответах. Если у вас есть идеи, напишите мне, пожалуйста.
- Мне дали задание, в котором слово угадать невозможно, потому что в нем опечатка (потому что неправильно стоят знаки препинания, потому что в прозаическом тексте нет никакой разницы между "узнаваньем" и "узнаванием", и т.д.). Это издевательство! Так испортить интересную идею!
- Короткий ответ: действительно, есть неугадываемые слова. Зато есть и однозначно угадываемые. (Странно, но на них никто не жалуется.) Очки, которые вы потеряете на первых, отыграете на вторых. Длинный ответ см. ниже.
- Почему дискриминируется хорошая буква "ё"?
- Во-первых, она не дискриминируется. Я нигде не переправлял "ё" на "е" или наоборот по сравнению с источником. Во-вторых, с точки зрения игры "е" и "ё" точно эквивалентны -- вам не засчитают правильный ответ за неправильный только потому, что вы поставили "ё" там, где в источнике "е" или наоборот. В-третьих, имейте в виду, что если во фрагменте есть "ё", а в слове задания его нет (или, опять же, наоборот) -- это еще не значит, что в задании замена. Не во всех фрагментах написание "е/ё" последовательное.
- Я правильно угадал(а) слово, а мне не засчитали очки, потому что в тексте опечатка: "Проходят дни в сомненье тяжком". Должно быть "сомненьи"!
- Короткий ответ: нет, вы ошиблись, правильно -- "в сомненье", по второму склонению. Длинный ответ см. ниже.
- Это нехорошо (глупо, неуместно, издевательство) -- загадывать имена собственные! Какое отношение это имеет к эксперименту?
- Во-первых, машину невозможно научить отличать имена собственные от нарицательных, особенно в начале строки или предложения, когда и те, и другие пишутся с большой буквы. Во-вторых, имя собственное -- тоже слово, часть текста, для эксперимента не менее интересная. В-третьих, имя имени рознь. Одно дело -- Бетси, другое -- Цирцея, третье -- Москва. Некоторые имена собственные угадываются легче, чем некоторые нарицательные.
- Почему у Саши Черного имена собственные с маленькой буквы и дефисы вместо тире?
- Есть две категории Саши Черного -- одна с дефектной пунктуацией (без заглавных букв в середине строк и без пробелов вокруг знаков препинания) и нормальная. Первая появилась случайно, я по неопытности не вычитал тексты. Когда это обнаружилось, я решил, что интересно проверить, как это повлияет на угадываемость, оставил ее как есть, и добавил вторую.
- Правильный ответ на 3-очковое задание снижает показатель результативности, это несправедливо!
- Да, снижает, если у вас результативность выше 3. Но ведь и в преферансе, например, "итоговые очки" вистующего снижаются, если играющий сыграл, даже если вистующий сделал все правильно. Это элемент случайности. Несправедливости тут нет, потому что случайность на всех действует, а не только на вас. Более того, у тех, у кого результативность выше вашей, снижение существеннее.
- В заданиях типа 2, выбирая "авторское", я рискую дать кому-то 3 очка, а выбирая "замена", отберу у кого-то в лучшем случае 1 очко. Не выгоднее ли всегда выбирать "замена"?
- Короткий ответ -- нет. Выгоднее думать.
Длинный ответ. Если я отвечаю наугад, то я получаю в среднем 3/2 очка на попытку и даю другим в среднем 1 очко на попытку. Если я всегда отвечаю "замена", я получаю опять 3/2 очка, но даю -1/2 очка. Если я думаю и отвечаю правильно с вероятностью p, то я получаю 3p очков на попытку и даю другим3(1-p)/2 - p/2 = 3/2 - 2p . Даже если считать, что очки, данные другим -- это все равно, что вычтенные у меня (что неверно, потому что они распределяются между многими людьми), все равно при вероятности угадывания выше 1/2 выгоднее думать:3p + 3/2 - 2p > 3/2 + 1/2 . А средняя реальная вероятность угадывания на заданиях типа 2 заметно выше половины.- Кому идут (или у кого снимаются) очки, если играет замена, которую предложили независимо два человека?
- Когда генерируется задание типа 2 или 3, выбирается (случайным образом) неправильный ответ одного конкретного игрока на задание типа 1 и используется в качестве замены. Этот игрок и получает (или теряет) соответствующие очки, даже если кто-то другой тоже вводил такой же неправильный ответ.
- Почему мои замены так мало играют?
- Замены играют чаще, пока они свежие, чтобы было интереснее активным игрокам. Но и старые замены продолжают быть активными. Чтобы ваши замены выдавались чаще, зовите сюда всех знакомых, кому это может быть интересно. Играя после вас, они будут отрабатывать, в том числе, и ваши замены.
- Зачем нужны прозаические тексты?
- Чтобы узнать, отличаются ли они от поэтических (значениями предсказуемости и связанности), и если да, то как именно. Вообще, прозу от поэзии отличить не так просто, как иногда кажется неспециалистам, и было бы чрезвычайно интересно, если бы нашелся независимый способ подтвердить, что верлибр -- это стихи, а ритмическая проза -- не стихи. Правда, пока я не ставлю такой задачи.
- Что такое "второй этап"?
- Во второй этап попадают те, кто прошел все 3439 фрагментов первого этапа. В нем такие же правила, но другой набор текстов. Очки во втором этапе считаются отдельно, так что это ваш шанс начать новую жизнь. В первый этап фрагменты добавляться не будут, чтобы не разбавлять статистику, так что все, что мне хочется добавить, пойдет в потенциально бесконечный второй этап.
- Что такое "третий этап"?
- Третий этап отличается от первых двух тем, что фрагменты туда вводят сами игроки. Вводить тексты не обязательно, можно просто играть, как в первых двух этапах. Хозяевам фрагментов тоже начисляются очки. Играть и вводить фрагменты в третий этап могут все, кто прошел первый. Подробности см.
- Когда и где будут опубликованы результаты эксперимента?
- Результаты будут опубликованы, когда они будут. По оценкам, надо набрать миллион попыток в первом этапе, чтобы получить более или менее надежную статистику с запасом на отбраковку данных. Пока же можно смотреть текущую статистику. Категории в ней не идентифицированы по двум причинам: чтобы не было соблазна делать преждевременные выводы, которые потом не подтвердятся, и чтобы результаты не влияли на поведение игроков.
Замечу еще, что сами данные, получаемые в ходе эксперимента, -- полный протокол всех попыток, -- наверняка могут пригодиться для самых разнообразных исследований, и я надеюсь, что это произойдет.
- Неужели по достижении миллиона попыток игра закроется?
- Конечно, нет. Во-первых, мне нужны данные и по текстам второго этапа, куда не всякая птица долетит, а во-вторых, есть задачи, для которых нужны десятки попыток на каждое слово, т.е. куда больше миллиона. Ну, и конечно, зачем закрывать игру, пока она доставляет вам удовольствие.
- Как следует произносить название игры?
- Этот вопрос мне, конечно, никто не задавал и, вероятно, никогда не задал бы. Поэтому я отвечу на него сам: пожалуйста, НИКОГДА не вставляйте слово "слова" в название -- его там нет! Произносить следует только то, что написано, с легкой паузой на месте многоточия или без нее. Можно сокращать до просто "Из песни".
- Что означает доменное имя "ygrec"?
- Во-первых, буква "игрек" как обозначение переменной величины символизирует пропущенное слово. Во-вторых, если прочесть по-французски, "игрЭк", получится аббревиатура от "ИГРа и ЭКсперимент". В-третьих, если прочесть по правилам транслита, то получится "ыгрец", который "ы швец, ы жнец, ы на дуде". Наконец, название буквы "игрек" ("греческое и") выражает сложную взаимосвязь между игрой И экспериментом в этом проекте.
Если есть еще вопросы, пишите. См. тж. отдельное ЧАВО 3-го этапа.
Я чрезвычайно признателен М. Алексеевой, Л. Галкиной, Д. Гусеву, Г. Ершовой, В. Каневскому, С. Худяковой, Е. Чечеткину и многим (действительно, многим) другим за идеи по усовершенствованию игры, помощь в подготовке текстов и просто поддержку и обсуждение.
Отдельная благодарность Л.В., придумавшей и нарисовавшей эту кнопку и таблички про дискурс,
а также В.Миниксу, взявшему на себя труд программирования многих страниц, особенно для третьего этапа.
Распространенные ответы на некоторые вопросы
- Мне дали задание, в котором слово угадать невозможно, потому что в нем опечатка (потому что неправильно стоят знаки препинания, потому что в прозаическом тексте нет никакой разницы между "узнаваньем" и "узнаванием", и т.д.). Это издевательство! Так испортить интересную идею!
- Прежде всего, насчет опечаток. Там, где текст в базе данных отличается от авторского, я его исправляю, как только узнаю об этом. Со временем все опечатки будут исправлены. Но там, где орфография авторская, я оставляю ее в неприкосновенности. Главным образом, это относится к текстам, введенным самими авторами -- текстам из "Самиздата" Мошкова и с сайта stihi.ru. Не думаю, что я вправе исправлять то, что мне или вам кажется ошибками. Стихи -- штука тонкая. Некоторое (небольшое) количество опечаток есть у Вербицкого. Чрезвычайно неортодоксальая орфография у Хармса. Его тексты были введены В. Каневским по недавнему изданию, где сохранено авторское правописание (такое, как "выпрогнит" вместо "выпрыгнет"). Был ли Хармс патологически неграмотен? Входило ли такое левописание в авторский замысел? Я не знаю. Если вы знаете, напишите мне об этом, пожалуйста. См. тж. Комментарий 24 к ПЗ.
Но нельзя ли исключить неугадываемые слова из заданий? Думаю, что нельзя. Все слова длиннее 4 букв с равной вероятностью могут быть выданы в заданиях. Теоретически, можно было бы внимательно просмотреть все три с половиной тысячи фрагментов и пометить слова для заданий, отметая слишком трудные и слишком легкие. Но во-первых, я не могу знать, какое слово вы угадаете, а какое нет, во-вторых, у меня нет столько времени (если у вас есть, сделайте свою игру сами), а в-третьих (и главных) если вы читали "Пояснительную записку", то должны знать, что меня как раз больше всего и интересуют слова, которые трудно или невозможно угадать. При этом есть существенная разница между словами, которые угадать трудно, но легко опознать как авторские, и словами, которые и не угадываются, и не опознаются. Как нетрадиционная авторская орфография может повлиять на меры непредсказуемости и связанности текста, и не выйдет ли так, что я при этом измеряю не то, что хотел -- вопрос очень интересный и непростой. Я как-нибудь соберусь написать об этом в комментариях к ПЗ. Или вы напишите, если интересно.
Как бы то ни было, тексты Хармса трижды тщательно выверены по книжке. Вот выдержка из предисловия к комментариям в ней: "В настоящем издании последовательно (за исключением текстов, сохранившихся в списках, нескольких детских произведений, а также нескольких оставшихся недоступными автографов) воспроизведена авторская орфография и пунктуация: последние исследования (А. Кобринский) убедительно подтвердили обоснованность такого решения и ущербность компромиссных подходов к публикации текстов Хармса."
(назад)
- Я правильно угадал(а) слово, а мне не засчитали очки, потому что в тексте опечатка: "Проходят дни в сомненье тяжком". Должно быть "сомненьи"!
- В русском языке три основных склонения и множество слов, которые можно считать отклоняющимися от стандарта или принадлежащими к своим отдельным типам склонения. Слова среднего рода на "-ье" склоняются по стандартному второму склонению, как "зеркальце" или "платье". В предложном падеже ед. ч. у них окончание "-е": "Она увидела себя в зеркальце и замерла в восхищенье -- в новом красном платье она выглядела сногсшибательно". Слова же на "-ие" имеют окончание предложного падежа "-и", в отклонение (это винительный падеж) от второго склонения, но это трудностей обычно не вызывает.
Однако такая орфография была кодифицирована только в ХХ веке. Раньше писали не то, чтобы как попало, но по-разному. М.Л. Гаспаров считает, что когда поэт писал "в сомненьи", он осознавал, что это предложный падеж не от слова "сомненье", а от слова "сомнение", только с редуцированным "и" в окончании.
С другой стороны, я посмотрел у Пушкина и сразу обнаружил у него рифмы вроде
Стану в смиренье
Черпать забвенье
Гаспаров же в "Русских стихах..." сообщает, что
"с XVIII века и вплоть до Пушкина допустимыми считались только точные рифмы, где совпадали как гласные, так и согласные звуки (а желательно, и буквы): "дорога - порога". С середины XIX в. допустимыми становятся приблизительные рифмы, где могут не совпадать безударные гласные буквы: "дорога - много", а потом и звуки: "дорога - к Богу".Стало быть, Пушкин в 1815 году никак не мог бы срифмовать "-нье" с "-ньи", а стало быть, он писал "в смиренье" (с точностью до ятей, ижиц и "и" с точкой). То же и у раннего Тютчева:
...Где обнялись в роскошном запустенье
И жизнь, и разрушенье...
(1828 - 1830)В душном воздуха молчанье,
Как предчуствие грозы,
Жарче роз благоуханье,
Звонче голос стрекозы.
(1835)Правда, у раннего Тютчева нашлось и "воображенье - запустенья", но при дальней рифмовке через две строки и на фоне подавляющего преобладания точных рифм.
Зато, точно по Гаспарову, у Тютчева 1860-х уже часто встречаются несовпадающие безударные гласные: взорам - метеором, альбома - знакомо, обаянье - созданья, какие - стихия, пошлее - идея. Знаменательно, однако, что один из членов пары всегда -- "а" ("я"), а другой -- "е" или "о". Ни одного примера с "и" я не нашел.
Возможно, в свете всего этого в игре следовало бы сделать исключение и считать "мгновенье" и "мгновеньи" одним и тем же словом. Но сейчас уже поздно менять правила. Если это и несправедливо по отношению к игроку, то по крайней мере можно утешаться тем, что это равно несправедливо по отношению ко всем. (назад)
.