Комментарий 25
к комментируемому месту / к оглавлению: диалогическому, хронологическому, монологическому
Автор: lolo, lo_ra@excite.com
Дата: 11/03/2003 05:35
Резюме: отдельные слова и их комбинации/двойственность/респонденты

В голову сразу же приходят по крайней мере три момента, которые предлагаемый подход ни коим образом не учитывает и которые, похоже, играют слишком важную роль в определении "меры эстетичности" произведения, чтобы от них можно было за здорово живешь отмахнуться. 

Во-первых, авторы исследования, потолковав немного о свойствах отдельной буквы в слове, перескочили оттуда на свойства отдельного слова в тексте, но полностью игнорируют исследование свойств словосочетаний. С одной стороны, это понятно: вроде на первом этапе можно ограничиться отдельными словами, а исследование инофрмативности и связанности комбинаций оставить на сладкое. С другой стороны, в таком случае и тексты для анализа надо подбирать однородные, то есть такие, в которых именно отдельные слова играют решающую "эстетическую" роль. Не исключено, что пример я приведу неудачный - к сожалению, сразу в голову ничего очевидного не приходит, но, по-моему, некорректно было бы объединять в исследовании стихи, скажем, Хлебникова и Высоцкого. У первого степень непредсказуемости отдельного слова, на мой взгляд, достаточно высока, у второго - существенно ниже, в основном, в связи с использованием огромного количества устойчивых словосочетаний и ходячих выражений. Угадать у Высоцкого слово - проще, угадать следующую строку (хотя бы примерно) - сложнее. Иначе говоря, отдельным словом ограничиваться не слишком корректно - это напоминает поиск под фонарем, ибо с выражениями такой фокус проделать куда труднее. 

Во-вторых, мой собственный опыт стихосложения (возможно, недостаточно универсальный) говорит о том, что в лирических стихах, особенно в стихах с философским подтекстом, важен не столь точный, сколь примерный смысл конкретных строк. Опять зартуднюсь привести конктетный пример, но, скажем, слова "взлететь" и "упасть" могут в определенном контексте оказаться синонимичными - с поправкой на самоиронию автора. Это, собственно, еще один аргумент, в пользу пункта 1: эстетическая составляющая зачастую живет на уровне словосочетаний и даже целых предложений, а вовсе не отдельных слов, которые вполне даже взаимозаменяемы. 

В-третьих, набирая статистику, необходимо делать поправку (вот только бы знать, какую и как) на характеристики измерительных приборов, то есть в данном случае респондентов. Мне представляется, что результаты тестов будут разными для респондентов с разным уровнем образования, а потому репрезентативность выборки респондентов - дело совсем не последней важности. Поэзия - за редким исключением забава элитарная; проводя музыкальную аналогию, я никогда бы не взялся проводить подобные исследования в области классической музыки музыки 20 века, используя в качестве респондентов любителей, скажем, джаза.  Да и любителей Моцарта и Вивальди - тоже. Даже если они заявляют, что кое-какие из предлагаемых их вниманию произведений им нравятся. 

Ну, и последнее. Область исследования представляется мне достаточно любопытной, но конкретные гипотезы, выбранные для проверки, - в значительной степени взятыми "с потолка". Может ли это быть иначе? Не исключено. Есть довольно известная методика (существуют даже соответствующие программные средства) определения "неочевидных" зависимостей между элементами конечных множеств. При этом программа сама "научается" определять эти зависимости - нужна лишь объемная выборка и приписанная каждому из множеств характеристика (например, примитивная, типа "красивая строка"/"некрасивая строка"). Если подобную выборку создаст (и оценит по принципу красивый/некрасивый) один респондент, то он может получить на выходе оцифрованные характеристики собственных предпочтений (например, его неизбежно может приводить в чувство эстетического экстаза упоминания о надувных шариках, хотя для него это будет полной неожиданностью). Этот пример, разумеется, примитивен до чертиков, но не следует полагать, что каждый человек - столь уж сложное существо. Скажем, пролистывая страницы старых опусов Буриме, я временами поражался, насколько оценки, выставляемые стихам определенными участниками, коррелируют с наличием в стихах анально-сексуальной тематики. Тут, кстати, выборка-то уже есть: история Буриме со всеми выставленными оценками: четыре строки - не столь сложное множество, подписи и оценки сканируются и обрабатываются автоматически; на получившийся массив напускается программа эмуляции нейронных сетей (входит в комплект IBM DataMiner) - и получается результат. Дальше можно сравнивать результаты, полученные для разных оценщиков. Было бы любопытно.   


Чтобы добавить комментарий к любому предложению этого текста, щелкните мышью по точке, которой оно оканчивается