Лекции по когнитивным наукам выпуск 7



Скачать 374.35 Kb.
Дата27.04.2016
Размер374.35 Kb.
ТипЛекции

ЛЕКЦИИ ПО

КОГНИТИВНЫМ НАУКАМ

Выпуск 7

Редактор В. Д. Соловьев









Осведомленность, поток информаци
и лингвистическая форма



Гертруда Фэнк-Оцлон


Казань 2002

ЛЕКЦИИ ПО

КОГНИТИВНЫМ НАУКАМ

Выпуск 7

Редактор В. Д. Соловьев









Осведомленность, поток информации и лингвистическая форма


Гертруда Фэнк-Оцлон

Казань

«Отечество»

2002

Публикация очередного выпуска серии осуществлена в рамках издания трудов школы по компьютерной и когнитивной лингвистике (Казань, 2002) при финансовой поддержке Федеральной целевой программы “Интеграция”, проект 242 направления 1.6.



Гертруда Фэнк-Оцлон
Осведомленность, поток информации и лингвистическая форма

Серия «Лекции по когнитивным наукам» включает учебные лекции и обзоры по различным разделам когнитивных наук. «Лекции» могут быть использованы в учебных курсах в вузах.

Автор настоящего выпуска - профессор Университета Клагенфурта (Австрия). Лекция посвящена проблеме взаимосвязи частотности слов и их грамматических форм.


© Гертруда Фэнк-Оцлон, 2002

1. Введение

Общей темой всех работ (Fenk-Oczlon 1989a, 1989b, 1990a, 1990b, 1991), в совокупности составляющих мою диссертацию "Осведомленность и лингвистическая форма" ("Geläufigkeit und sprachliche Form"), является влияние частоты употребления на лингвистическую форму посредством "промежуточных переменных" когнитивного представления – таких, как осведомленность (familiarity), доступность (accessibility), предсказуемость (predictability) и субъективная информативность (subjective information). Участие, по прошествии десяти лет, в симпозиуме "Частотные эффекты и выявленная грамматика" дало мне ощущение того, что избранный мною подход все еще актуален и обладает существенным потенциалом для разрешения многих лингвистических проблем, еще не обсуждавшихся с этой точки зрения. Это и побудило меня сделать предлагаемый читателю обзор упомянутых работ, которые (за единственным исключением 1989а) опубликованы на немецком, а потому и осведомленность в них русскоязычныхi специалистов не слишком высока. Этот обзор дополнен некоторыми комментариями по результатам исследований других авторов.

Я начинаю с теоретических рассуждений (глава 2), касающихся той роли, которую играют когнитивные механизмы, связывающие частоту употребления и лингвистическую структуру, и привожу примеры, показывающие преимущество частотных объяснений при рассмотрении некоторых лингвистических структурii. В последующих главах рассматриваются эмпирические результаты, относящиеся к различным уровням лингвистического описания - фонологии (глава 3), морфологии (глава 4) и синтаксиса (глава 5). В главах 3 и 4 дается сводка результатов (из Fenk-Oczlon 1989b, 1990b), касающихся методов, с помощью которых частота лингвистических единиц влияет на процессы редукции. Эти результаты подтверждают общий тезис о том, что "частотно обусловленная дифференцирующая редукция пронизывает все языковые формы..." (Bybee 1994: 297). В главе 5 излагаются результаты (из Fenk-Oczlon 1989a) о влиянии частоты на порядок слов.

Влияние, которое оказывает частота употребления на процессы редукции, а потому - и на длину лингвистических форм, равно как и ее влияние на порядок слов, по всей видимости, вносит существенный вклад в относительно равномерное течение лингвистической информации.


2. Частотность, когнитивная стоимость и равномерное течение лингвистической информации




    1. Частотность и когнитивная стоимость

Частота лингвистических сегментов – слогов, слов, фраз и пр. – не оказывает прямого эффекта на структуру языка, но влияет, в первую очередь, на когнитивные процессы. Следствием большей частоты употребления сегментов является большая осведомленность с ними, с одной стороны, и меньшая когнитивная стоимость их воспроизведения и восприятия, с другой. Когнитивные же процессы, разумеется, вовлечены во все процессы активного и пассивного использования языка – его планирование, артикуляцию, восприятие. Тот, кого мы обычно называем "говорящим", например, является одновременно и "слушающим" свое собственное воспроизведение речи. Словарь субъекта речи активируется не только в явном речевом поведении, но также во внутреннем монологе, при внутренней оценке разных способов формулировки и субвокальном запоминании. "Фонологическая петля" активированной памяти (Baddley и др. 1998), по всей видимости, играет очень важную роль при заучивании необычных фонологических форм новых для нас слов.

Концепция осведомленности (familiarity) тесно связана с концепциями наличия (availability) и доступности (accessibility) (см. Ertel 1977). Высокая осведомленность, включающая высокую степень знакомства с определенным контекстом, проявляет себя в более быстром и точном по результатам восстановлении и предсказании содержания информации, идентификации и распознавании стимулирующих образцов, а также большей скорости и точности психомоторных реакций. Несмотря на достаточно далекую от частотной концептуализации прототипичности в (Rosch, 1978), упомянутые выше проявления осведомленности можно рассматривать также как проявления прототипичности. Высокая частота может рассматриваться как фактор, обусловливающий прототипичность в трех аспектах (Fenk-Oczlon 1987/1988) - как частота характеристик, определяющих фамильное сходство, как относительная частота в определенном контексте и, наконец, как "частота проявления" (Barsalou 1985: 631), т.е. частота, с которой субъекты "имеют опыт знакомства с некоторой сущностью в качестве члена определенной категории". В (Nosofsky, 1988) приводятся дальнейшие свидетельства в пользу "частотно-зависимой" модели прототипичности.

Осведомленность также проявляет себя в лучшей памяти. Способность к немедленному воспроизведению списка двусложных слов лучше в случае, когда эти слова лучше знакомы испытуемым, т.е. ниже "субъективная информативность" слов (Fenk 1977). Возможна количественная оценка осведомленности и "когнитивной нагрузки" в терминах теории информации (Fenk 1986, Fenk-Vanoucek 1992); при этом оказывается, что термины "субъективная информативность" и "избыточность" опять-таки тесно связаны с "(относительной) частотой" элементов и их комбинаций. Как отмечается в (Goldinger 1998), помимо идиосинкратических, специфических для определенного контекста эффектов, отмеченных в лабораторных тестах, остальные проявления восприятия слов отмечены практически во всех способах проведения экспериментов и для всех участников. Примерами таких явно проявляемых эффектов являются частота слов, семантическая основа и благоприятство контекста... влияние частоты слов и семантической основы прослеживается в большинстве хранимых следов. Знакомясь со словом во многих контекстах, человек приходит к признанию его высоко-частотного статуса, синтаксических ролей и ассоциативных связей с другими словами. Базовое предпосылка когнитивной психологии заключается в том, что источники избыточной информации могут попеременно использоваться при восприятии и запоминании (Neisser 1967). Запоминая слова в различных контекстах, человек копит мириады путей возврата к этим словам. (Goldinger 1998: 268)

Очевидно, частота и осведомленность – центральные факторы когнитивного поведения. Не удивительно, что можно найти свидетельства непосредственного выражения этих факторов в процессах познания. Наш когнитивный аппарат, с присущей ему способности к обучению, весьма чувствителен к частоте. Этот аппарат автоматически, без какого-либо специального приказа или требования, конструирует некоторое представление относительных контекстно-зависимых частот событий или элементов. Согласованность объективного и субъективного распределения частот не вполне совершенна, что проявляется в систематических сбоях (см. Kahnemann и др. 1982). И все же эта согласованность выше, чем ожидалось в ранних оценочных исследованиях (см. краткий обзор в Fenk-Oczlon 1991:365).

Определенные параметры в событийных потенциалах (event-related potentials, ERPs) в наших экспериментах по электроэнцефалографии (ЭЭГ) также могут быть рассмотрены как проявления осведомленности. В экспериментах по кондиционированию амплитуда пропорциональной негативной вариации (contingent negative variation, CNV) ковариантна относительной частоте, с которой за первым, индикативным стимулом следует второй, императивный (Walter 1964; см. также Rockstroh и др. 1982:14). Другими словами, CNV изменяет значение в зависимости от переходной вероятности между двумя стимулами. Запаздывающие компоненты вызванных потенциалов снова изменяются в зависимости от предсказуемости стимула.

При непредсказуемых, с высокой вероятностью, стимулах компонента P300 - минимум волны, появляющийся примерно через 300 миллисекунд после начала предъявления стимула – выражается более явно, соответствуя более низкой субъективной вероятности или более высокой информативности стимула (Rockstroh и др. 1982 : 8). Амплитуда этой компоненты часто интерпретируется как мера количества внимания, специально уделяемого неожиданным и достаточно удивительным событиям. Компонента N400 – негативная компонента с запаздыванием около 400 миллисекунд – по-видимому специфична для языковой обработки и ковариантна "лексическому доступу" ("lexical access"iii).

В проведенных в 1980 г. исследованиях (Kutas and Hillard 1980:99) были записаны ERP людей, читавших предложения из семи слов, предъявлямых по одному слову за раз. Некоторые из предложений были дополнены словами, которые были либо "физически", либо семантически некорректны – например, "Он намазал теплый хлеб носками". Эти два типа отклонений были связаны с отчетливо отличавшимися ERP-компонентами – запаздывавшей негативной волной (N400) для семантических отклонений и запаздывавшей позитивной – для физических отклонений. Более того, оказалось, что слова, вызывающие большие значения N400, запоминаются хуже, чем слова с малым N400 (Neville и др. 1986). В экспериментах по лексическому распознаванию редко встречающиеся слова продуцировали бóльшие значения компоненты N400, чем встречающиеся часто (Smith and Hallgren 1987).

Однако частота употребления отражается не только в разных амплитудах событийных потенциалов. В работе (Osterhout et al 1997:143) проверялась справедливость двух гипотез - верно ли, что разница в запаздывании негативных компонент ERP вызывается различиями классов слов, или же "они вызываются количественными различиями в частоте и длине слов". По результатам исследований, было сделано заключение о том, что "запаздывание негативных компонент зависит от частоты и длины слов, а не от классов слов..." (Osterhout 1997:163). Здесь уместно добавить, что одна из этих "независимых" переменных, а именно – длина слова, в свою очередь, может быть описана как зависящая от частоты (см. главу 4).

Диаграмма 1 иллюстрирует неявную связь между частотой и лингвистической формой. Связующее звено, передающее влияние частоты на лингвистическую форму, названо на диаграмме "когнитивной стоимостью" - специально для того, чтобы подчеркнуть, что все зависимости на диаграмме управляются действующими в когнитивных и коммуникационных процессах принципами экономии. Все результаты, описываемые в следующих главах, могут быть поняты с точки зрения именно таких принципов экономии.

Однако, термины подобные когнитивной стоимости, трудности, легкости, осведомленности и субъективной информации описывают относительные понятия. Все они ссылаются на некоторое отношение между определенными элементами, с одной стороны, и определенным человеком (или группой людей), с другой. Элемент, незнакомый (трудный для восприятия, необычный, информативный) персоне X, может быть, напротив, знаком (легок для восприятия, ожидаем, избыточен) персоне Y или той же персоне X в более поздний момент времени. Эти понятия могут быть задействованы только в психологических экспериментах с ограниченным числом участников. Если же цель заключается в исследовании зависимости лингвистической формы от частоты, мы должны игнорировать когнитивные переменные. Единственная доступная и измеримая независимая переменная – это частота (на диаграмме 1 - короткая прямая стрелка, ведущая от частоты к лингвистической форме). Однако было бы ошибкой исключить когнитивный аспект из процесса моделирования взаимосвязей, равно как и из процесса порождения эмпирических гипотез о сущности этих взаимосвязей.

Теория маркированности (Markedness Theory) и теория естественности (Naturalness Theory) также представляют собой подходы теоретической лингвистики, обращающиеся к таким понятиям, как когнитивная стоимость (Mayerthaler 1982) и когнитивная легкость. Касаясь экстралингвистических оснований лингвистической (т.е. морфологической) естественности, сторонники этого подхода (Dressler и др. 1987) упоминают о нейропсихологических ограничениях восприятия и ограниченности памяти. "На данном этапе, 'более или менее естественное' (по отношению к универсалиям) соответствует 'более или менее легкому' для человеческого мозга" (Dressler и др. 1987: 11f). По определенной причине, однако, эти авторы не берут в расчет (или даже отрицают) тот факт, что частота конструкции является фактором, определяющим адекватно его когнитивную стоимость.

"Эвристические источниками", в которых, как полагается, проявляется "естественность/маркированность" служат, например, то, что менее маркированное обычно затрагивается афазией позже, чем более маркированное, раньше понимается при восприятии речи, более часто по типу и элементам, а также служит первым элементом в "застывших биномиалах" (freeze), т.е. в условно упорядоченных парах (Dressler et al 1987:11f).

Я сделала попытку обратить эту аргументацию, показав, что в "источниках маркировки" термин "маркированность" может быть легко заменено термином "частота". В тех же случаях, когда содержание этих терминов расходится, частота служит лучшим инструментом предсказания (Fenk-Oczlon 1991). Отметим снова, что упомянутые выше авторы не считают частоту фактором, уместным при объяснении тех аномальных случаев, которые они называют "обращением маркированности". Однако, все эти явления вовсе не аномальны и представляют собой ничто иное, как "обращение частоты" (см. также Greenberg 1966 и Tiersma 1982).

Более того, частота является вполне осязаемой эмпирической переменной, в то время как маркированность – теоретическая конструкция. Таким образом, можно сказать, что, относительно независимо от степени маркированности, чаще употребляемое по причине естественной рельефности или культурной важности:



  1. раньше усваивается детьми

  2. меньше затрагивается афазией

  3. легче усваивается и декодируется

  4. лучше сохраняется при нейтрализации

  5. лучше сохраняется при регуляризации парадигм

  6. менее регулярно

  7. кодируется в более кратких морфологических формах

  8. занимает начальную позицию в упорядоченных парах.

Эмпирические результаты, относящиеся к правилу морфологии (g) и правилу порядка слов (h) обсуждаются в разделах 4 и 5.

2.2. Частота и равномерное течение лингвистической информации

Для того, чтобы коммуникация была эффективной, не должен быть превышен некоторый, определяемый возможностями когнитивных ресурсов, верхний предел объема информации, передаваемой за единицу времени. С другой стороны, высокая степень избыточности является не только тратой когнитивного потенциала, но означает также неэкономное расходование знаков, времени и энергии, что определяет соответствующий нижний предел. В эффективной и экономной коммуникационной системе изменения в потоке информации не должны быть слишком резко выраженными и средний объем передаваемой информации должен быть адаптирован к пределам наших возможностей.

Правило "чем чаще, тем короче" вносит свой вклад в тенденцию речи к относительно равномерному течению лингвистической информации. Высокая частота означает, в терминах теории информации, низкую информативность. Элемент, несущий малый объем информации может быть обработан за короткое время. Следовательно, мы можем ожидать наличия некоторой пропорциональной зависимости между объемом информации, содержащейся в слове и длиной этого слова. Эта гипотезу можно подтвердить, основываясь на статистических данных (Fucks 1956) об относительной частоте различных длин слов в 9 разных языках (Fenk и Fenk 1980) - чем больше информации, тем более продолжительно и, следовательно, относительно более постоянно течение лингвистической информации. Вычисленный для 34 языков набор кросс-лингвистических корреляций между четырьмя переменными, а именно – числа слогов, измеряемое в фонемах, числа слов, измеряемое в слогах, и числа предложений, измеряемое в слогах и словах – показывает тенденцию всех этих языков к ограниченной вариации длительности предложений, информативности предложений и скорости течения информации внутри предложений (Fenk и Fenk-Oczlon 1993, Fenk-Oczlon и Fenk 1999).

    1. Частота слов как определяющий фактор фонетической редукции


Констатация того факта, что часто употребляемые слова редуцируются быстрее, чем мало употребляемые, содержится во многих работах, например (Bybee 1994, Fidelholtz 1975, Hooper 1976, Mańczak 1980, Phillips 1984, Zipf 1929). Тем не менее, естественные фонологисты (Natural Phonologists) оспаривают тот факт, что облегчающие артикуляцию фонологические процессы смягчения, такие фоновые процессы, как редукция гласных, смягчение или удаление консонант, монофтонгизация а также процессы ассимиляции типичны для небрежной или быстрой речи и являют собой фоностилистические варианты (см. Donegan и Stampe 1979, Dressler 1984). Снова, частотные аргументы не берутся в расчет.

В работе (Fenk-Oczlon 1986b) была предпринята попытка показать, что фоновые процессы затрагивают, в первую очередь, часто употребляемые слова, а также то, что частота элементов является ключевым фактором таких процессов; в небрежной или быстрой речи редукция также ограничена наиболее часто встречающимися словами. В терминах частотности был проведен анализ примеров из литературы по лексической диффузии. Так, при анализе примеров аферезиса в быстрой речи американских студентов из (Kypriotaky, 1973) ясна видна зависимость между частотой лексической единицы и "склонностью к удалению". В принадлежащих к 1000 наиболее часто употребляемых в английском языке словах, таких, как about, because, around, suppose, remember, American, enough, before, almost, expect, except, instead, escape, explain начальные слоги удаляются в небрежной или быстрой речи гораздо чаще, чем в реже употребляемых словах. То же верно и для русского языка. Примеры удаления гласных, согласных и даже слогов из (Баринова, 1971) показывают, что, хотя процессы редукции происходят сначала в бытовой повседневной речи, не все элементы склонны к удалению в равной степени. Например, тебя [т'я], ходит [хоит], видит [в'иит], ничего [н'ич"о], сегодня [с''од'н'']. Все эти слова принадлежат к 204 наиболее часто употребляемым словам в русском языке (Josselson 1953).

Другие эмпирические результаты, касающиеся роли частоты в фонетической редукции – побочный результат исследований по анализу порядка слов в застывших парах (freeze). В (Fenk-Oczlon 1989a, см. также главу 5) были представлены экспериментально подтвержденные аргументы в пользу того, что принцип " чаще употребляемое слово идет прежде реже употребляемого" во многом превосходит прежние фонологические правила, как то - "в первом слове меньше слогов, чем во втором", "в первом слове меньше начальных согласных и меньше конечных согласных", "в первом слове меньше шумящих (более звонких) начальных согласных, но больше звонких конечных согласных", и "в первом слове больше кратких гласных" (Malkiel 1959, Cooper и Ross 1975, Ross 1980).

Для Росса (Ross 1980) все эти правила являются выражением противопоставления большей и меньшей длины. Меньшее количество слогов, более короткие гласные, меньшее количество начальных и конечных согласных делают слово короче. Но фонологические правила также могут быть выражением большей частоты первого слова по сравнению со вторым. Меньшее количество шумящих среди начальных согласных также может быть связано с частотой. Некоторые примеры из (Fenk-Oczlon 1989a), приведенные в таблице 1, показывают, что группы начальных согласных относительно редки в классе наиболее часто употребляемых слов.



3.1. Частота и ослабление согласных: почему первое слово в застывших парах, по крайней мере в английском языке, склонно содержать менее шумящие начальные согласные?

Росс признает, что не смог выявить связи между краткостью и тем фактом, что первое слово склонно содержать менее шумящие начальные согласные (Ross, 1980). И в этом случае частота снова может введена в качестве объясняющего фактора. Проведенный в (Fenk-Oczlon 1989a, 1989b) анализ отношения между степенью шумности, согласно шкале Росса, и частотой начальных согласных в английском языке, проведенной на основе статистических данных из (Thorndike и Lorge), дал следующие результаты (Fenk-Oczlon 1989a, с. 524). Если взять все слова, начинающиеся с одного из промежуточных звуков [y],[w] и [h], за 100%, то их доля в группе наибольшей частоты AA (согласно Thorndike и Lorge – 100 или более на миллион) составляет 11.5% (см. таблицу 2). Сосчитанный аналогично процент слов, начинающихся с плавных, носовых или фрикативных звуков, существенно ниже, а именно – 6.3%. Точнее, соответствующий процент составляет 5.5% - для плавных, 6.5% - для носовых и 6.6% -для фрикативных звуков; среди последних, выделяются звуки [] и [] с 15.5%. Среди слов, начинающихся со взрывного согласного, т.е. наиболее шумящего звука, лишь 4.5% находяться в группе наиболее часто употребляемых. Таким образом, в классе чаще всего употребляемых слов распределение частот начальных согласных (таблица 2) существенно отличается от распределения в общем случае. В классе АА доля шумящих много меньше, а доля нешумящих – много меньше, чем в общем случае.

Как видно из таблицы 3, для 1000 наиболее часто употребляемых слов в английском языке, доля слабых начальных согласных [y], [w], [h], [], [] резко падает при переходе от частотного класса 1-500 к частотному классу 500-1000 (по Thorndike и Lorge).

Таким образом, в английском языке существует ясная взаимосвязь между слабыми начальными согласными и частотой - чем чаще употребляется слово, тем слабее его начальная согласная. В (Bybee, 1994) также приводятся доводы в пользу того, что теория слабых согласных должна содержать, помимо описания специфичных для конкретного языка фонетических факторов, распределение согласных в классах более и менее часто употребляемых словах.

Интересен также факт, что, среди 1000 наиболее часто употребляемых слов английского языка, число слов, начинающихся с гласной, уменьшается с 16.8%, для класса 1-500, до 13.2%, для класса 500-1000. По крайней мере, ясно, что эти слова начинаются с гласной потому, что их прежние начальные согласные уже успели исчезнуть. Аналогично, в современном английском языке наблюдается удаление /y/, /w/, /th/ в таких словах, как yesterday, woman, wood, the, them и т.д. (Hudges и Trudgill 1979, цитируется по Alexander 1988)

Поразительно, что начальное [] - более слабое, чем [] - появляется лишь в крайне часто употребляемых местоимениях – таких, как they, the, them, their, that, this, these, then и т.д., несмотря на то, что все эти слова в прошлом начинались с [] (Jespersen 1933, с. 550).

В некоторых австрийских диалектах можно наблюдать ослабление начального /s/ до /h/. Хотя этот процесс и не столь продуктивен, он снова наблюдается лишь в часто употребляемых словах - таких, например, как san (sind) [han]: [Mir han gwen] wir sind gewsen ("мы побывали").

    1. Частота употребления и длина форм - мотивируется ли длина лингвистических форм экономией или иконичностью?

В естественной морфологии явно утверждается, что частота – лишь эпифеномен "семантической маркированности", проще говоря - менее семантически маркированные единицы чаще употребляемы. Однако, это положение не имеет никакой силы при прояснении вопроса о длине морфологических форм (Mayerhaler 1981). Тем не менее, решающим фактором при определении длины форм снова считается "семантическая маркированность" – чем "более семантически маркирована" форма, тем она длиннее.

Однако "... даже при кратком рассмотрении ясно, что ... морфологическая сложность не просто иконическая мера семантической сложности, но мотивированная экономией мера прагматической осведомленности" (Haiman 1985: 150). Согласно принципу экономии, часто употребляемые слова должны быть короче, а мало используемые формы – длиннее.

4.1. Длина видовых форм в русском языке

Для того, чтобы пролить свет на проблему - мотивируется ли длина слов экономией или иконичностью, была сделана попытка определить, какое из относящихся к делу измерений – семантическая маркированность или частота употребления – способна лучше предсказать длину видовых и падежных форм в русском языке (Fenk-Oczlon 1990). Для этого была дана характеристика 67 русских видовых пар сначала в терминах частоты употребления а затем, на полученной основе, - в терминах длины слов. Статистические данные были взяты из (Штейнфельд и Засорина), цитируется по (Brue, 1990). В 50 из 67 рассмотренных видовых пар, более часто употребляемый член пары, в совершенной или несовершенной форме, был также и более коротким по длине. В шести оставшихся случаях выполнялось обратное соотношение, одиннадцать же остальных не позволили сделать однозначного заключения. Приведем некоторые примеры из (Fenk-Oczlon 1990b, с. 58f).



  1. Примеры более короткой совершенной формы

Несовершенная форма Совершенная форма

a. давать дать

b. начинать начать

c. покупать купить

d. ложиться лечь

e. становиться стать

f. садиться сесть


  1. Примеры более короткой несовершенной формы

Несовершенная форма Совершенная форма

a. мочь смочь

b. играть сыграть

c. думать подумать

d. слушать послушать

e. стараться постараться

f. видеть увидеть

Во всех приведенных выше примерах чаще употребляемая форма является также и более короткой. В примерах (d)-(f) из (1), более часто употребляемая форма даже не содержит рефлексивный аффикс –ся. Это заставляет нас вспомнить постулат (Haiman 1983, с. 804) о том, что более предсказуемый рефлексивный аффикс имеет тенденцию к сокращению – как, например, в случае русского себя > -ся. В приведенных примерах это может даже означать, что наиболее предсказуемый суффикс имеет нулевое выражение. Исторические данные показывают (Mayo 1985), например, что глагол седати-сести, "садиться", не имел рефлексивного аффикса в обоих видовых формах в Смутное время (17 век), и появился затем лишь в менее употребляемой несовершенной форме.

Добавим, что часто формулируемое соответствие между иррегулярностью и частотой находит подтверждение и в наших примерах. В 32 из наших 67 видовых пар, один из членов пары принадлежит к непродуктивному классу глаголов и, в 30 случаях из 32, является и более часто употребляемым; лишь в двух случаях верно обратное. Согласно (Исаченко, 1968: 25), недостаток продуктивности флективных типов тесно связана с иррегулярностью высокой частотой употребления. Таким образом, непродуктивные классы русских глаголов, по-видимому, можно сравнить с сильными глаголами (strong verbs) в английском и немецком языках.

Теория маркированности затрудняется определить, какой из видов глагола должен быть более коротким. Согласно (Jacobson 1939/1971) и (Маслов 1958), совершенная форма – маркированный, а несовершенная – немаркированный вид глагола. Тогда, по принципу иконичности, совершенная форма должна быть более сложной по морфологии. Однако, как мы видели, это неверно. "Исследование языков не выявляет один из видов глагола как ясно немаркированный, а другой – как маркированный..." (Bybee, 1985: 147). Чем более грамматическая категория связана с изучением слов в терминах значащих компонент, тем более сложно определить универсальные веса маркированности (см. также Tiersma, 1982). Использование определенного вида глагола в значительной мере зависит от его значения. Чем более динамичен глагол, тем более он сильна тенденция использовать его в совершенной форме (Breu 1980). И, чем более часто это глагол используется, тем он, скорее всего, более краток. Семантическая немаркированность и высокая частота использования обычно совпадают. Но в том случае, когда они расходяться, именно частота служит фактором, определяющим длину формы. По видимому, частота также служит лучшим предсказателем длины падежных форм, чем универсальное присваивание маркированности. Чем чаще употребим падеж в конкретном языке, тем более он склонен иметь нулевое кодирование.


4.2. Родительный падеж множественного числа в русском языке


Часто заявляется (см., например Greenberg 1966), что прямые падежи (именительный и винительный), в их сравнении с косвенными, имеют нулевое выражение. Это предполагает, что "прямые падежи составляют немаркированную категорию" (38). Подобным же образом, утверждается, что, "как правило, ни в одном языке морфологическое большинство аффиксов прямых падежей не превосходит количества аффиксов косвенных падежей. Однако, существуют языки, в которых морфологическое большинство аффиксов косвенных падежей превосходит количество аффиксов прямых падежей" (Haiman 1985: 137).

Исключением из этого общего правила является родительный падеж множественного числа в русском языке женского или среднего рода, имеющий нулевое выражение:

Именительный падеж Родительный падеж

единственного числа множественного числа

рука рук

комната комнат

неделя недель

село сел


Нулевое выражение родительного падежа множественного числа не может быть объяснено его семантической маркированностью, но может быть объяснено его высокой частотой употребления. В русском языке родительный падеж множественного числа выполняет много функций и потому является исключительно часто употребляемым (Штейнфельд 1963). При столь частом употреблении, большая длина была бы неэкономной. Следовательно, контриконическое нулевое кодирование родительного падежа множественного числа, в любом случае, является экономным кодированием.

Можно спросить – а почему же в этом случае мужской род утерял нулевое кодирование, которое он имел в древнерусском? Возможное функциональное объяснение состоит в том, что в развитии языка сосуществуют конкурирующие тенденции – например, тенденция к ясности изложения, и тенденция к его экономности. После появления "родительного/винительного", винительный падеж в случае одушевленных предметов получил окончание родительного – процесс, закончившийся в конце 18 века. Нулевое кодирование множественного числа в родительном падеже не позволяло, в случае одушевленных предметов мужского рода, сделать различие между винительным падежом дополнений во множественном числе и подлежащим в единственном числе. Примерно в то же время появляется маркировка –ов для родительного падежа множественного числа. Но эта морфологическая маркировка не распространилась на все формы мужского рода. И снова, исключения находятся среди слов, родительный падеж множественного числа которых используется очень часто (Fenk-Oczlon 1990b: 66).

Похожие проблемы универсального присвоения маркированности становятся явными, когда делаются попытки объяснения различных морфологических форм агента в номинативно-аккузативных и эргативных языках. В номинативно-аккузативных языках подлежащее в именительном падеже (т.е. агент) прототипически и морфологически не маркированы (Givón 1984, с. 149), в то время как в эргативных языках эргативные субъекты (агенты) имеют такую маркировку. Как объяснить этот факт с точки зрения теории семантической маркированности? Для Майертхалера (Mayerthaler 1981), агент – это универсально менее маркированный субъект. Но почему агент (субъект) должен быть семантически не маркирован в номинативно-аккузативных языках, а в эргативных языках – маркирован?

Снова можно видеть, что определения универсальной маркированности достаточно сложны, а частотные аргументы могут предложить более простое объяснение подобных фактов – наиболее часто употребляемые падежи морфологически не маркированы. В номинативно-аккузативных языках наиболее часто употребляется именительный падеж, поскольку каждое полное предложение с номинальным субъектом содержит субъект в именительном падеже, в независимости от того, транзитивно это предложение или нет. В эргативных языках, с другой стороны, абсолютив содержится в каждом полном предложении (транзитивном или нет), а потому он встречается чаще, чем эргатив, встречающийся только в транзитивных предложениях.Частота употребления объясняет, почему формы именительного и абсолютного падежа склонны быть морфологически не маркированными, а эргативные дополнения – прототипически и морфологически маркированными.


5. Чаще употребляемые единицы склонны размещаться перед реже употребляемыми


Существует несколько механизмов, вносящих свой вклад в относительную равномерность потока лингвистической информации. Это, например, уже отмеченный в главе 2, принцип регулярности - "чем чаще употребляется, тем короче". Другой механизм, по-видимому, компенсирует последовательную редукцию информации во фразах и предложениях. В общем случае, по мере продолжения предложения оставшиеся слова становятся все более и более предсказуемыми – число возможных правдоподобных продолжений падает, как и субъективная информативность. Таким образом, начальные позиции предложения – особенно, в изолированных предложениях и первом предложении длинного текста – связаны с наименьшей предсказуемостью и высокой информативностью. Размещение информативно богатых элементов в позицию, которая сама по себе характеризуется как высоко информативная, может вызвать пики когнитивной нагрузки. Подходящая стратегия обхода таких пиков – тенденция начинать предложение со слов, имеющих в данном контексте высокую предсказуемость - например, со слов (или групп слов), ссылающихся на слова (или их группы) предыдущего предложения, или же с терминов, кодирующих концепции, этим предложением активированных.

Эта тенденция объясняет, помимо всего остального, правило "старое перед новым" или "тема перед ремой". Все это не исключает возможность существования тенденций, ведущих в обратном направлении – таких, как принцип "более важное или срочное" размещается первым в ряду (Givón 1984, 1990). Из дискуссии, инициированной этим принципом (Chafe 1994, Siewierska 1988), можно сделать заключение, что в программирование речевых актов и письменной речи вовлечены обе тенденции. Случаи, подтверждающие тезис "старое перед новым", представляют собой длинные цепочки предложений, особенно –"программируемые" и воспроизводимые одним и тем же человеком. Примерами, подтверждающими обратный тезис, могут служить импровизированная речь, произносимая в горячем споре, или же относительно изолированные предложения.


5.1. Частота слов и порядок слов в застывших парах

В контексте обсуждения застывших пар (freeze), упомянутая выше тенденция располагать более информационно бедные элементы в начале ряда означает расположение чаще употребляемых слов перед реже употребляемыми (Fenk-Oczlon 1989a). В "застывших" блоках, т.е. в устойчивых словосочетаниях или биномиалах - таких, например, как нож и вилка, пик и долина, соль и перец, порядок слов обычно традиционно устойчив. Предлагалось много правил и принципов для объяснения этого порядка. Круг соответствующих предложений простирался от суждений, основывавшихся на свойствах конкретного обсуждаемого языка, до универсальных принципов (Cooper and Ross 1975, Malkiel 1959, Sobkowiak 1993).

В моем предыдущем исследовании (Fenk-Oczlon 1989a) были представлены аргументы в поддержку мнения о том, что правило "чаще употребляемый ставится перед реже употребляемым" – принцип, имеющий явное преимущество в сравнении с правилами, предложенными другими авторами. Так, например Купер и Росс подчеркивают важность семантического принципа "я первый" - понятия и качества, описывающие прототипичного говорящего или же лучше применимые к нему, склонны занимать первую позицию в "застывшем" блоке. Те же пары, к которым по всей видимости не применимы никакие семантические объяснения, рассматриваются Купером и Россом на основе фонологических ограничений. Но фонологические правила, как показано в главе 3, суть выражения более высокой частоты первого слова, в сравнении со вторым. Прототипичный говорящий представляет статистический средний, т. е. наиболее частый, случай. (Тем не менее, было бы крайне интересно исследовать причины больших или меньших частотных характеристик конкретного говорящего – будь они биологической, психологической или социокультурной природы).

Используя статистические данные для английского, русского и немецкого языка, я проверила это новое правило – "чаще употребляемое ставиться перед реже употребляемым" на 400 словосочетаниях, сравнивая его с четырьмя уже предлагавшимися правилами – "короткое перед длинным", "в первом слове меньше начальных согласных, чем во втором", "переднеязычный гласный перед заднеязычным" и "семантическими принципами", подобными принципу "я первый". При этом было обнаружено, что частотное правило достигает наивысшей точности предсказания, с 84% верных предсказаний. Следующее из лучших по точности предсказания "семантическое" правило не действовало в более, чем 60% случаев – несмотря на тот факт, что в действительности под этим правилом понималось целая группа "семантических принципов". Применение правила "короткое перед длинным" было еще менее успешным, хотя это оно и тесно связано с нашим правилом – чаще употребляемое в большинстве случаев кодируется кратчайшим образом. Правило "короткое перед длинным" не смогло быть вообще применено в 244 случаях, поскольку в этих случаях первое и второе слово имели одинаковую длину, измеряемую количеством слогов. Правило "переднеязычный гласный перед заднеязычным" было применимо в 28% случаев, а правило "в первом слове меньше начальных согласных, чем во втором" – в 17.5%. Для того, чтобы объяснить словосочетания, представляющие исключения частотного правила – таких, как rise and fall, birth and death, past and present, upstairs and downstairs, ascending and descending – я, в первую очередь, обратилась за помощью к иконическому кодированию пространственно-временных отношений.



Согласно Куперу и Россу, "легко обрабатываемые" слова склонны занимать первое место в блоке. Рассмотренные выше результаты уточняют условия, при которых лингвистическая единица "легче обрабатывается". А именно – единица легче обрабатывается, если она – по крайней мере, в сходных контекстах – становиться знакомой в результате частого употребления.

6. Заключение


Относительная частота лингвистических единиц – как в общем случае, так и относительно специальных контекстов – оказывает сильное влияние на когнитивные процессы. Последние, в свою очередь, влияют на диахронические изменения – такие, как фонетическая редукция – и лингвистические переменные – такие, как длина морфологических форм или порядок слов в биномиалах. Общность этих разнообразных проявлений состоит в том, что все они вносят вклад в достаточно гладкое распределение информации во времени, делая поток лингвистической информации относительно равномерным. Верхняя граница колебаний информационного потока, по-видимому, определяется границами когнитивных возможностей (т.е. психологическим настоящим) носителя языка, а их нижняя граница – принципами экономии, не допускающими большой избыточности в процессе коммуникации. Таким образом, описанные выше явления и правила регулярности выявляют экономность и эффективность процессов лингвистической коммуникации.

Примечания


i В оригинале – северо-американских. Прим.пер.

ii За исключением параграфа, касающегося нейрофизиологических аргументов в пользу рассматриваемого подхода, все эти теоретические рассуждения, а также примеры, иллюстрирующие мощь частотных аргументов – конспективный обзор соответствующих мест из Fenk-Ozclon (1990a, 1991).

iii На техническом жаргоне ЭЭГ-исследований, возникающие в электроэнцефалограммах "гребни волн" называют негативными, а "впадины" – позитивными компонентами.

Литература

Alexander, J. D. 1988. "Aphesis in English". Word 39: 29-65.

Baddeley, A., Gathercole, S. and Papagno, C. 1998. "The phonological loop as a language learning device". Psychological Review 105(1): 158-73.

Barinova, G.A. 1971. "Redukcija vypadenie intervoka'lnych soglasnych v razgovornoj rechi". In Fonologicheskie podsistemy, S.S. Vygotskij et al (eds.), 117-27. Moskau: Nauka.

Barsalou, L.W. 1985. "Ideals, central tendency, and frequency of instantiations as determi­nants of graded structure in categories". Journal of Experimental Psychology: Learning, Memory, and Cognition 11: 654-92.

Breu, W. 1980. Semantische Untersuchungen zum Verbalaspekt im Russischen. Munchen: Sagner.

Bybee, J. L. 1985. Morphology. Amsterdam/Philadelphia: John Benjamins.

Bybee, J.L. 1994. "A view of phonology from a cognitive and functional perspective". Cogni­tive Linguistics 5(4): 285-305.

Chafe, W. (1994). Discourse, Consciousness, and Time. Chicago/London: University of Chicago Press.

Cooper, W. and Ross, J.R. 1975. "World order". In Papers from the Parasession on Functionalism, R.E. Grossman, et al. (eds.), 11-63. Chicago: Chicago Linguistic Society.

Donegan, P. and Stampe, D. 1979. "The study of Natural Phonology". In Curren Approaches to Phonological Theory, D. Dinnsen (ed.), 126-73. Bloomington: Indiana University Press.

Dressler, W.U. 1984. "Explaining Natural Phonology". Phonology Yearbook 1: 29-50.

Dressler, W. U., Mayerthaler, W., Panagl, O. and Wurzel W.U. 1987. Leitmotifs in Natural Morphology. Amsterdam/Philadelphia: John Benjamins.

Ertel, S. 1977. "Where do the subjects of the sentences come from?". In Sentence Production Developments in Research and Theory, S. Rosenberg (ed.), 141-68. Hillsdale, N.J.: Law­rence Erlbaum.

Fenk, A. 1977. "Zum Einfluß von Sinnesmodalität und Informationsgehalt von Zeichen auf den Ablauf kognitiver Prozesse". In Bericht über den 30. Kongreβ der DGfP in Regensburg 1976, W.H. Tack (ed.), 114-16. Göttingen: Hogrefe.

Fenk, A. 1986. "Informationale Beschränkungen der Wissenserweiterung". Zeitschrift für experimentelle und angewandte Psychologie, 32(2): 208-53.

Fenk, A. and Fenk, G. 1980. "Konstanz im Kurzzeitgedächtnis—Konstanz im spachlichen Informationsfluβ?". Zeitschrift für exerperimentelle und angewandte Psychologie 27:400-14.

Fenk, A. and Fenk-Oczlon, G. 1993. "Menzerath's law and the constant flow of linguistic information". In Contributions to Quantitative Linguistics, R. Köhler and B.B.Rieger (eds.), 11-31. Dordrecht: Kluwer Academic Publishers.

Fenk, A. and Vanoucek, J. 1992. "Zur Messung prognostischer Leistung". Zeitschrift für experimentelle und angewandte. Psychologie 39(1): 18-55.

Fenk-Oczlon, G. 1987/1988. "Prototypentheorie und Frequenz". Klagenfurter Beiträge zur Sprachwissenschaft, 13/14: 138-50.

Fenk-Oczlon, G. 1989a. "Word frequency and word order in freezes". Linguistics 27: 517-56.

Fenk-Oczlon, G. 1989b. "Geläufigkeit als Determinante von phonologischen Backgrounding-Prozessen". Papiere zur Linguistik 40: 91-103.

Fenk-Oczlon, G. 1990a. "Ökonomieprinzipien in Kognition und Kommunikation". In Spielarten der Natürlichkeit—Spielarten der Ökonomie, N. Boretzky, W. Ertninger, T. Stolz (eds.), 37-50. Bochum: Brockmayer.

Fenk-Oczlon, G. 1990b. "Ikonismus versus Ökonomieprinzip. Am Beispiel russischer Aspekt- und Kasusbildungen". Papiere zur Linguistik 40: 46-69.

Fenk-Oczlon, G. 1991. "Frequenz und Kognition—Frequenz und Markiertheit". Folia Linguistica 25: 361-94.

Fenk-Oczlon, G. and Fenk, A. 1999. "Cognition, quantitative linguistics, and holistic typology". Linguistic Typology 3(2): 151-77.

Fidelholtz, J. L. 1975. "Word frequency and vowel reduction in English". Papers of the Chi­cago Linguistic Society 11: 200-14.

Fucks, W. 1956. "Die mathematischen Gesetze der Bildung von Sprachelementen aus ihren Bestandteilen". Nachrichtentechnische Fachberichte 3: 7-21.

Givón, T. 1984. Syntax: A Functional-Typological Introduction. Volume l. Amsterdam/ Philadelphia: John Benjamins.

Givón, T. 1990. Syntax: A Functional -Typological Introduction. Volume 2. Amsterdam/Philadelphia: John Benjamins.

Goldinger, S. D. 1998. "Echoes of echoes? An episodic theory of lexical access". Psychological Review 105(2): 251-79.

Greenberg, J. H. 1966. Language Universal. The Hague: Mouton.

Haiman, J. 1983. "Iconic and economic motivation". Language 59: 781-819.

Haiman, J. 1985. Natural Syntax: Iconicity and Erosion. Cambridge: Cambridge University press.

Hooper, J. L. 1976. "Word frequency in lexical diffusion and the source of morphonological change". In Current Trends in Historical Linguistics, W.M. Christie Jr. (ed.), 96-105. Amsterdam: North Holland.

Hughes, A. and Trudgill, P. 1979. English Accents and Dialects. Baltimore: University Park Press.

Isačenko, A. V. 1968. Die russische Sprache der Gegenwart. Teil I. Formenlehre. München:Hueber.

Jakobson, R. 1939/1971. "Zur Struktur des russischen Verbums". In Roman Jacobson Se­lected Writings II, 3-15. The Hague: Mouton.

Jespersen, O.1933. "Voiced and voiceless fricatives in English". In Selected Writings of Otto Jespersen, 346-426. London: G.Allen and Unwin Ltd.

Josselson, H. 1953. The Russian Word Count. Detroit: Wayne University Press.

Kahnemann, D., Slovic, P. and Tversky, A. 1982. Judgement under Uncertainty: Heuristics and Biases. New York/Cambridge: University Press.

Kutas, M. and Hillyard, S. A. 1980. "Event-related brain potentials to semantically inappro­priate and surprisingly large words". Biological Psychology 11: 99-116

Kypriotaki, L. 1973. "Aphaeresis in rapid speech". American Speech 45:69-77.

Malkiel, Y. 1959. "Studies in irreversible binomials". Lingua 8: 113-60.

Mańczak, W. 1980. "Frequenz und Sprachwandel". In Kommunikationstheoretische Grundlagen des Sprachwandels, H. Lüdtke (ed.), 37-79. Berlin/New York: Walter de Gruyter.

Mandelbrot, B. 1954. "Structure formelle des textes et communication. Deux etudes". Word 10: 1-27.

Maslov, J. S. 1958. Rol' tak nazyvaemoj perfektivacii i imperfectivacii v processe voznikovenija slavjanskogo glagol'nogo vida. Moskva.

Mayerthaler, W. 1981. Morphologische Natürlichkeit. Wiesbaden: Athenaion,

Mayerthaler, W. 1982. "Markiertheit in der Phonologie". In Silben, Segmente, Akzente, T.Vennemann (ed.), 205-46. Tübingen: Niemeyer.

Mayo, P. J. 1985. The Morphology of Aspect in the Seventeenth Century Russian. Columbus/Ohio: Slavica Publishers.

Neisser, U. 1967. Cognitive Psychology. New York: Appleton-Century-Crofts.

Neville, H. J. Kutas, M., Chesney G. and Schmidt, A. L. 1986. "Event-related potentials during initial encoding and recognition memory of congruous and incongruous words". Journal of Memory and Language 25: 75-92.

Nosofsky, R.M. 1988. "Similarity, Frequency, and Category Representations". Journal of Experimental Psychology: Learning, Memory, and Cognition 14: 54-65.

Osterhout, L. Bersick, M., McKinnon, R. 1997. "Brain potentials elicited by words: word length and frequency predict the latency of an early negativity". Biological Psychology 46:143-68.

Phillips, B. S. 1984. "Word frequency and the actuation of sound change". Language 60:320-42.

Rockstroh B., Elbert, T., Birbaumer, N. and Lutzenberger, W. 1982. Slow Brain Potentials and Behavior. Baltimore and Munich: Urban and Schwarzenberg.

Ross, J.R. 1980. "Ikonismus in der Phraseologie". Zeitschrift für Semiotik 2: 39-56.

Rosch, E.H. 1975. "Cognitive representations of semantic categories". Journal of Experimental Psychology. General 104: 192-233.

Siewierska, A. 1988. Word order Rules. London/New York/Sydney: Croom Helm.

Smith, M.E. and Hallgren, E. 1987. "Event-related brain potentials during lexical decision: Effects of repetition, word frequency, pronounceability, and concreteness". In Current Trends in Event-Related Potential Research. EEG Suppl 40, R.Johnson Jr., J.W. Rohrbaugh and R. Parasuraman (eds.), 417-21. Amsterdam: Elesevier Science Publishers.

Sobkowiak, W. 1993. "Unmarked-before-marked as a freezing principle". Language and Speech 36: 393-414.

Šteinfeld, E. 1963. Russian Word Count. Tallin.

Thorndike, E.L. and Lorge, I. 1944. The Teachers Word Book of 30000 Words. New York: Columbia University.

Tiersma, P.M. 1982. "Local and general Markedness". Language 58: 832-49.

Walter, W.G. 1964. "The contingent negative variation. An electrical sign of significance of' association in the human brain". Science 146:434.

Zasorina, L.N. 1977. Chastotnyj slovar' russkogo jazyka. Moskau.

Zipf, G.K. 1929. "Relative frequence as a determinant of phonetic change." Harvard Studies in Classical Philology 40:1-95.

ЛЕКЦИИ ПО КОГНИТИВНЫМ НАУКАМ

Выпуск 7
Гертруда Фэнк-Оцлон

Осведомленность, поток информации и лингвистическая форма


Редактор: Соловьев Валерий Дмитриевич

Каталог: cogsci04
cogsci04 -> Регуляция внимания у детей 5-7 лет
cogsci04 -> Опыт потока в ходе опосредствованных интернетом групповых ролевых игр
cogsci04 -> Функциональная организация процесса решения мыслительных задач
cogsci04 -> Ээг при лобной дисфункции
cogsci04 -> Взаимосвязь уверенности в решении сенсорной задачи и когнитивного стиля «поленезависимость»
cogsci04 -> Когнитивные карты в деятельности человека
cogsci04 -> Риторический феномен семантической расплывчатости
cogsci04 -> Ирония, юмор, язык: эволюционная гипотеза


Поделитесь с Вашими друзьями:


База данных защищена авторским правом ©psihdocs.ru 2017
обратиться к администрации

    Главная страница