2 курс / Нормальная физиология / Физиология_речи_Восприятие_речи_человеком_Чистович_Л_А_
.pdfГ лава 4
ЛИНГВИСТИЧЕСКИЕ И ПСИХОЛОГИЧЕСКИЕ ФОНЕМЫ
4.1. ЛИНГВИСТИЧЕСКИЕ ПРЕДСТАВЛЕНИЯ О ФОНЕМАХ
Речевое сообщение рассматривается в лингвистике как линейная последовательность фонем. Под фонемой понимается кратчайшая смыслоразличительная (фонологическая) единица. Безусловное требование, выдвигаемое при определении фонем ного состава языка, состоит в том, что цепочки фонем, соответ ствующие двум различающимся по смыслу речевым сообщениям, должны быть разными (оставим пока в стороне сравнительно ред кие случаи омонимии сигналов.) Фонематически значимыми при этом признаются те и только те различия в звуковом содержании сообщений, которые используются в данном языке для различе ния смысла. Такой подход обеспечивает наиболее экономное опи сание единиц фонологического уровня языковой структуры. Однако при решении вопроса о соотнесенности фонетических и фонологических единиц разные лингвистические школы поль зуются разными критериями.
Сторонники московской фонологической школы, например, ставят требование, чтобы корневые морфемы разных словоформ одного и того же слова совпадали, т. е. были выражены одной и той же цепочкой фонем [118]. Поэтому первые гласные в словах вода [vAda], воды [vddi], водонос [vbdAnos] рассматриваются в ка честве вариантов одной фонемы — [о] (фонема всегда определя ется по сильной позиции, для гласных таковой является позиция под ударением). Таким образом, согласно концепции московской фонологической школы, фонема является абстрактной фонологи ческой единицей, которая не может быть отождествлена ни с какой конкретной звуковой единицей. Хотя использование этой концеп ции облегчает задачу формального описания языка, ясно, что для решения о том, что первым гласным в слове [vAda] является фо нема [о], распознающее устройство (человек или машина) должно сначала понять смысл слова.
Основной принцип установления фонемной принадлежности сообщения, используемый представителями ленинградской фоно логической школы, заключается в следующем: если две слово формы одного и того же слова отличаются друг от друга по зву чанию, то кратчайшие фонологические единицы, несущие это различие, должны быть признаны разными фонемами [72 17°]. Поэтому в словах вода [vAdal и води [vodi] мы имеем разные кор невые гласные фонемы. В одну фонему, следовательно, сводятся сходные в физиолого-акустическом отношении звуки.
Таким образом, ленинградские фонетисты рассматривают фо нему прежде всего как определенный звукотип. Такой подход обеспечивает единство классификации фонем по их физиолого акустическим свойствам. Сложность, однако, состоит в том, что количество звукотипов, существующих в языке, по-видимому, значительно превышает число фонем, выделяемых на основе принципа смыслоразличения. Вопрос о том, сколько разных звуко типов используют носители русского языка, становится для ленин градской фонологической школы предметом исследования.
Из сказанного следует, что как фонемный состав всего языка, так и фонемный состав отдельного слова в лингвистической лите ратуре определяется по-разному, в зависимости от тех допущений
итребований, которые предъявляются к описанию языка. Выдающееся значение для фонологии имела теория дифферен
циальных признаков, разработанная Трубецким [132]. В огромном количестве смыслоразличительных противопоставлений, на основе которых определяется фонемный состав языка, он сумел увидеть ограниченное количество разных типов противопоставлений по какому-либо определенному признаку. Число таких признаков в каждом языке ограничено и сравнительно невелико. Понятие фонемы является, по Трубецкому, производным от понятия при знак: она определяется как совокупность фонологически сущест венных, т. е. дифференциальных, признаков. Например, диф ференциальными признаками фонемы [gj в русском языке будут:
1)место образования — заднеязычность, поскольку по этому признаку [g] противопоставляется губной и переднеязычной фонемам [b], [d];
2)звонкость — по этому признаку [g] противопоставляется фонеме [kJ;
3)твердость1 — ио этому признаку |g] противопоставляется
фонеме jg'j.
Способ образования, взрывность, не является дифференциаль ным признаком, так как в русском языке противопоставление [g] взрывное—[g] щелевое фонологически не существенно, т. е. не влечет за собой противопоставления по смыслу. Это же отно сится и к признаку назальностив паре [ц]—[g].
1 Сторонники московской фонологической школы не считают [g'] само стоятельной фонемой в русском языке.
72
4.2. ПСИХОЛОГИЧЕСКИЕ ПРИЗНАКИ ФОНЕМ
Концепция дифференциальных признаков Трубец кого, получившая дальнейшее развитие в ряде работ [215> 305], оказалась весьма плодотворной не только для теоретической линг вистики, но и для теории восприятия речи.
Согласно этой концепции, множество воспринимаемых фонем не является совокупностью отдельных символов, но представляет собой строгую упорядоченную систему, в которой каждая фонема задается перечислением значений по признакам, число которых существенно меньше количества возможных фонем.
Идея о наличии в сознании носителей языка системы призна ков, по которым воспринимаются и запоминаются фонемы, под тверждается, в частности, существованием у человека представле ния о субъективном сходстве фонем. Информация о таком сходстве, получаемая в разных экспериментальных условиях (шкалирование, забывание, восприятие в условиях помех), как правило, хорошо объясняется с позиции дифференциальных признаков: чем мень шее число таких признаков разделяет фонемы, тем более субъек тивно близкими, похожими они являются.
Какова природа этих признаков? Предполагается, что в си стеме, распознающей речь, имеется фонемный классификатор — устройство, выдающее фонемное решение в ответ на входной аку стический сигнал. Очевидно, что дифференциальные признаки могут быть отражением либо акустических признаков на входе фонемного классификатора, либо каких-то абстрактных психо логических признаков на его выходе. Попытка поиска прямых соответствий между дифференциальными признаками и непосред ственно физическими свойствами речевого сигнала [305] не дала положительных результатов. Это заставляет думать, что верным является второе предположение.
Трудность, однако, состоит в том, что до недавнего времени было неизвестно, с какого рода и каким количеством признаков имеет дело человек при восприятии: в упоминавшихся исследо ваниях системы таких признаков вводились априорно и заимство вались, как правило, из литературы по теоретической фонологии. Лишь в последнее время появились работы, в которых рассматри ваются перцептивные признаки фонем, полученные апостериор ным путем, в результате анализа реакций испытуемых в экспе риментах по восприятию. Возможность появления такого рода работ связана с разработкой специальных вычислительных про цедур, позволяющих находить минимальную достаточную раз мерность пространственной конфигурации речевых стимулов на основе информации о субъективной близости этих стимулов, полу ченной экспериментально I209 46в]. Количество выявленных орто гональных осей этой пространственной конфигурации соответ ствует числу независимых перцептивных признаков, по которым данное множество’входных фонем упорядочено в сознании испы-
73
туемых. Интерпретация этих найденных в результате вычисли тельного анализа осей-признаков зависит от экспериментатора.
В работе [4в8] изложены результаты применения подобной вы числительной процедуры к данным большого количества экспе риментов по нахождению субъективной близости между соглас ными. Эти эксперименты проводились в широком диапазоне усло вий, включающих разные языки, разные наборы исходных стимулов, разные методы их предъявления (акустическое, визуаль ное, тактильное), разных испытуемых (нормально- и слабослы шащих) и т. д. Оказалось, что во всех без исключения экспери ментах выявляются одни и те же перцептивные признаки согласных, обозначаемые автором статьи [4в8] как назальность, озвонченность, сибилянтность, непрерывность, место образования и сонорность.
Тот факт, что как при слуховом, так и неслуховом предъявле нии согласных стимулов были обнаружены одни и те же признаки, подтверждает уже высказанное предположение о том, что эти при знаки не являются акустическими и что по ним описываются не сигналы на входе фонемного классификатора, но решения, при нятые классификатором.
4.3. ФОНЕМА КАК ЗАПОМИНАЕМОЕ СОКРАЩЕННОЕ ОПИСАНИЕ СИГНАЛА
Переход от описания сигнала в терминах акусти ческих признаков к фонемному описанию (описанию в терминах дифференциальных признаков) не только обеспечивает возмож ность дальнейшего смыслового (лексического и синтаксического) анализа сообщения, он также резко сокращает количество инфор мации, необходимой для записи сигнала в памяти. Гипотеза о том, что при запоминании речевого сигнала человек использует не его подробное акустическое изображение, но принятое о сигнале фонемное решение, проверялась в многочисленных эксперимен тах.
4.3.1. СОГЛАСНЫЕ
Все данные, касающиеся согласных, были получены методом сравнения функций идентификации с функциями разли чения. В экспериментах такого рода применяются синтезированные стимулы, образующие ряд по какому-то акустическому признаку стимула.
Рассмотрим в качестве примера опыт со стимулами, различаю щимися по так называемому времени начала голоса. В различных языках выделяются три группы смычных согласных: полностью звонкий согласный, глухой неаспирированный согласный и глу хой аспирированный согласный. В случае полностью звонкого согласного (например, русские [Ы, [d], [g]) голосовая^щель смы-
74
Рис. 4.1. Определение параметра «время начала голоса». По [17в].
На А: — динамические спектрограммы слогов [di], [til и [thi]; по оси абсцисс — время,
по оси ординат — частота. На Б — энергетические огибающие тех же слогов. По оси абс цисс — время, по оси ординат — интенсивность. Стрелками отмечен интервал времени между началом колебаний голосовых связок и размыканием смычки в [di] и интервал времени между появлением шума взрыва и аспирации и началом колебаний голосовых
связок в [til и [thil.
кается значительно раньше размыкания смычки, в случае глухого аспирированного согласного (например, английские [ph], [th], [kh]) голосовая щель остается открытой некоторое время после раз мыкания смычки.
В качестве акустического коррелята этого признака было пред ложено [367, 368] принять параметр, названный «время начала голоса». Рис. 4.1, где приведены спектрограммы слога с полностью
Рис. 4.2. Схематическое изображение синтетических слогов, начинающихся со звонкового согласного (Л) и глухого аспирированного согласного (Б).
По [17в].
По оси абсцисс — «время начала голоса», начало отсчета соответствует моменту размыка ния смычки согласного; по вертикали — характеристики каналов управления синтезато ром: 1 — уровень интенсивности сигнала (в дБ); 2— частота основного тона (сохраняется постоянной и равной 114 Гц); 3 — характер возбуждения (а — голосовой, б— шумовой); 4 — спектр сигнала, заданного в 18 частотных полосах (номера и границы полос в Гц ука заны в соответствующих столбцах) так, что энергия в полосе имеет максимальное значение
в зачерненных областях.
Звонким согласным [di], глухим неаспирированным согласным [tij и глухим аспирированным согласным [thi], иллюстрирует способ измерения этого параметра на динамических спектрограммах. За точку отсчета принимается момент размыкания смычки соглас ного, характеризующийся появлением энергии в высокочастот ной части спектра (шум взрыва, появление энергии в области второй и более высоких формант). Начало голоса, если оно пред шествует размыканию смычки, определяется по появлению энер гии в области основной частоты голоса. В случае начала голоса после размыкания смычки имеют место не только появление энер гии на основной частоте и проявление периодического характера
76
всего сигнала, но и резкое увеличение амплитуды первой фор манты и общей энергии сигнала.
Слоги, приведенные на рис. 4.1, характеризуются по пара метру «время начала голоса» значениями —85, 15 и 110 мс. Для исследования восприятия был синтезирован набор стимулов, изменяющихся в широком диапазоне значений этого параметра. Характеристики двух крайних стимулов показаны на рис. 4.2.
В данном случае стимулы соответствуют |
слогу |
с гласным [а] |
и переднеязычным взрывным согласным [d] |
и [th]. |
Аналогичным |
образом были синтезированы слоги с губным согласным.
Рис. 4.3. Функции идентификации синтетических слогов, упорядоченных но параметру «время начала голоса». По [зв9].
По оси абсцисс — «время начала голоса» (начало |
отсчета — то же, что и на рис. |
4.2); |
по оси ординат — относительное число ответов |
[Ъ] (кривая 2) и [рь] (кривая |
1). |
Для получения функции идентификации стимулы, следующие друг за другом в случайном порядке, записывались на магнито фонную ленту и предъявлялись испытуемым. Испытуемые должны были записывать в ответ на каждый стимул букву, обозначаю щую ту фонему, на которую этот стимул больше всего похож. Набор букв был ограничен экспериментатором (метод форсирован ного выбора).
На рис. 4.3 приведены результаты идентификации губных согласных группой слушателей-американцев [369]. Можно видеть, что использованный ряд стимулов разделился на две области,
одна из которых связана с фонемой [Ь], вторая — с [рь]. Значе ние параметра «время начала голоса», при котором ответы [Ь] и [рь] оказались равновероятными, называется фонемной грани цей между [Ь] и [рь] по указанному признаку.
После получения функции идентификации можно проверить предположение, что при запоминании и сравнении стимулов испытуемый действительно пользуется фонемами как субъектив ными описаниями этих стимулов.
Для этого используется метод АВХ-сравнения. Испытуемым предъявляются триады стимулов типа ж,., xi+k, х{ и х(, xi+k, xi+k
77
(i — порядковый номер стимула в ряду по значениям акустиче ского параметра, /с=1,2, 3, 4). Задачей испытуемых является опре деление того, с каким звуком триады — первым или вторым — совпадает последний звук. Построив такие триады для всех зна чений i, можно получить функцию различения — вероятность правильного ответа испытуемого в зависимости от положения стимулов по шкале акустического параметра. Зная функцию идентификации, легко вычислить теоретические значения функ ции различения при предположении, что вся информация о сти муле, которую испытуемый может запомнить, сводится к знанию выбранного в ответ на стимул фонемного символа. Не останав-
Рис. 4.4. Функции различения синтетических слогов, упорядоченных по параметру «время начала голоса». По I1”]-
По оси абсцисс — «время начала голоса»; по оси ординат — относительное число случаев, когда данный стимул отличался от остальных. Кривые 1—3 соответствуют стимулам, раз личающимся на две, три и четыре градации параметра «время начала голоса». Прямая 4.
соответствует положению фонемной границы между [Ъ] и [рь] на рис. 4.3.
ливаясь на процедуре вычислении, укажем только, что в этом случае значения функции различения должны быть близки к веро ятности случайного отгадывания на интервалах, лежащих внутри фонемных категорий, и должны достигать максимальных значе ний вблизи фонемных границ.
На рис. 4.4 приведены функции различения описанных стиму лов, полученные на группе слушателей-американцев [зв8]. Сравне ние рис. 4.3 и 4.4 показывает, что максимум на функции различе ния совпадает с положением границы между [Ь] и [рь] на функ ции идентификации. Различение же стимулов внутри фонемных категорий оказывается очень плохим, близким к уровню случай ного отгадывания.
Иная картина была получена для носителей языка таи. В этом языке имеются три губных согласных, различающихся по пара метру «время начала голоса»: звонкий [Ь], глухой неаспирирован-
ный [р] и глухой аспирированный [рь]. Эксперименты, описан ные в [177> 178 зв8], показали, что на функции различения, получен
78
ной на испытуемых-таиландцах, имеются два максимума, соот
ветствующие границам между [b], [pi и Гр1, [phI, определенным по функции идентификации.
.Данные, аналогичные только что описанным, были получены также в большом количестве экспериментов с синтезированными взрывными согласными, различающимися по направлению пере ходов F2 и F3 [242, 353, 378 492]. При идентификации таких стиму лов обычно удается получить три фонемные категории, соответ ствующие согласным с разным местом образования: [b], [d] и lg] или [р], [t] и [к]. Функции различения, полученные на таких стимулах, всегда имели максимумы в области фонемных границ.
4.3.2. ГЛАСНЫЕ
Значительно более сложным оказался вопрос о субъ ективных речевых образах гласных. Сравнение функций раз личения с функциями идентификации не позволило сделать опре деленных выводов, так как было показано, что человек способен различать большое число градаций стимулов (синтезированных гласных), относимых им к одной и той же фонемной категории [2в5, 480, 489] Этот результат можно было интерпретировать двоя ким образом. Одна возможная интерпретация состояла в том, что множество фонетических образов гласных образует континуум, и в качестве субъективных признаков гласных используются координаты гласных в фонетическом пространстве (например, конфигурация речевого тракта). Другая интерпретация заклю чалась в том, что, кроме фонемного решения о гласном, запоми нается еще какая-то дополнительная информация (например, данные о спектре гласного).
Доказательство того, что, запоминая гласный, человек исполь зует фонему в качестве описания этого гласного, было получено в экспериментах по прямому численному шкалированию субъ ективного расстояния между гласными-стимулами, приведенными на рис. 4.5,Л [47]. Фонемная идентификация этих стимулов группой русских слушателей показала, что стимулы 1—3 вос принимаются как [i], стимулы 4—9 — как [е], стимулы 10—12 — как [а].
На рис. 4.5,В приведена зависимость субъективного расстоя ния от расстояния между стимулами на двухформантной пло скости (положение стимулов в двухформантной плоскости пока зано на рис. 4.5, Л). Можно видеть, что зависимость имеет отчет ливый ступенчатый характер: субъективное расстояние резко возрастает при переходе от одной фонемной категории к другой, оно мало меняется в пределах фонемной категории.
Это позволяет утверждать, что испытуемые пользуются фоне мами в качестве описания стимулов и что расстояния, которые они указывают, это расстояния между фонемами. Однако такой
79
ступенчатый характер зависимости ярко выражен лишь в случае, если стимулы в оцениваемой паре принадлежат к разным фонем ным категориям.
Другая картина наблюдается в том случае, когда оба стимула в паре относятся к одной и той же фонемной категории. На рис. 4.6 приведены зависимости, полученные для пар [е]—[е]. Можно видеть, что субъективное расстояние монотонно возрастает с увели-
Рис. 4.5. Результаты экспериментов по психологическому шкалированию. По [«].
На А: положение в плоскости первой и второй формант (FtF2) синтетических гласных, использованных в экспериментах; по оси абсцисс — частота Fif покоси ординат — частота F2‘, цифрами около точек обозначены номера стимулов. На В: субъективные расстояния между парами синтетических гласных х^ху; по оси абсцисс — номер стимула ху, по оси орди
нат — субъективное расстояние в баллах между ху и стимулом, номер которого(г) указан
на каждом из четырех графиков; кривые 1 и 2 соответствуют разному порядку следования стимулов в парах (х^ху или xyxt).
чением физической разницы между стимулами. Этого не могло бы быть, если бы информация о гласном, полученная при его воспри ятии, ограничивалась фонемным символом. Необходимо допус тить, что человек способен на какое-то время запоминать не только фонему, выбранную на основании услышанного стимула, но и более подробное описание сигнала; назовем это условно «тембральной информацией».
В работе [266] исследовались идентификация и различение син тетических [i] и [е] гласных в условиях, когда после каждого стимула следовал дополнительный мешающий звук. Полученные
80