Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2 курс / Нормальная физиология / Физиология_речи_Восприятие_речи_человеком_Чистович_Л_А_

.pdf
Скачиваний:
1
Добавлен:
24.03.2024
Размер:
13.47 Mб
Скачать

Г лава 4

ЛИНГВИСТИЧЕСКИЕ И ПСИХОЛОГИЧЕСКИЕ ФОНЕМЫ

4.1. ЛИНГВИСТИЧЕСКИЕ ПРЕДСТАВЛЕНИЯ О ФОНЕМАХ

Речевое сообщение рассматривается в лингвистике как линейная последовательность фонем. Под фонемой понимается кратчайшая смыслоразличительная (фонологическая) единица. Безусловное требование, выдвигаемое при определении фонем­ ного состава языка, состоит в том, что цепочки фонем, соответ­ ствующие двум различающимся по смыслу речевым сообщениям, должны быть разными (оставим пока в стороне сравнительно ред­ кие случаи омонимии сигналов.) Фонематически значимыми при этом признаются те и только те различия в звуковом содержании сообщений, которые используются в данном языке для различе­ ния смысла. Такой подход обеспечивает наиболее экономное опи­ сание единиц фонологического уровня языковой структуры. Однако при решении вопроса о соотнесенности фонетических и фонологических единиц разные лингвистические школы поль­ зуются разными критериями.

Сторонники московской фонологической школы, например, ставят требование, чтобы корневые морфемы разных словоформ одного и того же слова совпадали, т. е. были выражены одной и той же цепочкой фонем [118]. Поэтому первые гласные в словах вода [vAda], воды [vddi], водонос [vbdAnos] рассматриваются в ка­ честве вариантов одной фонемы — [о] (фонема всегда определя­ ется по сильной позиции, для гласных таковой является позиция под ударением). Таким образом, согласно концепции московской фонологической школы, фонема является абстрактной фонологи­ ческой единицей, которая не может быть отождествлена ни с какой конкретной звуковой единицей. Хотя использование этой концеп­ ции облегчает задачу формального описания языка, ясно, что для решения о том, что первым гласным в слове [vAda] является фо­ нема [о], распознающее устройство (человек или машина) должно сначала понять смысл слова.

Основной принцип установления фонемной принадлежности сообщения, используемый представителями ленинградской фоно­ логической школы, заключается в следующем: если две слово­ формы одного и того же слова отличаются друг от друга по зву­ чанию, то кратчайшие фонологические единицы, несущие это различие, должны быть признаны разными фонемами [72 17°]. Поэтому в словах вода [vAdal и води [vodi] мы имеем разные кор­ невые гласные фонемы. В одну фонему, следовательно, сводятся сходные в физиолого-акустическом отношении звуки.

Таким образом, ленинградские фонетисты рассматривают фо­ нему прежде всего как определенный звукотип. Такой подход обеспечивает единство классификации фонем по их физиолого­ акустическим свойствам. Сложность, однако, состоит в том, что количество звукотипов, существующих в языке, по-видимому, значительно превышает число фонем, выделяемых на основе принципа смыслоразличения. Вопрос о том, сколько разных звуко­ типов используют носители русского языка, становится для ленин­ градской фонологической школы предметом исследования.

Из сказанного следует, что как фонемный состав всего языка, так и фонемный состав отдельного слова в лингвистической лите­ ратуре определяется по-разному, в зависимости от тех допущений

итребований, которые предъявляются к описанию языка. Выдающееся значение для фонологии имела теория дифферен­

циальных признаков, разработанная Трубецким [132]. В огромном количестве смыслоразличительных противопоставлений, на основе которых определяется фонемный состав языка, он сумел увидеть ограниченное количество разных типов противопоставлений по какому-либо определенному признаку. Число таких признаков в каждом языке ограничено и сравнительно невелико. Понятие фонемы является, по Трубецкому, производным от понятия при­ знак: она определяется как совокупность фонологически сущест­ венных, т. е. дифференциальных, признаков. Например, диф­ ференциальными признаками фонемы [gj в русском языке будут:

1)место образования — заднеязычность, поскольку по этому признаку [g] противопоставляется губной и переднеязычной фонемам [b], [d];

2)звонкость — по этому признаку [g] противопоставляется фонеме [kJ;

3)твердость1 — ио этому признаку |g] противопоставляется

фонеме jg'j.

Способ образования, взрывность, не является дифференциаль­ ным признаком, так как в русском языке противопоставление [g] взрывное—[g] щелевое фонологически не существенно, т. е. не влечет за собой противопоставления по смыслу. Это же отно­ сится и к признаку назальностив паре [ц]—[g].

1 Сторонники московской фонологической школы не считают [g'] само­ стоятельной фонемой в русском языке.

72

4.2. ПСИХОЛОГИЧЕСКИЕ ПРИЗНАКИ ФОНЕМ

Концепция дифференциальных признаков Трубец­ кого, получившая дальнейшее развитие в ряде работ [215> 305], оказалась весьма плодотворной не только для теоретической линг­ вистики, но и для теории восприятия речи.

Согласно этой концепции, множество воспринимаемых фонем не является совокупностью отдельных символов, но представляет собой строгую упорядоченную систему, в которой каждая фонема задается перечислением значений по признакам, число которых существенно меньше количества возможных фонем.

Идея о наличии в сознании носителей языка системы призна­ ков, по которым воспринимаются и запоминаются фонемы, под­ тверждается, в частности, существованием у человека представле­ ния о субъективном сходстве фонем. Информация о таком сходстве, получаемая в разных экспериментальных условиях (шкалирование, забывание, восприятие в условиях помех), как правило, хорошо объясняется с позиции дифференциальных признаков: чем мень­ шее число таких признаков разделяет фонемы, тем более субъек­ тивно близкими, похожими они являются.

Какова природа этих признаков? Предполагается, что в си­ стеме, распознающей речь, имеется фонемный классификатор — устройство, выдающее фонемное решение в ответ на входной аку­ стический сигнал. Очевидно, что дифференциальные признаки могут быть отражением либо акустических признаков на входе фонемного классификатора, либо каких-то абстрактных психо­ логических признаков на его выходе. Попытка поиска прямых соответствий между дифференциальными признаками и непосред­ ственно физическими свойствами речевого сигнала [305] не дала положительных результатов. Это заставляет думать, что верным является второе предположение.

Трудность, однако, состоит в том, что до недавнего времени было неизвестно, с какого рода и каким количеством признаков имеет дело человек при восприятии: в упоминавшихся исследо­ ваниях системы таких признаков вводились априорно и заимство­ вались, как правило, из литературы по теоретической фонологии. Лишь в последнее время появились работы, в которых рассматри­ ваются перцептивные признаки фонем, полученные апостериор­ ным путем, в результате анализа реакций испытуемых в экспе­ риментах по восприятию. Возможность появления такого рода работ связана с разработкой специальных вычислительных про­ цедур, позволяющих находить минимальную достаточную раз­ мерность пространственной конфигурации речевых стимулов на основе информации о субъективной близости этих стимулов, полу­ ченной экспериментально I209 46в]. Количество выявленных орто­ гональных осей этой пространственной конфигурации соответ­ ствует числу независимых перцептивных признаков, по которым данное множество’входных фонем упорядочено в сознании испы-

73

туемых. Интерпретация этих найденных в результате вычисли­ тельного анализа осей-признаков зависит от экспериментатора.

В работе [4в8] изложены результаты применения подобной вы­ числительной процедуры к данным большого количества экспе­ риментов по нахождению субъективной близости между соглас­ ными. Эти эксперименты проводились в широком диапазоне усло­ вий, включающих разные языки, разные наборы исходных стимулов, разные методы их предъявления (акустическое, визуаль­ ное, тактильное), разных испытуемых (нормально- и слабослы­ шащих) и т. д. Оказалось, что во всех без исключения экспери­ ментах выявляются одни и те же перцептивные признаки согласных, обозначаемые автором статьи [4в8] как назальность, озвонченность, сибилянтность, непрерывность, место образования и сонорность.

Тот факт, что как при слуховом, так и неслуховом предъявле­ нии согласных стимулов были обнаружены одни и те же признаки, подтверждает уже высказанное предположение о том, что эти при­ знаки не являются акустическими и что по ним описываются не сигналы на входе фонемного классификатора, но решения, при­ нятые классификатором.

4.3. ФОНЕМА КАК ЗАПОМИНАЕМОЕ СОКРАЩЕННОЕ ОПИСАНИЕ СИГНАЛА

Переход от описания сигнала в терминах акусти­ ческих признаков к фонемному описанию (описанию в терминах дифференциальных признаков) не только обеспечивает возмож­ ность дальнейшего смыслового (лексического и синтаксического) анализа сообщения, он также резко сокращает количество инфор­ мации, необходимой для записи сигнала в памяти. Гипотеза о том, что при запоминании речевого сигнала человек использует не его подробное акустическое изображение, но принятое о сигнале фонемное решение, проверялась в многочисленных эксперимен­ тах.

4.3.1. СОГЛАСНЫЕ

Все данные, касающиеся согласных, были получены методом сравнения функций идентификации с функциями разли­ чения. В экспериментах такого рода применяются синтезированные стимулы, образующие ряд по какому-то акустическому признаку стимула.

Рассмотрим в качестве примера опыт со стимулами, различаю­ щимися по так называемому времени начала голоса. В различных языках выделяются три группы смычных согласных: полностью звонкий согласный, глухой неаспирированный согласный и глу­ хой аспирированный согласный. В случае полностью звонкого согласного (например, русские [Ы, [d], [g]) голосовая^щель смы-

74

Рис. 4.1. Определение параметра «время начала голоса». По [17в].

На А: — динамические спектрограммы слогов [di], [til и [thi]; по оси абсцисс — время,

по оси ординат — частота. На Б — энергетические огибающие тех же слогов. По оси абс­ цисс — время, по оси ординат — интенсивность. Стрелками отмечен интервал времени между началом колебаний голосовых связок и размыканием смычки в [di] и интервал времени между появлением шума взрыва и аспирации и началом колебаний голосовых

связок в [til и [thil.

кается значительно раньше размыкания смычки, в случае глухого аспирированного согласного (например, английские [ph], [th], [kh]) голосовая щель остается открытой некоторое время после раз­ мыкания смычки.

В качестве акустического коррелята этого признака было пред­ ложено [367, 368] принять параметр, названный «время начала голоса». Рис. 4.1, где приведены спектрограммы слога с полностью

Рис. 4.2. Схематическое изображение синтетических слогов, начинающихся со звонкового согласного (Л) и глухого аспирированного согласного (Б).

По [17в].

По оси абсцисс — «время начала голоса», начало отсчета соответствует моменту размыка­ ния смычки согласного; по вертикали — характеристики каналов управления синтезато­ ром: 1 — уровень интенсивности сигнала (в дБ); 2— частота основного тона (сохраняется постоянной и равной 114 Гц); 3 — характер возбуждения (а — голосовой, б— шумовой); 4 — спектр сигнала, заданного в 18 частотных полосах (номера и границы полос в Гц ука­ заны в соответствующих столбцах) так, что энергия в полосе имеет максимальное значение

в зачерненных областях.

Звонким согласным [di], глухим неаспирированным согласным [tij и глухим аспирированным согласным [thi], иллюстрирует способ измерения этого параметра на динамических спектрограммах. За точку отсчета принимается момент размыкания смычки соглас­ ного, характеризующийся появлением энергии в высокочастот­ ной части спектра (шум взрыва, появление энергии в области второй и более высоких формант). Начало голоса, если оно пред­ шествует размыканию смычки, определяется по появлению энер­ гии в области основной частоты голоса. В случае начала голоса после размыкания смычки имеют место не только появление энер­ гии на основной частоте и проявление периодического характера

76

всего сигнала, но и резкое увеличение амплитуды первой фор­ манты и общей энергии сигнала.

Слоги, приведенные на рис. 4.1, характеризуются по пара­ метру «время начала голоса» значениями —85, 15 и 110 мс. Для исследования восприятия был синтезирован набор стимулов, изменяющихся в широком диапазоне значений этого параметра. Характеристики двух крайних стимулов показаны на рис. 4.2.

В данном случае стимулы соответствуют

слогу

с гласным [а]

и переднеязычным взрывным согласным [d]

и [th].

Аналогичным

образом были синтезированы слоги с губным согласным.

Рис. 4.3. Функции идентификации синтетических слогов, упорядоченных но параметру «время начала голоса». По [зв9].

По оси абсцисс — «время начала голоса» (начало

отсчета — то же, что и на рис.

4.2);

по оси ординат — относительное число ответов

[Ъ] (кривая 2) и [рь] (кривая

1).

Для получения функции идентификации стимулы, следующие друг за другом в случайном порядке, записывались на магнито­ фонную ленту и предъявлялись испытуемым. Испытуемые должны были записывать в ответ на каждый стимул букву, обозначаю­ щую ту фонему, на которую этот стимул больше всего похож. Набор букв был ограничен экспериментатором (метод форсирован­ ного выбора).

На рис. 4.3 приведены результаты идентификации губных согласных группой слушателей-американцев [369]. Можно видеть, что использованный ряд стимулов разделился на две области,

одна из которых связана с фонемой [Ь], вторая — с [рь]. Значе­ ние параметра «время начала голоса», при котором ответы [Ь] и [рь] оказались равновероятными, называется фонемной грани­ цей между [Ь] и [рь] по указанному признаку.

После получения функции идентификации можно проверить предположение, что при запоминании и сравнении стимулов испытуемый действительно пользуется фонемами как субъектив­ ными описаниями этих стимулов.

Для этого используется метод АВХ-сравнения. Испытуемым предъявляются триады стимулов типа ж,., xi+k, х{ и х(, xi+k, xi+k

77

(i — порядковый номер стимула в ряду по значениям акустиче­ ского параметра, /с=1,2, 3, 4). Задачей испытуемых является опре­ деление того, с каким звуком триады — первым или вторым — совпадает последний звук. Построив такие триады для всех зна­ чений i, можно получить функцию различения — вероятность правильного ответа испытуемого в зависимости от положения стимулов по шкале акустического параметра. Зная функцию идентификации, легко вычислить теоретические значения функ­ ции различения при предположении, что вся информация о сти­ муле, которую испытуемый может запомнить, сводится к знанию выбранного в ответ на стимул фонемного символа. Не останав-

Рис. 4.4. Функции различения синтетических слогов, упорядоченных по параметру «время начала голоса». По I1”]-

По оси абсцисс — «время начала голоса»; по оси ординат — относительное число случаев, когда данный стимул отличался от остальных. Кривые 1—3 соответствуют стимулам, раз­ личающимся на две, три и четыре градации параметра «время начала голоса». Прямая 4.

соответствует положению фонемной границы между [Ъ] и [рь] на рис. 4.3.

ливаясь на процедуре вычислении, укажем только, что в этом случае значения функции различения должны быть близки к веро­ ятности случайного отгадывания на интервалах, лежащих внутри фонемных категорий, и должны достигать максимальных значе­ ний вблизи фонемных границ.

На рис. 4.4 приведены функции различения описанных стиму­ лов, полученные на группе слушателей-американцев [зв8]. Сравне­ ние рис. 4.3 и 4.4 показывает, что максимум на функции различе­ ния совпадает с положением границы между [Ь] и [рь] на функ­ ции идентификации. Различение же стимулов внутри фонемных категорий оказывается очень плохим, близким к уровню случай­ ного отгадывания.

Иная картина была получена для носителей языка таи. В этом языке имеются три губных согласных, различающихся по пара­ метру «время начала голоса»: звонкий [Ь], глухой неаспирирован-

ный [р] и глухой аспирированный [рь]. Эксперименты, описан­ ные в [177> 178 зв8], показали, что на функции различения, получен­

78

ной на испытуемых-таиландцах, имеются два максимума, соот­

ветствующие границам между [b], [pi и Гр1, [phI, определенным по функции идентификации.

.Данные, аналогичные только что описанным, были получены также в большом количестве экспериментов с синтезированными взрывными согласными, различающимися по направлению пере­ ходов F2 и F3 [242, 353, 378 492]. При идентификации таких стиму­ лов обычно удается получить три фонемные категории, соответ­ ствующие согласным с разным местом образования: [b], [d] и lg] или [р], [t] и [к]. Функции различения, полученные на таких стимулах, всегда имели максимумы в области фонемных границ.

4.3.2. ГЛАСНЫЕ

Значительно более сложным оказался вопрос о субъ­ ективных речевых образах гласных. Сравнение функций раз­ личения с функциями идентификации не позволило сделать опре­ деленных выводов, так как было показано, что человек способен различать большое число градаций стимулов (синтезированных гласных), относимых им к одной и той же фонемной категории [2в5, 480, 489] Этот результат можно было интерпретировать двоя­ ким образом. Одна возможная интерпретация состояла в том, что множество фонетических образов гласных образует континуум, и в качестве субъективных признаков гласных используются координаты гласных в фонетическом пространстве (например, конфигурация речевого тракта). Другая интерпретация заклю­ чалась в том, что, кроме фонемного решения о гласном, запоми­ нается еще какая-то дополнительная информация (например, данные о спектре гласного).

Доказательство того, что, запоминая гласный, человек исполь­ зует фонему в качестве описания этого гласного, было получено в экспериментах по прямому численному шкалированию субъ­ ективного расстояния между гласными-стимулами, приведенными на рис. 4.5,Л [47]. Фонемная идентификация этих стимулов группой русских слушателей показала, что стимулы 1—3 вос­ принимаются как [i], стимулы 4—9 — как [е], стимулы 10—12 — как [а].

На рис. 4.5,В приведена зависимость субъективного расстоя­ ния от расстояния между стимулами на двухформантной пло­ скости (положение стимулов в двухформантной плоскости пока­ зано на рис. 4.5, Л). Можно видеть, что зависимость имеет отчет­ ливый ступенчатый характер: субъективное расстояние резко возрастает при переходе от одной фонемной категории к другой, оно мало меняется в пределах фонемной категории.

Это позволяет утверждать, что испытуемые пользуются фоне­ мами в качестве описания стимулов и что расстояния, которые они указывают, это расстояния между фонемами. Однако такой

79

ступенчатый характер зависимости ярко выражен лишь в случае, если стимулы в оцениваемой паре принадлежат к разным фонем­ ным категориям.

Другая картина наблюдается в том случае, когда оба стимула в паре относятся к одной и той же фонемной категории. На рис. 4.6 приведены зависимости, полученные для пар [е]—[е]. Можно видеть, что субъективное расстояние монотонно возрастает с увели-

Рис. 4.5. Результаты экспериментов по психологическому шкалированию. По [«].

На А: положение в плоскости первой и второй формант (FtF2) синтетических гласных, использованных в экспериментах; по оси абсцисс — частота Fif покоси ординат — частота F2‘, цифрами около точек обозначены номера стимулов. На В: субъективные расстояния между парами синтетических гласных х^ху; по оси абсцисс — номер стимула ху, по оси орди­

нат — субъективное расстояние в баллах между ху и стимулом, номер которого(г) указан

на каждом из четырех графиков; кривые 1 и 2 соответствуют разному порядку следования стимулов в парах (х^ху или xyxt).

чением физической разницы между стимулами. Этого не могло бы быть, если бы информация о гласном, полученная при его воспри­ ятии, ограничивалась фонемным символом. Необходимо допус­ тить, что человек способен на какое-то время запоминать не только фонему, выбранную на основании услышанного стимула, но и более подробное описание сигнала; назовем это условно «тембральной информацией».

В работе [266] исследовались идентификация и различение син­ тетических [i] и [е] гласных в условиях, когда после каждого стимула следовал дополнительный мешающий звук. Полученные

80

Соседние файлы в папке Нормальная физиология