Звук и основные свойства звуковых волн

Анализ звуков

В настоящее время анализ звуков осуществляется с помощью электронных устройств, таких, как анализаторы частот и динамические спектрографы, или сонографы. В первом случае представляется возможность оценивать амплитудно-частотные характеристики звука, но без учета изменений свойств звука во времени. Применение динамических спектрографов дает возможность рассматривать звук в системе трех координат: частота и амплитуда колебаний, и время. Выраженность его спектральных составляющих, то есть интенсивность звучания, отражается на динамической спектрограмме степенью ее затемнения. Изображение сложных звуков в виде динамических спектров впервые было применено для анализа речи и получило название "видимая речь". Пока это является единственным более или менее удовлетворительным приемом преобразования звукового образа в зрительный. Глядя на динамическую спектрограмму, конечно, мы не слышим звука, однако тренированные люди на основе таких "картин" звуков могут даже их имитировать. Для того чтобы в какой-то мере научиться читать динамические спектрограммы, обратимся к примерам.

В качестве первого примера рассмотрим динамическую спектрограмму звука "и", выделенного из слитной речи. На представленной здесь фотографии спектрограммы слева от нее по вертикали изображена шкала частот, соответствующая набору фильтров динамического спектрографа. Каждый из этих фильтров реагирует лишь на определенный узкий диапазон частот и в случае наличия именно таких частот в сигнале отражает их в спектрограмме затемнением той или иной плотности. Диапазон частот, на которые реагирует фильтр, называют полосой пропускания фильтра. Прибор, используемый для анализа данного звука "и", имел 48 фильтров; их полосы пропускания соответствовали значениям частотной избирательности слуха человека. Если фильтры различны по ширине пропускания, то шкала частот на динамической спектрограмме приобретает сложный вид и состоит из разных участков - как с логарифмическим, так и с линейным масштабом. Однако в биоакустических работах применяют и такие динамические спектрографы, у фильтров которых ширина полос пропускания одинакова. Поэтому спектрограммы, полученные с помощью такого прибора, имеют простую, то есть линейную, шкалу частот. Чаще всего берутся фильтры с довольно широкой полосой пропускания - порядка 300 герц. Эта величина указывает на разрешающую способность по частоте динамического спектрографа.

Динамическая спектрограмма звука и, выделенного из слитной речи
3. Динамическая спектрограмма звука "и", выделенного из слитной речи. Шкала частот сложная и состоит из разных участков - как в линейном, так и в логарифмическом масштабе. Вертикальные линии - метки времени: период следования равен 0,1 секунды. Три участка с наибольшей плотностью потемнения (F1, F2, F3) являются формантными частотами данного гласного звука. На спектрограмме видно, что звук частотно-модулирован по второй форманте.

Однако вернемся к рассматриваемой динамической спектрограмме. Длина ее соответствует продолжительности звука "и", которая в данном случае равна 0,2 секунды. На спектрограмме видны несколько зон почернения, отражающих наличие звуковой энергии в тех или иных областях частот, что указывает на присутствие тех или иных спектральных составляющих. Эти зоны почернения называют спектральными максимумами. Самые плотные почернения соответствуют областям формантных частот, каждая из которых представляет собой совокупность нескольких гармоник. Однако на динамической спектрограмме звука "и" они слились в одну область почернения, так как частота основного тона звуков речи (определяющая, как уже отмечалось, расстояние между соседними гармониками) меньше ширины полосы пропускания фильтров спектрографа, с помощью которого произведен анализ этого звука. В силу ограниченных возможностей прибора на данной динамической спектрограмме отсутствует и частота основного тона. Обычно ее определяют с помощью другого, специально предназначенного для этой цели прибора - интонографа.

Рассматривая динамическую спектрограмму звука "и", можно отметить, что одна, а именно вторая форманта постепенно опускается вниз. Это означает изменение (в данном случае - понижение) частоты этой форманты во времени и отражает одну из физических характеристик звука - его частотную модуляцию. Частотная модуляция может иметь разную форму и глубину. Но ее может и не быть совсем, и тогда звук характеризуется как стабильный по частоте. На другой динамической спектрограмме представлены результаты анализа звука визга малыша ондатры, близкого по звучанию к звуку "и", но более громкого и более продолжительного. Здесь частота каждого спектрального максимума изменяется в больших пределах. Другим предстает и характер изменения частоты во времени. Ввиду того, что частота основного тона голоса грызуна выше, чем у человека, на динамической спектрограмме она хорошо видна - это самая низкая по частоте область потемнения. Отчетливо видны и гармоники, представленные здесь в виде трех черных полос, форма которых аналогична форме кривой, отражающей частоту основного тона. Кроме того, в начале и в конце динамической спектрограммы визга легко обнаружить участки с равномерным распределением звуковой энергии в довольно широкой области частот. Это участки звука с так называемым шумовым заполнением.

Динамическая спектрограмма визга ондатренка
4. Динамическая спектрограмма визга ондатренка. Шкала частот, как и в предыдущем рисунке, сложная. Вертикальные линии на спектрограмме - метки времени, они следуют с периодом 0,1 секунды. На спектрограмме хорошо видны частота основного тона, соответствующая первой гармонике (f1), и высшие гармоники ([f2, f3, f4). Звук частотно-модулирован. В начале и конце спектрограммы отчетливо видны более или менее равномерно затемненные участки - это участки с шумовым заполнением.

На третьей из помещенных здесь фотографий в качестве примера представлено название нашей книги в двух вариантах - в виде текста и в виде динамической спектрограммы произнесенной фразы. Внимательно изучим все три примера, это поможет нам перекинуть мост через пропасть, разделяющую в нашем сознании звук и графическое представление о нем.

Динамическая спектрограмма прочитанного вслух названия нашей книги
5. Динамическая спектрограмма прочитанного вслух названия нашей книги.