6. Передача речевых сигналов по сетям связи

Рассмотрим общую модель цифровой системы связи, представленную на рис. 6.1. Структура системы определяет необходимые процедуры обработки речевого сигнала, а её характеристики - основные свойства СПРС и прежде всего – энергетические и спектральные.

Рис. 6.1. Модель цифровой системы связи

Рис. 6.1. Модель цифровой системы связи

Источник сообщения генерирует сообщения, представляющие собой либо непрерывные функции от времени, либо потоки дискретных сигналов. Пример непрерывного во времени сообщения - волновой сигнал, передающий человеческую речь. Чтобы передать такой аналоговый сигнал через цифровую систему связи, его необходимо преобразовать в цифровую форму. С этой целью сигнал последовательно подвергается аналого-цифровому преобразованию (АЦП) и кодированию с устранением избыточности в кодере источника. Хороший кодер источника «подгоняет» длину двоичных последовательностей под статистические свойства источника сообщений. В случае передачи речевого сигнала, кодер источника принято называть кодером речи. Важной характеристикой сигнала, преобразованного в цифровую форму, является цифровая скорость передачи (скорость цифрового представления), измеряемая числом формируемых на выходе АЦП двоичных символов в единицу времени - Rц, бит/с. В результате сжатия информации кодером речи скорость цифрового потока многократно уменьшается при сохранении приемлемого качества передачи речи.

На следующем этапе компактно представленный речевой сигнал подвергается ряду преобразований, основное из которых – помехоустойчивое (избыточное) кодирование. Дело в том, что некоторые физические явления, происходящие в каналах связи, приводят к возникновению ошибок при приеме сигналов. Эти ошибки можно представить как разность переданной и восстановленной из принятого сигнала двоичными последовательностями. Для того чтобы обнаружить и по возможности исправить ошибки, применяются канальный кодер в передатчике и канальный декодер в приемнике. К информационным блокам добавляется определенное число выбранных особым образом дополнительных битов. Значения этих битов рассчитываются путем сложения по модулю двух информационных битов, подбираемых таким образом, чтобы между ними существовала алгебраическая взаимосвязь, позволяющая обнаружить и скорректировать возможные ошибки.

Следующая процедура преобразования речевого сигнала на передающей стороне канала связи – модуляция, которой на приемной стороне соответствует демодуляция. Модем, реализующий эти процедуры, является своеобразным интерфейсом, согласующим дискретную часть системы с её непрерывной частью, которая представлена на рис. 6.1 радиоблоком и физическим каналом. Модулятор - это блок, формирующий синусоидальный сигнал, параметры которого (частота, амплитуда и/или фаза) являются функциями поданной на его вход цифровой последовательности. В результате модуляции несущий информацию сигнал переносится в соответствующую часть радиодиапазона и приобретает четко сформированные спектральные параметры. Это свойство сигнала — важнейшее для систем подвижной связи. Здесь необходимо эффективно использовать выделенные спектральные ресурсы, чтобы не искажать сигналы, передаваемые пользователями соседних областей спектра. Электромагнитный спектр - ценный и ограниченный ресурс, поэтому каждая система должна использовать максимально возможное количество своих собственных каналов в выделенном ей частотном диапазоне.

Радиоблок, иначе – высокочастотый (ВЧ) блок, работает в радиочастотном диапазоне и усиливает радиосигнал до требуемого уровня. Ширина полосы сигнала зависит от выбранного типа модуляции и используемого метода многостанционного доступа. Обычным требованием к применяемому в системе подвижной связи усилителю ВЧ является ограничение энергопотребления. Поэтому усилитель ВЧ должен обладать большим динамическим диапазоном и вынужден функционировать в нелинейной области своих характеристик. Компенсировать нелинейные искажения, вносимые усилителем ВЧ, позволяет применение методов модуляции с постоянной или слабо меняющейся огибающей.

В системах подвижной связи передатчик излучает сигнал в пространство с помощью антенны. Свойства канала тесно связаны с типами передающей и приемной антенн. Особенно важную роль играют параметры направленного действия и усиления антенны. Характеристики антенны определяют рабочий диапазон системы и ее эффективность.

Преобразования, производимые в приемнике, имеют обратное соответствие процессам, происходящим в передатчике. После усиления и фильтрации в каскадах ВЧ блока принятый сигнал демодулируется. Характер преобразования зависит от применяемого метода цифровой модуляции и параметров канала. Сильное влияние на выбор типа применяемого демодулятора оказывает фактор стоимостной реализации приемника. Основная задача демодулятора - выделить последовательность импульсов из модулированного сигнала, полученного после ВЧ обработки. На основе этих импульсов демодулятор выделяет из принятого сигнала переданные символы данных и преобразует их в двоичные последовательности.

Канальный декодер, используя добавленные канальным кодером избыточные биты, а также дополнительную информацию о достоверности принятого сигнала, определяет кодовую последовательность. Из полученной кодовой последовательности выделяется двоичная информационная составляющая. Именно она является основной целью декодирования.

Декодированный сигнал преобразуется в декодере источника (в СПРС – в декодере речи) и после цифро-аналогового преобразования (ЦАП) попадает через усилитель и громкоговоритель (телефон) в приемник сообщений - ухо пользователя.

Основные требования, предъявляемые к процессу передачи речи по сетям связи, — это высокое качество сигнала и низкая системная (временная) задержка. При этом качество речи по большей части напрямую связано со скоростью цифрового потока на выходе кодера речи, в то же время более сложные алгоритмы кодирования речи способны достичь более высоких отношений качества к скорости цифрового потока.

Сжатие речи при ее передаче сокращает объем передаваемых данных, затраты и, благодаря этому, позволяет снижать цены на услуги. Очевидно, чем изощренней алгоритм кодирования речевого сигнала, тем сложнее его реализовать. Сложность связана с вычислениями, необходимыми для воспроизведения процессов кодирования и декодирования сигналов в реальном времени в микросхемах АТ. Скорость обработки измеряется миллионами операций в секунду (MIPS). Достижения в технологии сигнальных процессоров (DSP), сверхбольших интегральных схем (VLSI) и увеличение емкости элементов памяти позволяют выполнять более сложные алгоритмы кодирования-декодирования речи даже в однокристальных микропроцессорах. Сложность обработки влияет на физические размеры кодека речи, на его стоимость, потребляемую мощность, а также отражается на величине коммутационной задержки – временной задержке сигнала при его обработке и буферизации в кодере и декодере. Задержка речевого сигнала в трактах передачи и приема не имеет большого значения в системах вещания, однако в телефонном канале значительное запаздывание сигнала заметно снижает качество восприятия речи. Реальные коммутационные задержки (при кодировании и декодировании) составляют от 125 мкс (в линиях с ИКМ) до 100 мс (в некоторых низкоскоростных системах кодирования). Предельно допустимой в телефонии считается общая задержка порядка 400 мс. Например, в стандарте GSM система синхронизации рассчитана на компенсацию абсолютного времени задержки сигналов до 233 мкс, что соответствует максимальному радиусу соты 35 км.

Исторически сложились два направления кодирования речи: кодирование формы сигнала (КФС), называемое также аппроксимацией формы речевой волны, и параметрическое компандирование речи, иногда называемое кодированиемисточника сигнала. В первом методе кодер формы волны аппроксимирует форму речевого сигнала во времени. Этот метод основан на использовании статистических характеристик речевого сигнала (РС) и практически не зависит от механизма его формирования. Кодеры этого типа обеспечивают высокое качество передачи речи, но скорость цифрового потока редко бывает меньше 32 кбит/с. Поэтому для кодирования речи со скоростью передачи 16 кбит/с и меньше – прежде всего для цифровых систем сотовой и персональной спутниковой связи - получили мощное развитие разнообразные методы параметрического компандирования речи (табл. 6.1).

Таблица 6.1.

Вид преобразования речи

Устройства преобра- зования

Алгоритмы кодирования -декодирования речи

Скорость передачи, кбит/с

Кодирование формы сигнала

Кодеры формы

сигнала

Импульсно - кодовая модуляция (ИКМ)

64

Дифференциальная ИКМ (ДИКМ)

48/52/56

Адаптивная дельта-модуляция (АДМ)

40

Адаптивная дифференциальная ИКМ (АДИКМ)

32

Парамет-

рическое компандирование

(кодирова-

ние) речи

Вокодеры

Спектрально-временные (полосный, формантный, гармонический)

1,2-4,8

Кодирование на основе линейного предсказания (LPC)

Гибридные

кодеры

Линейное предсказание с возбуждением от остатка предсказания (RELP)

4,8-16

Линейное предсказание с многоимпульсным возбуждением (MPE-LPC)

Линейное предсказание с долговременным предсказанием

(LTP-LPC)

Линейное предсказание с регулярным импульсным возбуждением (RPE-LPC)

Линейное предсказание с кодовым возбуждением (CELP)

Линейное предсказание с кодовым возбуждением и малой

задержкой (LD-CELP)

Линейное предсказание с возбуждением алгебраическим кодом (ACELP)

Линейное предсказание с векторным возбуждением (VSELP)

Адаптивное кодирование с предсказанием (АРС)

Метод квантования по максимуму правдоподобия (MP-MLQ)

Трудность создания кодеков, обеспечивающих минимально возможную скорость передачи для речевого источника, обусловлена рядом причин. Во-первых, речь представляет собой колебания сложной формы, зависящей от произносимых слов, тембра голоса, интонации, пола и возраста говорящего, а речевой сигнал не является стационарным процессом. Законы изменения его вероятностных характеристик на участках произнесения гласных и согласных звуков существенно различаются, не говоря уже о паузах и смычках (участки звучания согласных типа «м», «н», «п» и т. п.), где характеристики могут изменяться почти скачком.

Вторая причина связана с определением (формализацией) критерия верности передачи, свойственным получателю. Действительный критерий восприятия, который характеризует качество слухового приема речевого сигнала человеком, отличается от распространенного критерия среднеквадратической ошибки или от какого-либо другого критерия, контролирующего отклонение «формы реализаций». Поэтому воспользоваться непосредственно результатами теории передачи информации для расчета качественных характеристик источника речевого сигнала затруднительно. Однако, можно попытаться получить оценки минимально возможной скорости передачи из других соображений, используя физические свойства получателя и источника речевых акустических колебаний.

При параметрическом компандировании моделируется процесс речеобразования человека. Для этого в кодере из речевого сигнала вычисляются определенные параметры, которые передаются к декодеру, где они используются для восстановления формы сигнала. Восстановленная форма сигнала очень часто отличается от формы исходного сигнала; при этом звук подобен или близок к оригиналу. Использование полностью параметрических методов в настоящее время ограничено, так как они приводят к заметному ухудшению натуральности звучания голоса и чрезвычайно чувствительны к фоновому шуму. Один из способов снижения скорости передачи речи и повышения эффективности использования полосы пропускания канала связи состоит в применении гибридных методов, основанных на принципах линейного предсказания и объединяющих параметрическое компандирование и кодирование формы волны (табл. 6.1).

Основные характеристики наиболее распространенных и перспективных методов кодирования речи являются предметом изучения в следующих лекциях.

Устройства преобразования и обработки информации в системах подвижной радиосвязи


*****
© Банк лекций Siblec.ru
Формальные, технические, естественные, общественные, гуманитарные, и другие науки.