Menu English Ukrainian Russian Home

Бесплатная техническая библиотека для любителей и профессионалов Бесплатная техническая библиотека


Кодирование речи в цифровых системах сотовой связи. Энциклопедия радиоэлектроники и электротехники

Бесплатная техническая библиотека

Энциклопедия радиоэлектроники и электротехники / Мобильная связь

Комментарии к статье Комментарии к статье

В статье напоминаются общие принципы цифрового кодирования речи в электросвязи. Автор достаточно подробно освещает весьма сложные процессы кодирования, применяемые в цифровых системах сотовой связи. Теоретические исследования и оригинальные инженерные решения позволили создать элегантный малогабаритный абонентский радиотелефон. О происходящих в нем сложных процессах, о которых пользователи и даже немало специалистов электросвязи даже не догадываются, читатель узнает из этой статьи.

Загадки речевых сигналов привлекали внимание исследователей задолго до появления электрической связи. Еще в XVIII веке один из величайших математиков петербургский академик Леонард Эйлер (1707-1783) в письме немецкой принцессе от 16 июня 1761 г. писал: "Сооружение машины, которая бы способна была издавать гласы речей наших со всеми переменами, было бы, без сомнения, наиважнейшее изобретение... Сложение такой машины мне кажется не невозможным".

Идея изобретения говорящей машины волновала умы многих творцов, не только стремившихся создать ее в том виде, как представлял себе Эйлер, но и как средство передачи речи на расстояние. Например, конструированием такой машины занимался изобретатель телефона А. Г. Белл (1847-1922). Однако в конечном счете оказалось, что передачу речи на расстояние можно осуществить и без подобной машины. Это было достигнуто достаточно просто. С помощью микрофона колебания воздуха, переносящие речь, преобразовывались в колебания электрического тока, которые передавались по проводам, а на приемном конце с помощью телефона они вновь преобразовывали в колебания воздуха.

Такой метод передачи называется аналоговым ввиду очевидной аналогии между колебаниями воздуха, переносящими звук, и электрическими колебаниями, передающими этот звук. Исследования аналоговой передачи речи с амплитудной модуляцией показали, что для нормального качества воспроизведения речи достаточна полоса частот от 300 до 3400 Гц. Такая полоса была принята в качестве международного стандарта, и на его основе построена всемирная сеть телефонной связи. Принцип действия этой сети сегодня знаком не только каждому связисту, но и широкой публике.

Цифровая передача речи в сетях проводной связи

Коренные изменения в подходах к организации телефонной связи возникли при переводе средств связи на цифровую технику. Преимущества цифровых методов передачи широко известны. Напомним лишь только важнейшее из них - цифровая техника позволяет обеспечить любое наперед заданное качество связи. Для цифровой передачи речи необходимо произвести аналого-цифровое преобразование речевого сигнала: подвергнуть аналоговый сигнал дискретизации, квантованию и кодированию. Совокупность этих операций называется импульсно-кодовой модуляцией (ИКМ). Для точного описания формы речевого сигнала, согласно теореме Котельникова, его дискретизацию приходится проводить с частотой 8 кГц (т. е. брать отсчеты через каждые 125 мкс), а для получения нормального качества воспроизведения речи квантовать каждый отсчет по шкале, разбитой на 8192 уровня (при выборе равномерной шкалы квантования). Чтобы закодировать каждое значение отсчета с помощью двоичного числа, потребуется 13 разрядов.

В результате для передачи телефонного разговора с помощью последовательности двоичных импульсов необходима скорость 8х13=104 кбит/с (что соответствует при оптимальном кодировании полосе частот 52 кГц). Сравнивая это число с полосой частот в 3100 Гц, которая требуется для аналоговой передачи, нельзя не поразиться колоссальному росту необходимой полосы, которым приходится расплачиваться за преимущества цифровой передачи. Естественно попытаться при реализации цифровой системы передачи понизить скорость передачи.

Первый шаг в этом направлении довольно очевиден. Квантование на 213 уровней оказывается необходимым потому, что уровни аналоговых речевых сигналов могут изменяться в диапазоне 60 дБ. При этом сигналы высокого уровня при равномерной шкале квантования квантуются с таким же шагом, что и сигналы низкого уровня. Но так как восприятие сигналов органами слуха человека пропорционально логарифму уровня сигнала, то естественно было бы сигналы высокого уровня квантовать более грубо, а низкого уровня - более точно. Применяя нелинейное квантование с использованием логарифмического закона, можно обойтись восемью разрядами на отсчет, сохранив почти такое же качество передачи. В результате скорость передачи двоичных разрядов окажется равной 64 кбит/с. Именно эта скорость получила самое широкое распространение, она зафиксирована в рекомендации МККТТ С.711, и на ней работает аппаратура ИКМ во многих странах.

Можно ли уменьшать скорость дальше?

Аналоговый сигнал имеет большую избыточность. Это позволяет предсказывать очередной отсчет и передавать только разницу между фактическим и предсказанным значением каждого отсчета. Если применить хорошую схему предсказания, изменение амплитуды приращения сигнала окажется меньше изменения амплитуды самого сигнала, что приведет к уменьшению количества передаваемой информации. На этом принципе строится дифференциальная ИКМ (ДИКМ) и адаптивная дифференциальная ИКМ (АДИКМ), которая позволяет понизить скорость передачи речи до 32 кбит/с и ниже за счет дальнейшего усложнения приемопередающей аппаратуры. Продолжая усложнять аппаратуру, можно довести скорость передачи речи до 100-300 бит/с. Можно представить себе, например, на передающей стороне преобразователь речи в текст, а на приемной стороне - читающую машину.

Известны пути дальнейшего снижения скорости передачи речи, но не будем на этом останавливаться. Дело в том, что аппаратура цифровой передачи речи со скоростью 64 кбит/с всех удовлетворила потому, что она оказалась работоспособной при использовании самых простых симметричных кабелей с парной скруткой. Аппаратура ИКМ-30 начала свое триумфальное шествие с уплотнения соединительных линий между городскими телефонными станциями. Там, где раньше по кабельной паре можно было организовать соединительную линию для передачи лишь одного разговора, аппаратура ИКМ-30 позволила организовать по этой же паре передачу 30 разговоров. О лучшем использовании такой пары с помощью аналоговой аппаратуры многоканальной связи не могло быть и речи.

Позднее появились аппаратура ИКМ-120 и другие высокопроизводительные системы, работающие по коаксиальным кабелям и волоконным световодам, и острота вопроса об уменьшении скорости передачи разговорных сигналов ниже 64 кбит/с в сетях проводной связи практически была снята. Даже многочисленные разработки аппаратуры цифровой передачи со скоростью 32 кбит/с, реализованные во многих странах на основе принципа АДИКМ (в том числе разработка, выполненная в нашей стране под руководством М. У. Поляка), не получили достаточно широкого применения. Баланс между увеличением пропускной способности каналообразующей аппаратуры и сложностью оконечного оборудования в проводной связи пока так и не склонился в пользу первого решения.

Кодирование речи в цифровых сотовых системах радиосвязи

Совсем другие перспективы открылись в конце 1980-х - начале 1990-х годов, когда начали развиваться сотовые системы цифровой радиотелефонной связи. В отличие от проводных сетей, где расширение пропускной способности возможно за счет прокладки новых линий, т. е. возобновления ресурсов пропускной способности, в радиосетях действует жесткий закон тесноты в эфире, и приходится иметь дело с невозобновляемым ресурсом радиочастот. Правда, идея сотовой связи как раз и состоит в возобновлении ресурса радиочастот путем повторения частоты передачи на территории, до которой не доходит сигнал той же частоты от мешающей радиостанции. Но возможности такого возобновления ресурса и здесь ограничены, поэтому дальнейшее усложнение аппаратуры ради снижения скорости передачи оказывается оправданным.

Например, в принятой в большинстве стран Европы системе сотовой цифровой связи GSM стандартные скорости передачи речи составляют 13 и 6,5 кбит/с. Для осуществления подобной системы передачи пришлось обратиться к старой идее машины Эйлера и более глубокому проникновению в механизм речеобразования.

Как известно, один из важнейших результатов современной теории передачи информации состоит в рекомендации разделения задач кодирования источника и кодирования канала. В задачу кодирования источника информации входит описание передаваемого сообщения в максимально экономной форме, т. е. удаление избыточности в сообщении. Полученное таким образом сжатое сообщение становится более уязвимым к воздействию помех и может оказаться искаженным при передаче. Поэтому после кодирования источника применяются кодирование канала, в задачу которого входит защита передаваемого сообщения от помех. Кодирование канала требует внести в передаваемое сообщение некоторую избыточность, но не случайную, которая присутствовала в первоначальном сообщении, а строго обоснованную теоретически и которая гарантирует оговоренное качество передачи.

До сих пор мы рассматривали только задачи кодирования источника, к которым теперь подойдем с более общих позиций.

Итак, имеется цифровая версия аналогового речевого сигнала, т. е. функция, описывающая, например, закон изменения тока во времени. Из такого сигнала нужно попытаться удалить избыточность. Эту задачу можно решать несколькими методами. Один из них - попытаться найти избыточность путем чисто математического анализа рассматриваемой функции. Другой путь решения задачи - анализ акустических характеристик этой функции (с точки зрения ее восприятия органами слуха). Наконец, можно искать избыточность моделированием самого процесса речеобразования. Именно последний из перечисленных методов нашел применение в современных системах цифровой радиосвязи.

Механизм образования звуков речи состоит в том, что богатый гармониками звук голосовых связок, изменяющий свою силу и основную частоту, подвергается дальнейшей обработке в полости рта. Последняя работает, во-первых, как резонатор, который, перестраиваясь, выделяет некоторые частоты - форманты, определяющие различия между гласными звуками. Во-вторых, движения языка, зубов и губ модулируют звук, производя различные согласные. В 1930-х годах в Телефонных лабораториях Белла (США) была построена машина по идее Эйлера, принципы действия которой основывались на попытках моделирования работы органов речи человека.

Для того чтобы синтезировать речь на приемном конце системы связи, нужны генератор звуковой частоты с богатым спектром, генератор белого шума, набор формантных фильтров (их число невелико, так как гласных звуков немного, а каждый из них достаточно хорошо определяется двумя формантами) и модулирующие схемы. Располагая таким комплектом аппаратуры на приемном конце, можно передавать по каналу связи не речевой сигнал, а лишь команды, управляющие процессом синтеза речи. Таким образом, практическая задача сводится к тому, чтобы найти способ генерирования нужных команд. Именно эта задача и решается конструкторами сотовых телефонов.

В системе GSM первых выпусков исходный цифровой поток речевого сигнала со скоростью передачи 104 кбит/с разбивается на отдельные блоки по 160 отсчетов, которые записываются. Каждый из таких блоков занимает промежуток времени 20 мс (иначе говоря, запоминаются последовательности по 160х13=2080 разрядов). Зарегистрированные последовательности подвергаются анализу, в результате которого для каждой из них находятся восемь коэффициентов фильтрации, определяющие соответствующие резонансы, и возбуждающий сигнал. Именно эта информация передается приемнику, который воспроизводит по ней исходный речевой сигнал наподобие того, как это происходит в органах речи человека (этот орган как бы настраивается с помощью восьми параметров, а затем при его возбуждении получается звук).

Однако упомянутый анализ распространяется на сравнительно короткие отрезки времени и не может выявить долгие гласные звуки, захватывающие соседние блоки. Поэтому для устранения избыточности при произнесении долгих гласных применяется долгосрочное предсказание. С этой целью в передатчике запоминаются переданные последовательности длительностью по 15 мс, с которыми сравниваются текущие последовательности. Из уже переданных выбирается последовательность, имеющая наибольшую корреляцию с текущей (т. е. больше других похожая на текущую), и передается только разность между текущей и выбранной последовательностями. Поскольку записанные в передатчике последовательности приемнику известны, нужно передать лишь указатель о том, с какой из записанных последовательностей проведено сравнение. Таким образом достигается дальнейшее сокращение объема передаваемой информации. В результате описанной обработки получается блок цифрового речевого сигнала продолжительностью 20 мс, содержащий 260 разрядов и имеющий скорость передачи всего 13 кбит/с (т. е. в восемь раз ниже исходной). Описанная процедура получила название регулярного импульсного возбуждения с долгосрочным предсказанием (английское сокращение PRE-LTR, которое расшифровывается в виде Regular Pulse Excitation - Long Term Prediction).

На следующем этапе вступает в действие кодирование канала, задачей которого является защита от помех в канале связи. Современная техника кодирования основана на глубоких идеях алгебры и теории вероятности. На основе этих идей разработаны разнообразные и весьма эффективные методы кодирования, решающие в каждом конкретном случае определенные задачи. Ограничимся здесь кратким рассмотрением некоторых идей, использованных в системе GSM.

Кодовая защита может служить либо только для обнаружения факта появления ошибки, либо для исправления случившихся ошибок. Первую возможность осуществить гораздо проще, но и пользы от нее меньше, поскольку в таком случае нужно запрашивать повторную передачу блока сообщения, в котором обнаружена ошибка, либо как-нибудь иначе учитывать наличие ошибки. Поскольку отдельные разряды в цифровом речевом сигнале, полученном в ходе описанных выше процедур кодирования источника, имеют неодинаковую важность, их делят на три подкласса и при кодировании канала подвергают разным методам защиты. Из 260 разрядов получаемого блока наиболее важными являются разряды, которые несут информацию о параметрах фильтрации, об амплитуде сигнала блока и о параметрах долгосрочного предсказания. Эти разряды относятся к так называемому подклассу Ia (50 разрядов). Затем идет подкласс Ib (132 разряда, содержащие указатели и информацию об импульсах регулярного возбуждения, а также некоторые параметры долгосрочного предсказания). Остальные 78 разрядов относятся к классу II.

Кодирование речи в цифровых системах сотовой связи

Для защиты описанного блока применяются два способа кодирования. Во-первых, используется блоковый код, служащий для обнаружения ошибок, которые остаются неисправленными. Этот код относится к классу циклических, в которых каждая кодовая комбинация получается циклической перестановкой элементов. При кодировании этим кодом к разрядам подкласса Ia добавляется еще три проверочных разряда, по которым декодер может обнаружить, содержит ли этот подкласс неисправленные ошибки. Если декодер обнаруживает в разрядах подкласса Ia ошибки в передаче, весь разговорный кадр из 260 разрядов сбрасывается. В этом случае потерянный кадр воспроизводится с помощью интерполяции на основе информации о предыдущем кадре. Было установлено, что при таком решении качество передачи оказывается лучше, чем в случае воспроизведения ошибочных разрядов подкласса Ia. Во-вторых, применяется сверточный код, исправляющий ошибки. Такое название кода объясняется математической операцией свертки, применяемой к функциям, описывающим обработку кодируемой последовательности разрядов. В отличие от блокового кода сверточный код является непрерывным в том смысле, что при его применении процессы кодирования и декодирования совершаются не над фиксированными блоками, а над непрерывно идущей последовательностью символов.

Сверточный код применяется как к разрядам подкласса Ia вместе с проверочными разрядами, так и к разрядам подкласса Ib. Эти две последовательности объединяются и увеличиваются на четыре разряда (см. ниже на рис. 2), принимающих нулевые значения. Последние служат для возвращения кодера в исходное состояние после выполнения кодирования. Применяемый код характеризуется параметрами r=1/2 и К=5. Коэффициент r=1/2 говорит о том, что на каждый разряд, поступающий на вход кодера, в кодированной последовательности получается ровно по два разряда, а К=5 обозначает длину связи, на которую распространяется операция свертки. Эти характеристики можно уяснить по схеме сверточного кодирования, показанной на рис. 1, где приведена также схема сложения по модулю 2 (логическая операция "исключающее ИЛИ"). Таким образом, в результате кодирования из поступающих 189 разрядов получается 378 разрядов, и к ним добавляются незащищенные разряды II класса, в результате чего общая длина блока оказывается равной 456 разрядам (рис. 2). Это составляет ровно восемь подблоков по 57 разрядов. Из подобных подблоков формируются вспышки радиопередачи с временным разделением.

Кодирование речи в цифровых системах сотовой связи

Настоящая статья посвящена вопросам кодирования речевых сигналов, и, как можно понять из описанного, на долю процессора, размещаемого в малогабаритной телефонной трубке, приходится довольно большой объем их цифровой обработки. Однако этим задачи процессора далеко не исчерпываются. Как известно, вместо передачи речи система сотовой связи позволяет организовать канал передачи данных, который кодируется совсем по другим правилам. Но, кроме логических каналов передачи полезной (оплачиваемой) информации, в сотовом телефоне организуется большое число логических каналов передачи сигналов управления. К каждому из таких логических каналов предъявляются специфические требования кодирования информации, и соответственно каждый такой канал вносит свою долю в нагрузку процессора.

Общее представление о схемах кодирования, а также формирования вспышек для передачи всех логических каналов в системе радиотелефонной связи дает рис. 3.

Кодирование речи в цифровых системах сотовой связи

Здесь на верхнем уровне показаны десять разных логических каналов с указанием размеров блоков сообщений в этих каналах (в виде конкретных цифр или буквенных обозначений - P0, N0 и др. - там, где эти цифры могут меняться). На следующем уровне показан первый этап кодирования для разных логических каналов с указанием числа разрядов исходной последовательности и последовательности, полученной после кодирования. Если для речевого канала применяется циклический код, обнаруживающий ошибки, то для остальных каналов применяются различные циклические коды, исправляющие ошибки, в том числе циклический код Файра, исправляющий серии ошибок. На втором этапе кодирования применяется уже упомянутый сверточный код. Далее (этап 3) для распределения полученных 456 разрядов по отдельным вспышкам (несущим каждая по два блока из 57 разрядов) применяются операции перемешивания разрядов и перестановки блоков (прямого или диагонального транспонирования).

Общий объем обработки сигналов в сотовом телефоне исчисляется миллионами операций в секунду. Таким образом, в отличие от обычного телефонного аппарата сотовый телефон представляет собой миниатюрную, но очень производительную ЭВМ. С одной стороны, она анализирует "свой" речевой сигнал, вырабатывая управляющие команды для синтеза речи в аппарате собеседника, а с другой - эта ЭВМ реализует идею Эйлера, синтезируя речь собеседника по управляющим командам, поступающим из канала связи.

Автор: В.Нейман, проф., доктор техн. наук, г.Москва

Смотрите другие статьи раздела Мобильная связь.

Читайте и пишите полезные комментарии к этой статье.

<< Назад

Последние новости науки и техники, новинки электроники:

Использование Apple Vision Pro во время операций 16.03.2024

Медицинская команда больницы Кромвеля в Лондоне впервые применила Apple Vision Pro в ходе двух операций на позвоночнике. Это событие подтверждает потенциал гарнитуры в качестве медицинского инструмента, изменяющего подход к хирургической практике. Хотя сами врачи не использовали Vision Pro, операционная медсестра работала с виртуальной реальностью, используя очки во время подготовки и выполнения процедур. Гарнитура позволила просматривать виртуальные экраны в операционной, выбирать инструменты и следить за ходом операции. Программное обеспечение, разработанное компанией eXeX, специализирующейся на создании приложений на основе искусственного интеллекта для хирургии, существенно улучшило процесс оказания медицинской помощи пациентам. Использование Apple Vision Pro открывает новые возможности для разработки приложений в сфере здравоохранения, таких как клиническое образование, планирование операций, обучение и медицинская визуализация. Внедрение Apple Vision Pro в медицинскую пр ...>>

Хранение углерода в Северное море 16.03.2024

Министр энергетики Норвегии Терье Осланд объявил о запуске проекта Longship, нацеленного на создание центрального хранилища углекислого газа в Северном море. Этот амбициозный проект оценивается в $2,6 млрд и направлен на применение технологии CCS (углеродного захвата и хранения) для смягчения воздействия климатических изменений. Норвегия уже имеет опыт в области CCS благодаря успешным проектам Sleipner и Snohvit, и сейчас стремится увеличить объем углерода, запечатываемого под морским дном. План Longship предусматривает создание мощности по захвату и хранению 1,5 млн. тонн углерода ежегодно в течение 25 лет. Несмотря на позитивные перспективы, существуют опасения по поводу долгосрочных последствий такого хранения. Однако сторонники проекта утверждают, что морское хранение углерода имеет ряд преимуществ, включая минимальное воздействие на окружающую среду. Проект Longship осуществляется при участии компаний Equinor, Shell и TotalEnergies через совместное предприятие Northern Li ...>>

Выращены мини-органы из амниотической жидкости человека 15.03.2024

Международная команда ученых под руководством профессора Фань Сюлиня из Университета Чжэцзян разработала уникальный способ выращивания мини-органов из клеток, обнаруженных в амниотической жидкости человека. Этот значительный прорыв в медицине может привести к улучшению диагностики и лечения врожденных заболеваний. Органоиды, представляющие собой трехмерные клеточные структуры, имитирующие органы в меньшем масштабе, были выращены из клеток легких, почек и тонкого кишечника, найденных в амниотической жидкости. Этот метод открывает новые возможности для изучения различных состояний плода и может стать ключом к ранней диагностике и лечению врожденных дефектов. Хотя пока не проводились попытки использования этого метода в лечении, ученые надеются, что их исследования в будущем помогут бороться с серьезными врожденными заболеваниями, которые затрагивают миллионы новорожденных ежегодно. Этот прорыв может изменить практику медицинских вмешательств, позволяя диагностировать и лечить врожд ...>>

Случайная новость из Архива

Жуки - самые живучие существа 27.03.2015

Ученые из Университета штата Колорадо (США) выяснили, что жуки оказались не только крупнейшей группой среди насекомых и живых существ в целом (их насчитывается почти 400 тысяч видов), но и самыми способными к выживанию субъектами.

Как правило, энтомологи уделяют основное внимание появлению новых видов, но вымирание не менее важно для понимания истории животных. Палеонтологи обследовали более 5500 ископаемых останков жесткокрылых, представляющих всю историю отряда, начиная с пермского периода (284 миллиона лет назад) и собранных по всему миру.

Выяснилось, что за сотни миллионов лет вымерло лишь 35 семейств жуков из 214, а в самом крупном отряде жуков Polyphaga (90% всех известных видов) вымерших семейств вообще не оказалось: они пережили как массовое пермское, так и мел-палеогеновое вымирания.

Несмотря на то, что другие группы насекомых вполне могут оказаться не менее устойчивыми к вымиранию, среди причин столь выдающихся успехов жуков ученые называют способность быстро адаптироваться к самым различным климатическим условиям, а также невероятную гибкость их рациона.

Другие интересные новости:

▪ Яблоки полезны для мозга

▪ Карты памяти SanDisk Extreme Pro CFast 2.0

▪ Смертельная опасность яблок

▪ Аксессуар Biostar для добычи криптовалют

▪ Смартфон Micromax A115 Canvas 3D c дисплеем Naked eye 3D

Лента новостей науки и техники, новинок электроники

 

Интересные материалы Бесплатной технической библиотеки:

▪ раздел сайта Аудиотехника. Подборка статей

▪ статья Старая гвардия. Крылатое выражение

▪ статья Почему лед ломает трубы? Подробный ответ

▪ статья Боярышник кровяно-красный. Легенды, выращивание, способы применения

▪ статья Определение параметров и расчет силового трансформатора источника для полуавтоматической сварки. Энциклопедия радиоэлектроники и электротехники

▪ статья Автоматика и телемеханика. Автоматическое повторное включение (АПВ). Энциклопедия радиоэлектроники и электротехники

Оставьте свой комментарий к этой статье:

Имя:


E-mail (не обязательно):


Комментарий:





All languages of this page

Главная страница | Библиотека | Статьи | Карта сайта | Отзывы о сайте

www.diagram.com.ua

www.diagram.com.ua
2000-2024