www.chms.ru - вывоз мусора в Балашихе 

Динамо-машины  Сигналы и спектры 

 286 ] 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358

Окончание табл. 13.1

Длина

Белые

Черные

Длина

Белые

Черные

группы

группы

Оконечные кодовые слова

0001100

00001100111

01010100

000001010011

0001000

00001101000

01010101

000001000100

0010111

00001101100

00100100

000000110111

0000011

00000110111

00100101

000000111000

0000100

00000101000

01011000

000000100111

0101000

00000010111

01011001

000000101000

0101011

00000011000

01011010

000001011000

0010011

000011001010

01011011

000001011001

0100100

000011001011

01001010

000000101011

0011000

000011001100

01001011

000000101100

00000010

000011001101

00110010

000001011010

00000011

000001101000

00110011

000001100110

00011010

000001101001

00110100

000001100111

Пример 13.8. Код группового кодирования

Используйте модифицированный код Хаффмана для сжатия строки

200 Б, 10 Ч, 10 Б, 84 Ч, 1424 Б,

состоящей из 1728 пиксельных элементов. Решение

Используя табл. 13.1, определим, каким должно быть кодирование для этой модели (для

удобства чтения введены пробелы).

010111 10011 0000100 00111 192Б 8Б 104 10Б

0000001111 00001101000 644 204

000000000001 EOL

Итак, требуется всего 56 бит, чтобы послать эту строку, содержащую последовательность 1188 бит.

13.7.3.2. Коды Лемпеля-Зива (ZIP)

Основной сложностью при использовании кода Хаффмана является то, что вероятности символов должны бьпъ известны или оценены и как кодер, так и декодер должны знать дерево кодирования. Если дерево строится из необычного для кодера алфавита, канал, связывающий кодер и декодер, должен также отправлять кодирующее дерево как заголовок сжатого файла. Эти служебные издержки уменьшат эффективность сжатия, реализованную с помощью построения и применения дерева к алфавиту источника. Алгоритм Лемпеля-Зива (Lempel-Ziv) и его многочисленные разновидности используют текст сам по себе для итеративного построения синтаксически вьщеленной последовательности кодовых слов переменной длины, которые образуют кодовый словарь.

Код предполагает, что существующий словарь содержит уже закодированные сегменты последовательности символов алфавита. Данные кодируются с помощью просмотра существующего словаря для согласования со следующим коротким сегментом кодируемой последовательности. Если согласование найдено, код следует такой фило-



софии: поскольку получатель уже имеет этот сегмент кода в своей памяти, нет необходимости пересылать его, требуется только определить адрес, чтобы найти сегмент. Код ссылается на расположение последовательности сегмента и затем дополняет следующий символ в последовательности, чтобы образовать новую позицию в словаре кода. Код начинается с пустого словаря, так что первые элементы являются позициями, которые не ссылаются на более ранние. В одной форме словаря рекуррентно формируется выполняемая последовательность адресов и сегмент символов алфавита, содержащийся в ней. Закодированные данные состоят из пакета lt;адрес словаря, следующий знак данных gt;, а каждый новый входной элемент словаря образован как пакет, содержащий адрес того словаря, за которым следует следующий символ. Рассмотрим пример такой технологии кодирования.

Закодируйте последовательность символов[abaababbbbbbbabbbba]

Закодированные lt;0,а gt;, lt;0,Ь gt;, lt;1,а gt;, lt;2,а gt;, lt;2,Ь gt;, lt;5,Ь gt;, lt;5,а gt;, lt;6,Ь gt;, lt;4,- gt; пакеты:

Адрес: 1 2 3 4 5 6 7 8

Содержимое: а b аа Ьа bb bbb bba bbbb

Начальный пакет lt;0,а gt; показывает нулевой адрес, потому что в словаре еще нет ни одной позиции. В этом пакете знак а является первым в последовательности данных, и он приписан к адресу 1. Следующий пакет lt;0,Ь gt; содержит второй знак данных Ь, который еще не был в словаре (следовательно, адресное значение есть 0); b приписывается адресу 2. Пакет lt;1,а gt; представляет кодирование следующих двух знаков аа с помощью вызова адреса 1 для первого и присоединения к этому адресу следующего знака а . Пара знаков аа приписывается адресу 3. Пакет lt;2,а gt; представляет кодирование следующих двух знаков данных Ьа с помощью вызова адреса 2 для знака Ь и присоединения к этому адресу следующего знака а . Пара знаков данных Ьа приписывается адресу 4 и т.д. Отметим, как завершается фупповое кодирование. Восьмой пакет составлен из адреса 6, содержащего три знака Ь , за которыми следует другой знак Ь . В этом примере закодированные данные могут быть описаны с помощью трехбитового адреса с последующим битом О или 1 для определения присоединенного знака. В закодированной последовательности существует последовательность из 9 символов для общего содержимого в 36 бит для кодирования данных, содержащих 20 знаков. Как во многих схемах сжатия, эффективность кодирования не достигается для коротких последовательностей, как в этом примере, и имеется только для длинных последовательностей.

В другой форме алгоритма Лемпеля-Зива закодированные данные представлены как три словесных пакета вида lt;число знаков сзади, длина, следующий знак gt;. Здесь концепция адреса не используется. Наоборот, имеются ссылки на предшествующие последовательности данных, а также допускаются рекуррентные ссылки на параметр длины. Это показано в следующем примере, представленном как позиция lt;1,7,а gt;.

Закодируйте последовательность символов [abaababbbbbbbabbbbba]

Закодированные lt;0,0,а gt;, lt;0,0,Ь gt;, lt;2,1,а gt;, lt;3,2,Ь gt;, lt;1,7,а gt;, lt;6,5,а gt;

пакеты:

Содержимое: а b аа bab bbbbbbba bbbbba

Текущий текст: а аЬ аЬаа abaabab abaababbbbbbbba вся

последовательность



Здесь также не видно эффективности кодирования для короткой серии данных. Разновидности кода ограничивают размер обратной ссылки, например 12-битовая для максимума в 4 096 пунктов обратной ссылки. Это Офаничение уменьшает размер памяти, требуемой для словаря, и сокращает вероятность перефузки памяти. Возможны также модификации кода, Офаничивающие длину префикса или фразы, определенной первыми двумя аргументами lt;назац п1, вперед п2, ххх gt;, которые должны быть меньше некоторого значения (например, 16) с целью Офаничения сложности обратного поиска во время кодирования. Алгоритм Лемпеля-Зива присутствует во многих коммерческих и пробных профаммах, которые включают сжатие LZ77, Gzip, LZ78, LZW и UNIX.

13.8. Примеры кодирования источника

Кодирование источника стало основной подсистемой в современных системах связи. Высокие требования к полосе частот и возможность запоминания явились мотивом его развития, в то время как интефированные схемы и методы обработки сигналов предоставили такую возможность. Вторичной причиной широкого внедрения процесса в систему связи является определение общеиндустриальных стандартов, которые позволяют множественным поставщикам проводить рентабельную и конкурентоспособную реализацию процесса кодирования. Существуют стандарты МККТТ для кодирования источника или алгоритмов сжатия речи, аудио, неподвижных образов и движущихся изображений. В этом разделе будет изучено множество алгоритмов кодирования источника, основанных на стандартах, что должно продемонстрировать широкую применимость кодирования источника в системах связи и проиллюстрировать типичные уровни производительности.

13.8.1. Аудиосжатие

Аудиосжатие широко применяется в потребительских и профессиональных цифровых аудиопродуктах, таких как компакт-диски (compact disc - CD), цифровая аудиолента (digital audio type - DAT), мини-диск (mini-disk - MD), цифровая компакт-кассета (digital compact cassette - DCC), универсальный цифровой диск (digital versatile disc - DVD), цифровое аудиовещание (digital audio broadcasting - DAB) и аудиопродукция в формате МРЗ от экспертной группы по вопросам движущегося изображения (Motion Picture Experts Group - (MPEG). К тому же сжатие речи в телефонии, в частности сотовой телефонии, требуемое для экономии полосы частот и сбережения времени жизни батареи, дало начало процессу разработки множества стандартов сжатия речи. Различные алгоритмы применимы к речевым и потребительским сигналам более широкой полосы частот. Аудио- и речевые схемы сжатия можно для удобства разделить согласно приложениям, что отражает некоторую меру приемлемого качества. Рассмотрим параметры, описывающие это деление [24, 25].

Типичные значения параметров для трех классов аудиосигналов

Диапазон Частота Бит Скорость

частот дискретизации РСМ/выборку передачи

битов РСМ

Телефонная речь

300-3 400 Гц

8 кГц

64 Кбит/с

Широкополосная

60-7 ООО Гц

16 кГц

224 Кбит/с

речь

Широкополосное

10-20 ООО Гц

48 кГц

768 Кбит/с

аудио



 286 ] 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358