Articles Comments

KARAGYOZOV.COM » Sound theory » КВАНТИЗАЦИЯ НА ЗВУКА. DITHER

КВАНТИЗАЦИЯ НА ЗВУКА. DITHER

Dither2

Dither2

Дискретизацията на звука е една от най-трудните за обяснение теми. Научната литература в областта трудно може да им помогне, тъй като е на доста сериозно математическо ниво.

Как дигитализираме звука? Чрез процес, наречен квантизация.

Аналоговата вълна, която е непрекъсната по времевия си характер, при квантуването, или дискретизацията, се преобразува в дискретни импулси, отчитани и измервани по ниво през определен период от време. Тези измервания стават по скала, базирана на двоичен код. Тя позволява отчитането на такъв краен брой нива, колкото са възможните стойности, които позволява броя комбинации, генерирани от този двоичен код.

Тези нива са нивата на квантуване.

Главният недостатък на този метод- това е дискретното представяне на непрекъснато звучащия звук като поредица от семпли.

Процесът е дискретен обаче не само във времеви аспект, но и в интензитетен – тоест по вертикалата в нашата виртуална координатна система. Тъй като отчитането на нивото на звука може да се извършва само през определени нива /нивата на квантуване/, ние не можем да отчетем разликите в ниво, случващи се в областта между две дискретни нива. Ако определено ниво в даден момент се намира някъде между нивата на кватнуване, то се закръглява към най-близкото такова. Резултат – промяна, макар и малка, на формата на реконструираната накрая звукова вълна. Това се нарича квантизационна грешка, а възникналите вследствие на грешката изкривявания – квантизационни загуби или квантизационни изкривявания:

Dither4

 

Когато нивата на квантуване, с които описваме нивото на звука, са много, проблемът е пренеблежимо малък. В реална ситуация деградацията на звука, причинена от квантизационните грешки, е функция и на нивото, т.е. колкото е по-слаб звука, толкова е по-голяма грешката, защото ниските нива се описват с по-малко нива на квантуване . Какво значение има, че битовата резолюция е например 16 бита, при положение че в момента този звук е слаб и нивата на квантуване, с които се описва, са относително много? В гози момент той може дори да стане 4-5 битов, а не 16, и тогава нещата стават по-различни.

Обикновено този ефект се неглижира от факта, че става въпрос за относително слаби сигнали, като пасажи в тиха динамика или реверб-“tails” на сигнала. Въпреки това, като се има предвид, че в условията на звукозапис не винаги се съблюдават оптимално високи нива по много причини, както и поради факта, че при многопистова работа ефектът се мултиплицира, квантизационните загуби са една от основните причини за деформацията на звука в цифрова среда. Ако даден звук е записан тихо – с много ниски нива, съответно ниска битова резолюция, последващото му повдигане по ниво при смесване няма да подобри качеството му.

Най-ефективно можем да се справим с проблема, като работим във по- висока битова резолюция .

Bъпреки по-добрите резултати от работата в 24 и дори 32- битов режим обаче, това е само междинен формат на работа, а в повечето случаи при финалния микс се налага конвертиране в 16 бита – 44.1 kHz sampling rate за CD Audio и 16 бита – 48 kHz sampling rate за audio for video. Конвертирането към по-ниска битова резолюция се прави на финалния етап и е комплексен процес, при който цифровите думи, дефиниращи нивата на звука във всеки семпъл, се намаляват като големина, за да се сведат до по-ниската битова резолюция.

Дитерирането най-общо е добавяне на слаб шум във входния сигнал.

Тъй като проблемът с квантизационната грешка идва от корелацията със звука, се търси начин тази корелация да се избегне.

За целта се генерира случайностен като вероятностни значения сигнал, чуваем като т.нар. бял шум (слуховото впечатление е като шум от течаща вода) със съвсем малка амплитуда – колкото е разстоянието между 2 или 3 съседни кванти- зационни нива. Този шум декорелира по случаен начин нивата на звука, като при това нивата не стоят на едно ниво и после изведнъж да прескочат еднократно на следващото, а се колебаят непрекъснато. Това колебание по своя характер дава нужната информация за разположението на вълновата форма между две съседни нива на квантуване, увеличавайки чрез това слухово битовата резолюция над реалната.

 

Dither3

А -входен сигнал, B – квантизация без дитер, C – входен сигнал с добавен на входа дитеринг шум, D – квантизация с дитер.

 

Слухово след реконструирането на аналоговия звук при цифрово- аналоговото преобразуване вариант B е чуваем като изкривяване на звука, а D- като чист звук с прибавен шум от дитера.

Слухово дитерирането е много по-приемливо и по тази причина винаги при крайно преобразуване от по-висока към по-ниска битова резолюция се препоръчва прилагането на дитер.

Типовете дитер могат да се различават по:

1. амплитуда

2. вероятностно разпределение

3. честотна характеристика.

1. Амплитудата на шума може да е в границите на едно-две нива на квантуване, тоест “разлюляването”, което този шум ще причини, ще е в такъв диапазон.

 

Filed under: Sound theory

Leave a Reply

*