В сфере звукозаписи актуальна проблема эффективного хранения высококачественных фонограмм. Существующие библиотеки звукозаписей с 24- или 32-разрядным представлением звука, хоть и обеспечивают высокое качество, занимают значительные объемы памяти. При этом, даже 16-разрядное представление, широко используемое на практике, зачастую оказывается недостаточным для профессиональной работы со звуком. Исследования, проведенные на кафедре телевидения и звукового вещания (ТиЗВ) МТУСИ, подтвердили необходимость представления повышения разрядности представления для достижения высококачественной записи звукового сигнала.
Специалисты МТУСИ предложили способ компактной студийной записи / © Thazoo, en.wikipedia.org
Было установлено, что при 16 – разрядном представлении искажения на пороге заметности слушателем обеспечиваются только в ограниченном диапазоне около 35 дБ, при реальных динамических диапазонах сигнала до 70 дБ. Причем значительным искажениям подвергаются сигналы малого уровня, что особенно заметно для слушателя, так как для малых уровней отсутствует эффект частотной маскировки шумов и искажений.
Принимая во внимание, что для слушателя достаточно соотношения сигнал/шум около 56 дБ, увеличение разрядности выше 56 дБ не будет замечено слушателем как улучшение качества. Таким образом, при повышении разрядности представления выше 16, большая часть сигнала больших и средних уровней будет защищена избыточно, а сигналы малого уровня останутся недостаточно защищены.
Решением этой проблемы стал разработанный сотрудниками кафедры ТиЗВ МТУСИ – О. Б. Поповым и Т. В. Чернышевой — способ и алгоритм неискажающего компандирования сигнала при его аналого-цифровом представлении. Предложенный способ позволяет сжать динамический диапазон входного сигнала до 10-15 дБ, что обеспечивает его точную передачу без искажений даже при обычном 16 разрядном представлении. Кроме того, при использовании обычного 16 разрядного транспортного потока, решение обеспечивает качество передачи для всех передаваемых уровней (особенно для малых), соответствующее 32 разрядному входному сигналу. Показана также возможность еще большего снижения разрядности представления до 12 без появления субъективной «заметности» изменения сигнала для слушателя по сравнению с исходным.
Объективные измерения и субъективно-статистические испытания подтвердили эффективность предложенного способа, демонстрируя возможность значительного сокращения объема сигнала при сохранении его высокого объективного качества.