Цифровая обработка речевых сигналов
Автор(ы): | Рабинер Л., Гоулд Б.
06.10.2007
|
Год изд.: | 1981 |
Описание: | Рассматриваются вопросы цифровой обработки речевых сигналов в системах предачи информации и управления ЭВМ голосом. Излагаются проблемы цифрового представления речевых сигналов: временная дискредитация, интерполяция, квантование, проектирование цифровых фильтров. Обсуждаются способы построения цифровых систем передачи, систем идентификации и верификации диктора. Предназначена для инженеров, специализирующихся в данной области, а также для студентов вузов соответствующих специальностей. |
Оглавление: |
Предисловие к русскому изданию [5] Предисловие [6] 1. Введение [9] 1.0. Цель книги [9] 1.1. Речевой сигнал [9] 1.2. Обработка сигналов [10] 1.3. Цифровая обработка сигналов [11] 1.4. Цифровая обработка речи [12] 1.4.1. Цифровая передача и хранение речевого сигнала [14] 1.4.2. Системы синтеза речи [15] 1.4.3. Системы верификации и идентификации диктора [15] 1.4.4. Системы распознавания речи [15] 1.4.5. Устранение дефектов речи [15] 1.4.6. Улучшение качества речевого сигнала [16] 1.5. Заключение [16] 2. Основы цифровой обработки сигналов [16] 2.0. Введение [16] 2.1. Сигналы и системы в дискретном времени [16] 2.2. Описание преобразовании сигналов и систем [19] 2.2.1. Прямое и обратное преобразованне [19] 2.2.2. Преобразование Фурье [21] 2.2.3. Дискретное преобразование Фурье [22] 2.3. Основы цифровой фильтрации [24] 2.3.1. Системы с конечными импульсными характеристиками [26] 2.3.2. Системы с бесконечными импульсными характеристиками [27] 2.4. Дискретизация [30] 2.4.1. Теорема дискретизации [30] 2.4.2. Прореживание и интерполяция дискретизированного сигнала [32] 2.5. Заключение [37] Задачи [37] 3. Цифровые модели речевых сигналов [41] 3.0. Введение [41] 3.1. Процесс образования речи [42] 3.1.1. Механизм речеобразования [42] 3.1.2. Акустическая фонетика [45] 3.2. Акустическая теория речеобразования [59] 3.2.1. Распространение звуков [59] 3.2.2. Однородная труба без потерь (пример) [63] 3.2.3. Потерн в голосовом тракте [66] 3.2.4. Излучение через губы [71] 3.2.5. Передаточная функция голосового тракта для гласных [74] 3.2.6. Влияние носовой полости [77] 3.2.7. Возбуждение звуков в голосовом тракте [78] 3.2.8. Модели сигнала, основанные на акустической теории [82] 3.3. Модели с трубами без потерь [83] 3.3.1. Распространение звуковых волн в соединении труб без потерь [83] 3.3.2. Граничные условия [86] 3.3.3. Связь с цифровыми фильтрами [88] 3.3.4. Передаточная функция модели с трубами без потерь [92] 3.4. Цифровые модели речевых сигналов [97] 3.4.1. Голосовой тракт [99] 3.4.2. Излучение [101] 3.4.3. Возбуждение [102] 3.4.4. Полная модель [104] 3.5. Заключение [105] Задачи [105] 4. Методы обработки речевых сигналов во временной области [110] 4.0. Введение [110] 4.1. Текущая обработка речевых сигналов [110] 4.2. Кратковременная энергия и кратковременное среднее значение сигнала [113] 4.3. Кратковременная функция среднего числа переходов через нуль [119] 4.4. Разделение речи н пауз на основе функций кратковременной энергии и среднего числа переходов через нуль [123] 4.5. Оценивание периода основного тона на основе параллельной обработки [128] 4.6. Кратковременная автокорреляционная функция [133] 4.7. Кратковременная функция среднего значения разности [141] 4.8. Оценивание периода основного тона по автокорреляционной функции [143] 4.9. Медианное сглаживание и обработка речи [150] 4.10. Заключение [154] Приложение. Сокращение объема вычислений при расчете автокорреляционной функции [154] Задачи [156] 5. Цифровое представление речевых сигналов [160] 5.0. Введение [160] 5.1. Дискретизация речевых сигналов [161] 5.2. Обзор статистических моделей речевых сигналов [162] 5.3. Квантование мгновенных значений [166] 5.3.1. Равномерное квантование [168] 5.3.2. Мгновенное компандирование [174] 5.3.3. Оптимальное квантование [178] 5.4. Адаптивное квантование [183] 5.4.1. Адаптация по входному сигналу [185] 5.4.2. Адаптация по выходному сигналу [190] 5.4.3. Общие замечания [194] 5.5. Общая теория разностного квантования [194] 5.6. Дельта-модуляция [202] 5.6.1. Линейная дельта-модуляция [202] 5.6.2. Адаптивная дельта-модуляция [206] 5.6.3. Предсказание высокого порядка в дельта-модуляции [211] 5.7. Разностная ИКМ [212] 5.7.1. АРИКМ с адаптивным квантованием [213] 5.7.2. АРИКМ с адаптивным предсказанием [215] 5.8. Сравнение систем [220] 5.9. Преобразования способов кодирования [222] 5.9.1. Преобразование Л ДМ в ИКМ [223] 5.9.2. Преобразование ИКМ—АРИКМ [225] 5.10. Заключение [226] Задачи [226] 6. Кратковременный анализ Фурье [231] 6.0. Введение [231] 6.1. Определения и свойства [232] 6.1.1. Интерпретация преобразования Фурье [233] 6.1.2. Интерпретация посредством линейной фильтрации [241] 6.1.3. Частоты дискретизации Xn(eiw) по времени и частоте [244] 6.1.4. Кратковременный синтез методом суммирования выходов гребенки фильтров [247] 6.1.5. Кратковременный синтез методом суммирования с наложением [255] 6.1.6. Влияние преобразований кратковременного спектра на синтез [258] 6.1.7. Аддитивное преобразование [261] 6.1.8. Обзор методов кратковременного анализа и синтеза речи [262] 6.2. Проектирование гребенок цифровых фильтров [263] 6.2.1. Соображения практического характера [263] 6.2.2. Проектирование гребенок с БИХ-фильтрами [271] 6.2.3. Проектирование гребенок с КИХ-фильтрами [273] 6.3. Реализация метода суммирования выходов гребенки фильтров с помощью БПФ [281] 6.3.1. Методы анализа [281] 6.3.2. Методы синтеза [285] 6.4. Спектрографическое отображение [289] 6.5. Выделение основного тона [294] 6.6. Анализ через синтез [297] 6.6.1. Спектральный анализ, синхронный с основным тоном [297] 6.6.2. Анализ полюсов и нулей модели с помощью анализа через синтез [300] 6.6.3. Оценивание глоттальных колебаний, синхронное с основным тоном [301] 6.7. Системы анализа-синтеза [302] 6.7.1. Цифровое кодирование кратковременного преобразования Фурье [303] 6.7.2. Фазовый вокодер [312] 6.7.3. Полосный вокодер [319] 6.8. Заключение [323] Задачи [323] 7. Гомоморфная обработка речи [329] 7.0. Введение [329] 7.1. Гомоморфные относительно свертки системы [329] 7.1.1. Свойства комплексного кепстра [333] 7.1.2. Вычислительные аспекты [337] 7.2. Комплексный кепстр речи [340] 7.3. Оценивание основного тона [344] 7.4. Оценивание формант [351] 7.5. Гомоморфный вокодер [358] 7.6. Заключение [363] Задачи [363] 8. Кодирование речевых сигналов на основе линейного предсказания [365] 8.0. Введение [365] 8.1. Методы анализа на основе линейного предсказания [366] 8.1.1. Автокорреляционный метод [370] 8.1.2. Коварционный метод [372] 8.1.3. Заключение [374] 8.2. Вычисление коэффициента усиления модели [374] 8.3. Решения уравнений линейного предсказания [377] 8.3.1. Решение на основе разложения Холецкого для ковариационного метода [377] 8.3.2. Алгоритм Дарбина для рекурсивного решения автокорреляционных уравнений [380] 8.3.3. Постановка задачи и ее решение на основе лестничного фильтра [382] 8.4. Сравнение методов решения уравнений линейного предсказания [386] 8.5. Погрешность предсказания [390] 8.5.1. Другие выражения для нормированного среднего квадрата погрешности предсказания [394] 8.5.2. Экспериментальное определение погрешности предсказания [395] 8.5.3. Зависимость нормированной погрешности предсказания от положения интервала анализа [399] 8.6. Анализ линейного предсказания в частотной области [401] 8.6.1. Спектральная трактовка среднего квадрата погрешности предсказания [402] 8.6.2. Сравнение кратковременного спектрального анализа с оценкой спектра на основе линейного предсказания [405] 8.6.3. Селективное линейное предсказание [406] 8.6.4. Сравнение методов линейного предсказания с методами анализа через синтез [407] 8.7. Применение анализа на основе линейного предсказания к моделям речевого тракта в виде труб без потерь [408] 8.8. Соотношения между различными параметрами речи [410] 8.8.1. Корин полинома передаточной функции предсказателя [410] 8.8.2. Кепстр [411] 8.8.3. Импульсная характеристика полюсной системы [411] 8.8.4. Автокорреляционная функция импульсной характеристики [411] 8.8.5. Коэффициенты автокорреляции полиномиальной передаточной функции предсказателя [412] 8.8.6. Коэффициенты частной корреляции [412] 8.8.7. Логарифм отношения площадей [413] 8.9. Синтез речевого сигнала по параметрам линейного предсказания [413] 8.10. Применение параметров линейного предсказания [416] 8.10.1. Оценивание основного тона на основе коэффициентов линейного предсказания [416] 8.10.2. Форматный анализ с использованием коэффициентов линейного предсказания [419] 8.10.3. Вокодер на основе линейного предсказания [420] 8.10.4. Полувокодер с линейным предсказанием [422] 8.11. Заключение [424] Задачи [424] 9. Цифровая обработка речи в системах речевого общения человека с машиной [429] 9.0. Введение [429] 9.1. Системы с речевым ответом [430] 9.1.1. Основные аспекты построения систем с речевым ответом [431] 9.1.2. Многоканальная цифровая система с речевым ответом [435] 9.1.3. Система синтеза речи на основе последовательного объединения слов, закодированных формантами [436] 9.1.4. Применение систем с речевым ответом [439] 9.2. Системы распознавания-дикторов [442] 9.2.1. Система верификации диктора [444] 9.2.2. Система идентификации диктора [450] 9.3. Системы распознавания речи [455] 9.3.1. Система распознавания изолированных цифр [456] 9.3.2. Система распознавания слитной последовательности цифр [459] 9.3.3. Меры различимости в пространстве параметров линейного предсказания [464] 9.3.4. Система распознавания с большим объемом словаря [466] 9.4. Комбинированная система речевого общения с машиной [468] 9.5. Заключение [469] Список литературы [472] Дополнительная литература [486] Предметный указатель [489] |
Формат: | djvu |
Размер: | 8534887 байт |
Язык: | РУС |
Рейтинг: | 143 |
Открыть: | Ссылка (RU) |