Анализ, синтез и восприятие речи
Автор(ы): | Фланаган Дж. Л.
29.04.2015
|
Год изд.: | 1968 |
Описание: | В монографии Дж. Фланагана, известного американского ученого, подробно рассматриваются широкий круг вопросов, связанных со свойствами речи как переносчика информации, основные ее параметры, проблемы анализа, синтеза и автоматического распознавания. Оцениваются характеристики каналов речевой связи. Большое внимание уделяется рассмотрению проблем синтетической телефонии; описываются различные вокодеры, полувокодеры и другие способы и методы сокращения полосы частот, занимаемой речью. Книга найдет многих читателей не только среди специалистов в области техники связи, но также среди математиков-кибернетиков, физиологов, лингвистов, филологов, акустиков и других специалистов, имеющих дело с техникой передачи, приема, хранения, исследования речевых сигналов и использования их для управления машинами. |
Оглавление: |
Обложка книги.
Предисловие к русскому изданию [5]От автора [6] От редактора русского перевода [8] I. Речевая связь [11] 1.1. Возникновение телефонии [12] 1.2. Эффективная передача речи [14] 1.3. Пропускная способность человека как канала передачи информации [17] 1.4. Синтетическая телефония: подход к повышению эффективности [20] II. Процесс речеобразования [21] 2.1. Физиология органов речи [21] 2.2. Звуки речи [27] 2.2.1. Общие сведения [27] 2.2.2. Гласные [29] 2.2.3. Согласные [31] 2.3. Количественное описание речи [36] III. Акустические свойства речевого аппарата [36] 3.1. Речевой тракт как акустическая система [37] 3.2. Эквивалентная схема для цилиндрической трубы с потерями [39] 3.2.1. Общие соотношения [39] 3.2.2. Акустическое «L» [42] 3.2.3. Акустическое «R» [42] 3.2.4. Акустическое «С» [44] 3.2.5. Акустическое «G» [45] 3.2.6. Заключение по эквивалентным представлениям акустических величин [49] 3.3. Нагрузочное сопротивление излучения через рот и ноздри [50] 3.4. Распространение звука в пространстве вокруг головы [53] 3.5. Голосовой источник [57] 3.5.1. Возбуждение голосовыми связками [57] 3.5.2. Импеданс голосовой щели [59] 3.5.3. Эквивалентная схема голосового источника для переменного тока [66] 3.6. Источник шумового и импульсного возбуждения тракта [70] 3.7. Некоторые свойства передаточной функции речевого тракта [74] 3.7.1. Определение передаточной функции [74] 3.7.2. Влияние нагрузки излучения на распределение полюсов тракта [78] 3.7.3. Влияние импеданса голосовой щели на распределение полюсов тракта [80] 3.7.4. Влияние колебаний стенок полости [82] 3.7.5. Аппроксимация голосового тракта двумя трубками [86] 3.7.6. Возбуждение источником, смещенным вперед по продольной оси тракта [89] 3.7.7. Влияние носового тракта [94] 3.7.8. Четырехтрубное, трехпараметровое приближение к артикуляции гласных [97] 3.7.9. Многотрубные модели и электрические аналоги речевого тракта [100] 3.8. Применение основных свойств речи и слуха в синтетической телефонии [103] IV. Ухо и слух [103] 4.1. Устройство уха [103] 4.1.1. Общая схема [103] 4.1.2. Наружное ухо [105] 4.1.3. Среднее ухо [105] 4.1.4. Внутреннее ухо [109] 4.1.5. Преобразование механических колебаний в нервное возбуждение [113] 4.1.6. Проводящие пути в слуховой нервной системе [116] 4.2. Математические модели уха [123] 4.2.1. Постановка задачи [123] 4.2.2. Модель базилярной мембраны [125] 4.2.3. Передаточная функция среднего уха [127] 4.2.4. Эквивалентная передаточная функция среднего уха и базилярной мембраны [130] 4.2.5. Электрическая схема, модулирующая смещение базилярной мембраны [133] 4.2.6. Моделирование движений мембраны на вычислительной машине [136] 4.2.7. Моделирование улитки с помощью длинной линии [139] 4.3. Иллюстрация соотношений между субъективным и физиологическим поведением [143] 4.3.1. Основные предположения [143] 4.3.2. Восприятие высоты звука [144] 4.3.3. Бинауральная локализация [147] 4.3.4. Пороговая чувствительность [154] 4.3.5. Обработка сложных сигналов в слуховой системе [159] V. Устройства для анализа речи [160] 5.1. Спектральный анализ речи [161] 5.1.1. Кратковременный частотный анализ [161] 5.1.2. Измерение мгновенного спектра [164] 5.1.3. Выбор весовой функции [167] 5.1.4. Звуковой спектрограф [170] 5.1.5. Кратковременная функция корреляции и мгновенный спектр мощности [176] 5.1.6. Средний спектр мощности [182] 5.1.7. Измерение среднего спектра мощности речи [183] 5.2. Формантный анализ речи [186] 5.2.1. О формантной структуре речи [186] 5.2.2. Выделение формантных частот [188] 5.2.3. Измерение ширины формантных полос [202] 5.3. Анализ основного тона голоса [204] 5.4. Артикуляторный анализ механизма речеобразования [207] 5.5. Автоматическое распознавание речи [211] 5.6. Автоматическое распознавание диктора [219] VI. Синтез речи [222] 6.1. Механические говорящие машины; исторический обзор [222] 6.2. Электрические методы синтеза речи [227] 6.2.1. Методы восстановления сигналов с заданным спектром [227] 6.2.2. Синтезаторы-четырехполюсники [232] 6.2.3. Аналоги речевого тракта, построенные на основе линии передачи [247] 6.2.4. Возбуждение электрических синтезаторов [251] 6.2.5. Факторы, связанные с излучением [266] 6.2.6. Моделирование синтеза речи на вычислительных машинах [267] VII. Восприятие речи и речеподобных звуков [275] 7.1. Дифференциальное и абсолютное различения [276] 7.2. Дифференциальная разрешающая способность по координатам речевого сигнала [278] 7.2.1. О чувствительности слуха к изменению координат речевого сигнала [278] 7.2.2. Пороговые значения для частот формантных максимумов [279] 7.2.3. Пороговые значения для амплитуд формантных максимумов [279] 7.2.4. Пороговая чувствительность к ширине формант [280] 7.2.5. Пороговая чувствительность к частоте основного тона [280] 7.2.6. Пороговые значения для интенсивности возбуждения [280] 7.2.7. Порог чувствительности к нулям спектра импульсов основного тона [281] 7.2.8. Различимость максимумов и минимумов спектра шума [281] 7.2.9. Другие оценки, полученные методом непосредственного сравнения [283] 7.2.10. Дифференциальная различимость в артикуляционной области [287] 7.3. Абсолютное различение речи и речеподобных звуков [288] 7.3.1. Абсолютное опознавание звуков [288] 7.3.2. Абсолютное опознавание слогов [291] 7.3.3. Влияние обучения и лингвистических ассоциаций на абсолютную опознаваемость речеподобных сигналов [298] 7.3.4. Влияние лингвистических ассоциаций на дифференциальную различимость [302] 7.4. Влияние контекста и словаря на восприятие речи [305] 7.5. Единицы восприятия речи [308] 7.6. Артикуляционный метод оценки качества телефонных трактов [311] 7.7. Расчет разборчивости по характеристикам тракта и уровню шума. Индекс артикуляции [313] 7.8. Дополнительные сенсорные каналы восприятия речи [316] 7.8.1. Спектрограф «видимой речи» [316] 7.8.2. Тактильный вокодер [317] 7.8.3. Низкочастотный вокодер [317] VIII. Системы синтетической телефонии [318] 8.1. Полосные вокодеры [319] 8.1.1. Изобретение Гомера Дадли [319] 8.1.2. Уплотнение полосных вокодеров [324] 8.1.3. Эксплуатационные качества вокодера [328] 8.2. Полосные вокодеры с сокращенной избыточностью [329] 8.2.1. Вокодер с селекцией максимумов [329] 8.2.2. Линейное преобразование спектральных сигнал-параметров полосного вокодера [330] 8.2.3. Вокодеры с эталонами спектральных функций [330] 8.3. Полувокодеры [332] 8.3.1. Проблема улучшения естественности [332] 8.3.2. Уплотнение и дискретизация [335] 8.4. Корреляционные вокодеры [337] 8.5. Формантные вокодеры [340] 8.5.1. Принцип формантного анализа и синтеза речи [340] 8.5.2. Уплотнение и дискретизация формантных вокодеров [345] 8.5.3. Формантные полувокодеры [348] 8.6. Артикуляторные вокодеры [349] 8.7. Другие методы сокращения полосы [350] 8.7.1. Ограничение полосы и соотношение сигнал/шум [350] 8.7.2. Амплитудное квантование и кодирование. Клиппированная речь [351] 8.7.3. Частотное деление и умножение. Временное сжатие и расширение [355] 8.7.4. Метод статистического использования пауз речи (ТАСИ) [358] 8.7.5. Представление речи ортогональными функциями [363] Литература [378] Список литературы, добавленной редактором перевода [392] |
Формат: | djvu |
Размер: | 5351581 байт |
Язык: | РУС |
Рейтинг: | 144 |
Открыть: | Ссылка (RU) |