Анализ, синтез и восприятие речи

Автор(ы):Фланаган Дж. Л.
29.04.2015
Год изд.:1968
Описание: В монографии Дж. Фланагана, известного американского ученого, подробно рассматриваются широкий круг вопросов, связанных со свойствами речи как переносчика информации, основные ее параметры, проблемы анализа, синтеза и автоматического распознавания. Оцениваются характеристики каналов речевой связи. Большое внимание уделяется рассмотрению проблем синтетической телефонии; описываются различные вокодеры, полувокодеры и другие способы и методы сокращения полосы частот, занимаемой речью. Книга найдет многих читателей не только среди специалистов в области техники связи, но также среди математиков-кибернетиков, физиологов, лингвистов, филологов, акустиков и других специалистов, имеющих дело с техникой передачи, приема, хранения, исследования речевых сигналов и использования их для управления машинами.
Оглавление:
Анализ, синтез и восприятие речи — обложка книги. Обложка книги.
Предисловие к русскому изданию [5]
От автора [6]
От редактора русского перевода [8]
I. Речевая связь [11]
  1.1. Возникновение телефонии [12]
  1.2. Эффективная передача речи [14]
  1.3. Пропускная способность человека как канала передачи информации [17]
  1.4. Синтетическая телефония: подход к повышению эффективности [20]
II. Процесс речеобразования [21]
  2.1. Физиология органов речи [21]
  2.2. Звуки речи [27]
    2.2.1. Общие сведения [27]
    2.2.2. Гласные [29]
    2.2.3. Согласные [31]
  2.3. Количественное описание речи [36]
III. Акустические свойства речевого аппарата [36]
  3.1. Речевой тракт как акустическая система [37]
  3.2. Эквивалентная схема для цилиндрической трубы с потерями [39]
    3.2.1. Общие соотношения [39]
    3.2.2. Акустическое «L» [42]
    3.2.3. Акустическое «R» [42]
    3.2.4. Акустическое «С» [44]
    3.2.5. Акустическое «G» [45]
    3.2.6. Заключение по эквивалентным представлениям акустических величин [49]
  3.3. Нагрузочное сопротивление излучения через рот и ноздри [50]
  3.4. Распространение звука в пространстве вокруг головы [53]
  3.5. Голосовой источник [57]
    3.5.1. Возбуждение голосовыми связками [57]
    3.5.2. Импеданс голосовой щели [59]
    3.5.3. Эквивалентная схема голосового источника для переменного тока [66]
  3.6. Источник шумового и импульсного возбуждения тракта [70]
  3.7. Некоторые свойства передаточной функции речевого тракта [74]
    3.7.1. Определение передаточной функции [74]
    3.7.2. Влияние нагрузки излучения на распределение полюсов тракта [78]
    3.7.3. Влияние импеданса голосовой щели на распределение полюсов тракта [80]
    3.7.4. Влияние колебаний стенок полости [82]
    3.7.5. Аппроксимация голосового тракта двумя трубками [86]
    3.7.6. Возбуждение источником, смещенным вперед по продольной оси тракта [89]
    3.7.7. Влияние носового тракта [94]
    3.7.8. Четырехтрубное, трехпараметровое приближение к артикуляции гласных [97]
    3.7.9. Многотрубные модели и электрические аналоги речевого тракта [100]
  3.8. Применение основных свойств речи и слуха в синтетической телефонии [103]
IV. Ухо и слух [103]
  4.1. Устройство уха [103]
    4.1.1. Общая схема [103]
    4.1.2. Наружное ухо [105]
    4.1.3. Среднее ухо [105]
    4.1.4. Внутреннее ухо [109]
    4.1.5. Преобразование механических колебаний в нервное возбуждение [113]
    4.1.6. Проводящие пути в слуховой нервной системе [116]
  4.2. Математические модели уха [123]
    4.2.1. Постановка задачи [123]
    4.2.2. Модель базилярной мембраны [125]
    4.2.3. Передаточная функция среднего уха [127]
    4.2.4. Эквивалентная передаточная функция среднего уха и базилярной мембраны [130]
    4.2.5. Электрическая схема, модулирующая смещение базилярной мембраны [133]
    4.2.6. Моделирование движений мембраны на вычислительной машине [136]
    4.2.7. Моделирование улитки с помощью длинной линии [139]
  4.3. Иллюстрация соотношений между субъективным и физиологическим поведением [143]
    4.3.1. Основные предположения [143]
    4.3.2. Восприятие высоты звука [144]
    4.3.3. Бинауральная локализация [147]
    4.3.4. Пороговая чувствительность [154]
    4.3.5. Обработка сложных сигналов в слуховой системе [159]
V. Устройства для анализа речи [160]
  5.1. Спектральный анализ речи [161]
    5.1.1. Кратковременный частотный анализ [161]
    5.1.2. Измерение мгновенного спектра [164]
    5.1.3. Выбор весовой функции [167]
    5.1.4. Звуковой спектрограф [170]
    5.1.5. Кратковременная функция корреляции и мгновенный спектр мощности [176]
    5.1.6. Средний спектр мощности [182]
    5.1.7. Измерение среднего спектра мощности речи [183]
  5.2. Формантный анализ речи [186]
    5.2.1. О формантной структуре речи [186]
    5.2.2. Выделение формантных частот [188]
    5.2.3. Измерение ширины формантных полос [202]
  5.3. Анализ основного тона голоса [204]
  5.4. Артикуляторный анализ механизма речеобразования [207]
  5.5. Автоматическое распознавание речи [211]
  5.6. Автоматическое распознавание диктора [219]
VI. Синтез речи [222]
  6.1. Механические говорящие машины; исторический обзор [222]
  6.2. Электрические методы синтеза речи [227]
    6.2.1. Методы восстановления сигналов с заданным спектром [227]
    6.2.2. Синтезаторы-четырехполюсники [232]
    6.2.3. Аналоги речевого тракта, построенные на основе линии передачи [247]
    6.2.4. Возбуждение электрических синтезаторов [251]
    6.2.5. Факторы, связанные с излучением [266]
    6.2.6. Моделирование синтеза речи на вычислительных машинах [267]
VII. Восприятие речи и речеподобных звуков [275]
  7.1. Дифференциальное и абсолютное различения [276]
  7.2. Дифференциальная разрешающая способность по координатам речевого сигнала [278]
    7.2.1. О чувствительности слуха к изменению координат речевого сигнала [278]
    7.2.2. Пороговые значения для частот формантных максимумов [279]
    7.2.3. Пороговые значения для амплитуд формантных максимумов [279]
    7.2.4. Пороговая чувствительность к ширине формант [280]
    7.2.5. Пороговая чувствительность к частоте основного тона [280]
    7.2.6. Пороговые значения для интенсивности возбуждения [280]
    7.2.7. Порог чувствительности к нулям спектра импульсов основного тона [281]
    7.2.8. Различимость максимумов и минимумов спектра шума [281]
    7.2.9. Другие оценки, полученные методом непосредственного сравнения [283]
    7.2.10. Дифференциальная различимость в артикуляционной области [287]
  7.3. Абсолютное различение речи и речеподобных звуков [288]
    7.3.1. Абсолютное опознавание звуков [288]
    7.3.2. Абсолютное опознавание слогов [291]
    7.3.3. Влияние обучения и лингвистических ассоциаций на абсолютную опознаваемость речеподобных сигналов [298]
    7.3.4. Влияние лингвистических ассоциаций на дифференциальную различимость [302]
  7.4. Влияние контекста и словаря на восприятие речи [305]
  7.5. Единицы восприятия речи [308]
  7.6. Артикуляционный метод оценки качества телефонных трактов [311]
  7.7. Расчет разборчивости по характеристикам тракта и уровню шума. Индекс артикуляции [313]
  7.8. Дополнительные сенсорные каналы восприятия речи [316]
    7.8.1. Спектрограф «видимой речи» [316]
    7.8.2. Тактильный вокодер [317]
    7.8.3. Низкочастотный вокодер [317]
VIII. Системы синтетической телефонии [318]
  8.1. Полосные вокодеры [319]
    8.1.1. Изобретение Гомера Дадли [319]
    8.1.2. Уплотнение полосных вокодеров [324]
    8.1.3. Эксплуатационные качества вокодера [328]
  8.2. Полосные вокодеры с сокращенной избыточностью [329]
    8.2.1. Вокодер с селекцией максимумов [329]
    8.2.2. Линейное преобразование спектральных сигнал-параметров полосного вокодера [330]
    8.2.3. Вокодеры с эталонами спектральных функций [330]
  8.3. Полувокодеры [332]
    8.3.1. Проблема улучшения естественности [332]
    8.3.2. Уплотнение и дискретизация [335]
  8.4. Корреляционные вокодеры [337]
  8.5. Формантные вокодеры [340]
    8.5.1. Принцип формантного анализа и синтеза речи [340]
    8.5.2. Уплотнение и дискретизация формантных вокодеров [345]
    8.5.3. Формантные полувокодеры [348]
  8.6. Артикуляторные вокодеры [349]
  8.7. Другие методы сокращения полосы [350]
    8.7.1. Ограничение полосы и соотношение сигнал/шум [350]
    8.7.2. Амплитудное квантование и кодирование. Клиппированная речь [351]
    8.7.3. Частотное деление и умножение. Временное сжатие и расширение [355]
    8.7.4. Метод статистического использования пауз речи (ТАСИ) [358]
    8.7.5. Представление речи ортогональными функциями [363]
Литература [378]
Список литературы, добавленной редактором перевода [392]
Формат: djvu
Размер:5351581 байт
Язык:РУС
Рейтинг: 144 Рейтинг
Открыть: Ссылка (RU)