Как возникла человеческая речь
Греки называют человека Zoon phonanta («говорящее животное»). Отличие человека от животного состоит в способности строить систему звуковых сигналов, представляющих не только его чувства и мысли о внешнем мире, но и сам этот внешний мир. Можно, конечно, возразить, что некоторые птицы способны «говорить», и подчас, например майны, даже довольно хорошо. Шимпанзе можно обучить ряду слов и простейших лингвистических конструкций. Но лишь человеку присуща способность создавать цельные языковые системы, а не просто копировать их отдельные части или воспроизводить словосочетания. Заговорив, животное назвало себя человеком.
Мы все имеем довольно смутное и совершенно неверное представление о примитивнейшем человеке, издававшем, подобно Тарзану, ворчание вперемешку с воплями под аккомпанемент гулких ударов по собственной груди. Однако человеческая речь почти наверняка возникла иначе. Она началась с монотонного бормотания, и, вероятно, в темноте! Темнота всегда вызывает страх, особенно в одиночестве, поэтому человек уже на самом раннем этапе своего развития научился поддерживать чувство общности, вселяющее спокойствие, убежденность, что он не один во мраке пещеры, когда солнце уже зашло, а луна не появилась. Речь, несомненно, появилась раньше, чем умение пользоваться огнем. До сих пор мы пользуемся ею не только для того, чтобы выразить какую-то мысль или чувства, но и просто для того, чтобы устанавливать и поддерживать контакт с другими людьми.
Антрополог Малиновский называл эту разновидность социальной речи фатической связью. Термин «фатический» восходит к греческому слову «phatos», что означает «произнесенный». Цель речевого процесса состоит, прежде всего, в общении. Этот процесс должен быть не столько значимым, сколько непрерывным. Самое неприятное в застольной беседе — это затянувшееся молчание: оно, как правило, указывает на утрату контакта между собеседниками. Нередко пауза прерывается сразу, несколькими голосами: «извините», «позвольте», «только после Вас», — причем смысл слов далеко не так важен, как сам факт того, что кто-то что-то сказал. Все вздыхают с облегчением, особенно хозяйка.
Нам не дано узнать, каким был язык, например, человека каменного века, но, кое-что о менее древнем языке, называемом индоевропейским или арийским, нам известно, поскольку его структура и частично лексика в существенно видоизмененной форме сохранились в дочерних языках, т. е. в большинстве европейских. Судя по всему, это был сложный язык с богатой грамматикой, совсем непохожий на малайский или китайский, и, углубляясь в процессе изучения языков все дальше в историю, мы, как представляется, обнаруживаем все большую степень сложности.
Упрощение языка является, по существу, частью его модернизации. Современный английский язык в грамматическом отношении значительно проще своего предка — англосаксонского, а итальянский и испанский языки проще своего общего материнского языка — латинского. Ошибочно полагать, что ваши далекие предки «по кирпичикам» возводили все более сложную языковую структуру. Примитивное бормотание ассоциировалось с определенным чувством или мыслью, но лишь гораздо позднее, по-видимому после распада Римской империи, специалисты, которых мы теперь называем языковедами, начали анализировать составные элементы этого бормотания и ввели такие термины, как «существительное», «глагол», «прилагательное» и «наречие».
Один из самых авторитетных специалистов по теории лингвистики послевоенного периода, Н. Хомский, выдвинул предположение о том, что мозг человека снабжен специальным аппаратом, позволяющим ему освоить любой язык. Все мы без какого-либо осознанного усилия произносим те или иные слова впервые, выдумываем новые; мы обладаем, по-видимому, безграничной способностью порождения новых высказываний. Это — величайший дар человека, в основе которого лежит очень простая особенность его мозга — мыслить противопоставлениями.
Судите сами; цветовой спектр состоит из бесконечного множества оттенков, постепенно переходящих из одного в другой. Человек научился расчленять его на отдельные цвета. Больше того, он сумел использовать их в качестве сигналов противоположного значения. Вспомните огни светофора. Точно так же из речевого потока, на который способны вокальные органы человека, можно выделить отдельные звуки и противопоставить их друг другу. «Док » — это не то же самое, что «дог», поскольку «к» противопоставлен «г», хотя и отличаются они только по глухости и звонкости. Свойственная человеческому мозгу способность к построению структур позволяет нам говорить о фонемах (звуках речи) и морфемах (комбинациях фонем, передающих определенное значение) — мельчайших структурных компонентах, которые противоположны друг другу в различных функциях и, взятые воедино, образуют язык.
Больше всего нас интересует, почему каждое слово означает именно то, что оно означает. Когда первобытный человек хотел показать высокий предмет, он, вероятно, инстинктивно поднимал руку, и соответственно опуская ее, желая указать на что-то низкое. Другими словами, он пользовался способностью подражать, копировать. У нас нет доказательств того, что речь как физический процесс (ведь чтобы произнести звук, мы делаем определенное мышечное усилие) была попыткой имитировать предмет, действие или чувство, о которых шла речь. «Луна», «мун», «булан» — фонетическое оформление этих слов подразумевает нечто круглое и высокое (губы, округляются, кончик языка почти касается неба, которое в малайской языке называется langit что, значит «небосвод»), однако подобных слов-имитаций очень мало. Слово «собака» по звучанию абсолютно не напоминает собаку, а в слове «кошка» не обуславливается никакой ассоциаций с животным. Выражаясь научным стилем, языку не свойственен иконический символизм. Слова рождаются совершенно произвольно. Если вдруг будет решено переименовать кошку в собаку, возможно, нам потребуется некоторое время, чтобы привыкнуть к этой идее, но в ней не будет ничего противоестественного, противоречащего законам логики…
Не располагая никакими доказательствами, я представляю себе первобытного человека, который, глядя на луну, произносит нечто вроде гараваполаджия. Он не имеет в виду луну, а хочет сказать: «Вот я стою и смотрю на круглый предмет в небе, который все выше поднимается над горизонтом». Утром, наблюдая восход солнца, он мог бы произнести нечто вроде гарасополаджия. Пройдет, много времени, прежде чем человек соотнесет слово вапо с луной, а соло с солнцем и поймет, что в обоих случаях выражает небесное тело, способное, очевидно, всходить и заходить. Другими словами, аналитический подход к своей собственной речи, который мы воспринимаем как нечто само собой разумеющееся — без него мы не могли бы изучать иностранные языки — формировался, вероятно, на протяжении тысячелетий.
А что касается способности человека записывать свою речь в виде идеограмм или букв, то она появилась гораздо позднее. Буквенный алфавит – например, латинский, греческий, арабский — существует настолько недавно, что не успел даже распространиться на Китай и Японию.
Следует признать, что нам почти ничего не известно о происхождении человеческого языка, но мы понимаем, это был эволюционный скачок, приведший к появлению нового биологического вида — человека. Впервые появившись, язык представлял собой уже вполне сформировавшуюся систему. Он не проходил через этап постепенного усложнения. Формирование языкового образа внешнего мира (к которому относимся и мы сами) стало ключом к созданию мира внутреннего — науки и техники. Язык — это ценнейшее достояние. Нам стоит поразмыслить над его загадками, любить и лелеять это чудо. Правда, мы никогда, не сможем понять его до конца. Китайский, хинди, английский — да. Но сам язык — нет.
Автор: Энтони Берджес.
Схожі записи:
Современная человеческая речь как несовершенный инструмент передачи информации / Хабр
За долгие годы своего существования человеческая речь претерпела множество изменений. Она всё больше обрастала функциональными инструментами, которые помогают ускорить процесс передачи информации и в то же время увеличить объём передаваемой информации. Наша цивилизация в этом, безусловно, преуспела. Мы сокращаем слова, упрощаем предложения и изобретаем «специальные» слова. Кажется, в наш информационный век человеческая речь достигла определённого пика развития.Но, по-моему, мы не туда свернули и зашли в тупик.
Предлагаю начать с азов, чтобы мы с вами лучше друг друга понимали.
Что есть слово?
Слово — это материализованная мысль.
В разговоре, для того, чтобы донести до собеседника некую информацию, мы используем слова. Каждый из нас уверен, что в полной мере понимает, какое слово нужно использовать в тот или иной момент и как его воспримет слушатель. Если всё так просто, если мы знаем, как говорить и как слушать, то почему тогда то, что я могу представить мгновенно в уме, мне приходиться объяснять часами?
Почему речь так несовершенна? Почему я не могу передать — пусть даже не с такой скоростью тот образ, что я представляю в своей голове? Ведь именно он, вернее желание показать/передать его, является причиной возникновения речи. Как же возможно, что для передачи столь объёмного и многомерного образа человек только и додумался, что изобрести столь несовершенный инструмент — речь?
Ответы на все эти вопросы не однозначны, но я могу сказать с уверенностью, мы что то упустили. Человек не мог создать такой несовершенный инструмент для передачи чрезвычайно объёмного и многомерного мышления.
Что ж, попробую восстановить изначальную модель речи.
Какова структура слова как единицы информации?
- Звуковая составляющая;
- Смысловая составляющая;
- Эмоциональная составляющая.
Далее мы определяем смысл произнесённого слова, ту информацию, которую оно несёт. Это очень важный этап передачи информации. Каждый из нас должен чётко понимать, что смысл произносимого слова может разниться у человека который произносит слово, и который его принимает. Отсюда выходит первая проблема системы речи. Для того, чтобы донести до человека тот образ, который необходимо в точности, приходиться использовать груду дополняющих слов, это очень замедляет процесс передачи информации и очень его нагружает.
И, наконец, в каждом слове живёт эмоция. В нашем языке есть много слов, при помощи которых можно описать «настроение», такие слова я называю «атмосферными». Например, чтобы описать что-то мерзкое, я могу использовать такие слова как:
- Слизь
- Гной
- Желчь и т.д.
Описав три «уровня» слова как единицы информации мы можем прийти к удивительному выводу. Со звуковой составляющей слова вроде всё понятно, а вот с другими двумя этапами, которые как раз и рождают образ в нашем уме, дела обстоят хуже. С течением времени мы растеряли точность и чёткость, которая крайне необходима для формирования правильного и, что очень важно, одинакового образа у собеседников. Когда вы произносите определённые слова, закладывая в них смысл и эмоции, для формирования определённого образа, вы можете столкнуться с тем, что попросту у «принимающего» те слова, которые вы произносите, могут ассоциироваться совсем с другим смыслом и другими эмоциями. В итоге информация не передана или передана в искажённой форме, а всё, что не есть истина, есть ложь!
Наша цивилизация должна особо обратить внимание на эту проблему. У нас есть одна очень неприятная мне черта, мы всё уродуем материализацией, часто забывая о энергии, а ведь она всегда и во всём первична, и именно энергия является причиной всего. В случае с языком мы затёрли информационностью его энергетическую (образную, эмоциональную) часть, от этого он стал тупым и бездушным, как компьютер.
Нет! Это под силу только энергии.
Статья является вводной, она отражает лишь одну грань проблемы, проблема намного шире. Знания, которые я попытался передать, нужны лишь для того, что бы всколыхнуть мыслительные процессы в ваших головах. Получилось у меня это или нет, прочту в комментариях.
Особую благодарность в написании этой статьи хочу выразить Моисеевой Марине. Я бесконечно благодарен тебе за то, что ты вносишь в мою жизнь столько творчества, столько эмоций, столько нежности. Я люблю тебя, дорогая.
Речевая система человека | Произношение
Слова, которые мы произносим, путешествуют по воздуха , переносимые вибрациями воздуха. Для создания этих воздушных вибраций у нас есть удивительная система речи, которая представляет собой гораздо больше, чем просто рот.
- Воздушный поток (легкие, голосовой аппарат, голосовой тракт)
- Звуки речи (гласные, согласные)
- Произношение (Слоги, Слова)
- Резюме
Конечно, мы используем воздух, чтобы дышать и жить. Но мы также используем воздух до говорят , а произносят слова, и это то, что эта страница объясняет в очень простых терминах.
Воздушный поток
По каждому слову, которое мы произносим, мы можем отслеживать движение воздуха. Он входит через наш рот/нос; он спускается по дыхательному горлу в легкие. А затем, чтобы произнести слово, оно возвращается через наше дыхательное горло и ВЫХОДИТ через наш рот, а иногда и через нос.
Когда воздух выходит из наших (1) легких , через наш (2) голосовой аппарат , и через наш (3) голосовой тракт — ЭТО происходит, когда мы вибрируем воздух и меняем «форму» этих вибраций для создания различных звуков, слогов и слов.
1 Легкие
легкие представляют собой два эластичных мешочка в груди, которые втягивают воздух (главным образом для насыщения крови кислородом). Чтобы начать речь, они проталкивают воздух обратно через дыхательное горло к гортани.
2 голосовых ящика
Когда воздух поднимается из легких через гортань в шее, он может вибрировать или не вибрировать (так называемые звонкие и глухие звуки).
3 Голосовой тракт
Для управления и формирования воздушного потока над голосовым аппаратом воздух проходит через голосовой тракт и выходит из него , который состоит из:
- рот (ротовая полость) — язык, зубы, губы
- нос (носовая полость)
С помощью речевого тракта мы резонируем воздух и издаем два основных типа речевых звуков:
- гласных
- согласных
Звуки речи
Когда мы говорим по-английски, мы используем около 44 различных звуков . Когда мы пишем на английском языке, мы используем 26 букв (алфавит от A до Z). Вы замечаете, что звуков больше, чем букв, поэтому букв недостаточно, чтобы обозначить все звуки. Важно понимать, что когда мы говорим о речи и произношении, мы говорим о звуках фонематической таблицы, а НЕ о буквах алфавита.
1 Гласные
гласный — это звук речи, который мы произносим, НЕ блокируя воздух, выходящий через рот.
пример гласных звуков :
/ ɪ / i: / ʊ / u: / e / ɜ: / ə / ɔ: /
2 согласных
согласный — это звук речи, который мы произносим, блокируя воздух, выходящий через рот или нос. Мы блокируем воздух, соприкасаясь двумя или более губами, языком, зубами, верхней частью рта и задней стенкой горла.
пример согласных звуков :
/ п / ф / θ / т / с / ʃ / ʧ / к /
Произношение
слогов
слог — это бессмысленная единица произношения, содержащая один гласный звук с окружающими согласными звуками или без них, например:
звуки | ||||
согласная | гласная | согласная | примеров | |
с у л л а б л е с | В | / аɪ / | ||
В | С | / ɒк / | ||
С | В | /тə/ | ||
С | В | С | /pəs/ |
Слова
Слово — это значимая единица речи, состоящая из одного или нескольких слогов. Например, I — это односложное слово, а octopus — трехсложное слово, как вы видите в примерах ниже:
количество слогов | ||
---|---|---|
я | я | 1 |
зеленый | зеленый | 1 |
вполне | вполне | 1 |
тихий | бесшумный | 2 |
оранжевый | или-анге | 2 |
стол | стол | 2 |
осьминог | ос-к-гною | 3 |
интересное | интерес | 4 |
нереально | нереальный | 4 |
обычный | не-экз-сеп-тионал | 5 |
Одно или несколько слов могут составлять предложение.
Резюме
- Легкие выталкивают воздух для речи .
- В голосовом ящике проходящий воздух может быть звонким или глухим .
- В голосовом тракте незаблокированный воздух составляет гласных и забитый воздух составляет согласных .
- Гласные и согласные составляют слогов .
- слогов составляют слов .
- слов составляют предложение .
вибрировать (глагол): быстро и непрерывно двигаться вперед и назад
вибрация (существительное): пример вибрации0002 дыхательное горло (существительное): воздушный проход от горла к легким; трахея
насыщать кислородом (глагол): заряжать или обогащать кислородом
кислород (существительное): бесцветный газ в воздухе, необходимый для жизни
инициировать (глагол): запускать процесс
бессмысленный (прилагательное): не имеющий значения или значения
осмысленный (прилагательное): имеющий значение или значение
Рекомендуемые ссылки
- Одиночные согласные звуки (видео)
- Звонкие и глухие согласные
- Согласные звуки и буквы
Факты о разборчивости речи: диапазон частот человеческого голоса
Произносимые и спетые слова должны быть разборчивы. К сожалению, технически сложно сохранить разборчивость при записи или усилении голоса. В этой статье мы представляем некоторые факты о разборчивости речи и, самое главное, о том, как ее сохранить.
Загрузите файл для печати здесь Узнайте больше о влиянии различных размещений микрофонов на голос здесь.
Резюме
Язык происходит от произнесенного слова. Поэтому при записи голоса всегда следует учитывать разборчивость речи.Воздух проходит через голосовые связки и создает звук. Управляя голосовыми связками, можно изменять уровень и высоту голоса. Воздействуя на впадины над голосовыми связками (глоточную, ротовую, носовую), к голосовому спектру добавляется фильтрация.
Изменение вокального усилия изменяет как уровень, так и частотный спектр звука голоса. Даже высота голоса меняется при вокальном усилии. Крик звучит иначе, чем разговор обычным голосом.
При записи вы обнаружите, что пики акустического сигнала намного выше среднеквадратичного или среднего уровня. Убедитесь, что все пики сохраняются в цепочке записи.
В нетональных языках важны согласные. Согласные (к, р, с, т и др.) преимущественно встречаются в частотном диапазоне выше 500 Гц. Точнее, в диапазоне частот 2 кГц-4 кГц.
Мы воспринимаем голос как естественный и максимально разборчивый, когда находимся примерно в 1 метре от говорящего. Стоя сбоку или сзади человека, снижается естественность и разборчивость.
На самом деле, спектр шансов голоса практически в любом другом положении, кроме как когда мы приближаемся к говорящему человеку с нашим ухом или микрофоном.
Каждая позиция на голове или груди имеет свой звуковой окрас – или тембр. Например, в спектре речи, записанной на груди человека, обычно отсутствуют частоты в важном диапазоне 2-4 кГц. Это приводит к снижению разборчивости речи. Если микрофон этого не компенсирует, следует внести поправки эквалайзером.
Поэтому при размещении микрофона помните об этих проблемах. Будьте готовы выбрать правильный микрофон, предназначенный для использования в том месте, где вы его размещаете. В противном случае будьте готовы к компенсации (выравниванию) для получения правильного звука.
Вы можете быстро начать работу, посмотрев серию коротких видеороликов, в которых представлены и объяснены некоторые важные факторы, влияющие на разборчивость голоса. Когда вы будете готовы к более глубокому погружению в теорию, вам следует ознакомиться с полной статьей под плейлистом.
1. Голос как источник акустического звука
Голос как источник звука важно понимать. В то время как язык может быть чем-то общим для групп людей, звук и характер голоса индивидуальны для каждого человека. В то же время речь, рассматриваемая как акустический сигнал, является наиболее знакомым нам типом звука.Уровень звука
Вокальные усилия различаются; от приглушенного шепота до громкого крика. Трудно присвоить фиксированное число уровню речи, так как это индивидуально для каждого человека. Значения в приведенной ниже таблице указывают средний взвешенный по шкале А уровень речи взрослого человека.Стоит отметить, что способность понимать речь оптимальна, когда уровень речи соответствует уровню нормальной речи на расстоянии 1 метра. Другими словами, уровень звукового давления примерно 55-65 дБ относительно 20 мкПа. (В данном случае «ре» означает «относительно»; эталоном является самый слабый уровень звукового давления, который можно услышать.)
Уровень речи
Расстояние прослушивания [м] | Обычный | Поднято | Громко | Крик |
---|---|---|---|---|
0,25 | 70 | 76 | 82 | 88 |
0,5 | 65 | 71 | 77 | 83 |
1,0 | 58 | 64 | 70 | 76 |
1,5 | 55 | 61 | 67 | 73 |
2,0 | 52 | 58 | 64 | 70 |
3,0 | 50 | 56 | 62 | 68 |
5,0 | 45 | 51 | 57 | 63 |
Крест-фактор
Обратите внимание, что каждый уровень, представленный в таблице, представляет собой среднеквадратичное значение, а не пиковый уровень. Обычно пики на 20-23 дБ выше среднеквадратичного уровня. Отношение между пиковым уровнем и среднеквадратичным уровнем называется коэффициентом амплитуды. Этот фактор является важным параметром при записи или воспроизведении голоса в электроакустической системе.
Также обратите внимание: Громкое пение, измеренное на губах, может достигать уровня 130 дБ относительно 20 мкПа RMS и пиковых уровней выше 150 дБ относительно 20 мкПа.
Мужской голос, обычный разговор (продолжительность 18 секунд). Среднеквадратичное значение: -21,5 дБ полной шкалы, пиковое значение: -0,5 дБ полной шкалы. Крест-фактор 11 (21 дБ). Пунктирная красная линия указывает уровень RMS.
Спектр речи
Спектр речи охватывает довольно широкую часть полного спектра слышимых частот. В нетональных языках можно сказать, что речь состоит из гласных и согласных звуков. Гласные звуки генерируются голосовыми связками и фильтруются голосовыми полостями. Шепот без звонких звуков.
Однако полости, которые способствуют образованию различных гласных, все же влияют на проходящий поток воздуха. Вот почему характеристики гласных также проявляются в шепоте. В целом основная частота сложного речевого тона, также известная как высота тона или f0, у мужчин находится в диапазоне 100-120 Гц, но могут встречаться и отклонения за пределами этого диапазона. F0 для женщин находится примерно на одну октаву выше. Для детей f0 составляет около 300 Гц.
Согласные образуются в результате закупорки воздуха и шумовых звуков, образующихся при прохождении воздуха через горло и рот, особенно через язык и губы. По частоте согласные лежат выше 500 Гц.
При нормальной интенсивности голоса энергия гласных обычно быстро уменьшается выше примерно 1 кГц. Обратите внимание, однако, что акцент на спектре речи смещается на одну-две октавы в сторону более высоких частот, когда голос повышается. Также обратите внимание, что невозможно увеличить громкость согласных до такой же степени, как гласных. На практике это означает, что разборчивость речи не повышается при крике по сравнению с приложением обычных голосовых усилий в ситуациях, когда фоновый шум незначителен.
Спектры голоса (1/3 октавы) в зависимости от усилий.
Formants
Если вы послушаете двух людей, которые говорят или поют одну и ту же гласную на одной высоте (f0), гласные предположительно распознаются как идентичные в обоих случаях. Однако любые два голоса не обязательно воспроизводят один и тот же спектр. Форманты обеспечивают воспринимаемые гласные звуки. Кроме того, форманты предоставляют информацию, отличающуюся от говорящего к говорящему. Форманты объясняются акустической фильтрацией спектра, генерируемого голосовыми связками. Гласные создаются «настройкой» резонансов полостей голосового тракта.
2. Что влияет на разборчивость?
В тоновых языках, таких как китайский и тайский, говорящие используют лексический тон или основную частоту для обозначения значения.В нетональных языках, таких как английский, испанский, японский и т. д., слова различаются по изменению гласного, согласного или того и другого. Однако из этих двух согласные являются наиболее важными.
Важные частоты
Важные частоты в нетональных (западных) языках показаны на диаграмме ниже. Здесь полоса частот около 2 кГц является наиболее важным частотным диапазоном с точки зрения воспринимаемой разборчивости. Большинство согласных находятся в этой полосе частот.
(Ссылка: Н. Р. Френч и Дж. К. Стейнберг: Факторы, определяющие разборчивость звуков речи. JASA, том 19, № 1, 1947 г.).
Речевой спектр подвергается фильтрации верхних или нижних частот. Использование фильтра HP на частоте 20 Гц (вверху слева) делает речь разборчивой на 100%. (Это потому, что присутствует полный речевой спектр). HP-фильтр, отсекающий все ниже 500 Гц, все же оставляет речевой сигнал разборчивым. Несмотря на то, что большая часть речевой энергии отсекается, разборчивость снижается только на 5%. Однако применение более высокого порога приводит к падению разборчивости.
И наоборот, применение LP-фильтра приводит к очень быстрому падению разборчивости. При резке на 1 кГц разборчивость уже меньше 40%. Видно, что частотный диапазон от 1 кГц до 4 кГц имеет большое значение для разборчивости.
Фоновый шум
Фоновый шум влияет на воспринимаемую разборчивость речевого сигнала. В этом случае шумом можно считать все сигналы, кроме самой речи. Таким образом, в аудитории или классе кондиционеры и другие шумные установки могут сделать речь менее разборчивой. Кроме того, присутствие других людей создает шум. В телевизионном или кинозвуке очень часто возникает вопрос соотношения между уровнем диалога и уровнем фоновой музыки/звуков атмосферы.
На этой диаграмме разборчивость речи представлена в зависимости от отношения сигнал/шум (S/N). Нижняя кривая показывает, что речь все еще может быть до некоторой степени разборчивой, даже если отношение сигнал/шум отрицательно, то есть шум на 10 дБ громче, чем уровень речи. Но в любом случае оптимальным является воспринимаемый уровень речи около 60 дБ относительно 20 мкПа.
В этой области было проведено множество исследований. В целом результаты показывают, что:
- Оптимальный уровень речи постоянен, когда уровень фонового шума ниже 40 дБ(А)
- Оптимальный уровень речи — это уровень, при котором поддерживается отношение сигнал/шум около 15 дБ(А) при уровне фонового шума более 40 дБ(А)
- Трудность прослушивания возрастает по мере увеличения уровня речи при условии, что отношение сигнал/шум достаточно хорошее, чтобы поддерживать разборчивость близкой к идеальной
Реверберация
Реверберация считается шумом, когда речь идет о разборчивости речи. Небольшая реверберация может поддержать речь, но как только согласные размазываются, разборчивость падает.
3. Звуковое поле
На звуковое поле вокруг говорящего человека влияет не только физика голосового тракта, но также голова и тело человека.Направленность
Ниже приведены полярные графики говорящих людей как в вертикальной, так и в горизонтальной плоскостях.
Человек-говорун с полярными узорами. (Ссылка: Chu, W.T.; Warnock, A.A.C.: Подробная направленность звуковых полей вокруг людей, говорящих.)
Нанесенный на график уровень является взвешенным по шкале A, и на каждой диаграмме нанесены как мужчины, так и женщины. Все говорящие сели. Уровни измерялись на высоте 1 метр. Видно, что разница между фронтом и тылом составляет примерно 7 дБ. Однако это не дает никакой информации о частотной зависимости: высокие частоты затухают больше на обратной стороне, чем низкие частоты.
Обратите внимание, что в вертикальной плоскости уровень выше в направлении 330° по сравнению с другими направлениями. Это происходит главным образом потому, что звук отражается от грудной клетки.
На этой диаграмме показаны частотно-зависимые полярные диаграммы от 160 Гц до 8 кГц.
Видно, что направленность увеличивается приблизительно от 1 кГц и выше. В сочетании с важностью частот выше 1 кГц становится очевидным, что более высокая разборчивость достигается при записи перед человеком, а не позади него.
Говорящий человек, полярные графики с интервалом в 1/3 октавы. Раздел 5 дБ (ссылка: Chu, W.T.; Warnock, A.A.C.: Подробная направленность звуковых полей вокруг говорящих людей.)
Расстояние и направление
Поскольку не все микрофоны расположены на расстоянии 1 метра от говорящего , интересно узнать, что происходит, когда мы приближаемся к источнику звука.
На следующих диаграммах показано отклонение от спектра речи, записанного на расстоянии 1 метра в заданном направлении. Углы (+45 градусов, 0 градусов и -45 градусов) находятся в вертикальной плоскости. Эти результаты являются средними для 10 говорящих.
Линии на каждой из трех диаграмм показывают отклонения на 80 см, 40 см, 20 см и 10 см соответственно.
Если бы спектр не менялся при изменении направления и расстояния, все кривые были бы прямыми линиями, но отклонение увеличивается по мере приближения к говорящему.
На верхнем рисунке показаны положения измерения под углом 45° вверх от оси. Отклонение отсюда тонкое. Вот почему гулкий над головой обеспечивает стабильный речевой спектр, не так зависящий от расстояния.
Нижняя диаграмма показывает, что происходит, когда мы улавливаем голос ниже осевой плоскости. Влияние звука, отраженного от тела, существенно.
Отклонения по оси находятся где-то между двумя другими, что означает, что спектр речи изменяется с расстоянием до микрофона.
(Ссылка: Бриксен, Эдди Б.: Регистрация человеческого голоса в ближнем поле: спектральные изменения в зависимости от положения. Конвенция AES 104, Амстердам, Нидерланды. Препринт 4728)
Голова и грудь
В приложениях для вещания и живого звука предпочтительным микрофоном часто является петличный микрофон (нагрудный) или головной микрофон (на голове), что дает пользователю больше свободы движений. Следует учитывать тот факт, что размещение микрофона на таком коротком расстоянии приводит к тому, что записанный спектр отличается от естественного и нейтрального спектра, воспринимаемого на обычном расстоянии прослушивания. Эта разница далеко не пренебрежимо мала.
Ниже приведены пять кривых, которые объясняют, что происходит со спектром речи при размещении микрофонов на теле или голове. Все кривые основаны на измерениях и в среднем для 10 человек (см. ссылку).
Верхняя кривая (грудь) показывает, насколько спектр речи, улавливаемый грудью, отличается от спектра речи того же человека, улавливаемого на расстоянии 1 метр по оси. При размещении микрофона на груди происходит существенное снижение частот в критическом диапазоне 2-4 кГц.
Вторая кривая (шея) показывает отклонение, если микрофон находится еще ближе, чуть ниже подбородка. Эта позиция в значительной степени применима к радиовещанию, потому что это единственный практичный способ разместить петличный микрофон, если журналист или интервьюируемый носит футболку, толстовку и т.п. или пальто. Для использования на улице микрофон можно одеть в мех или спрятать за шарф. При любых обстоятельствах: наблюдается массивное снижение согласных частот.
Кривая лба показывает, что размещение микрофона на лбу является наименее мешающим положением для спектра. Эта позиция идеальна для сцены и кино, но не для новостей.
Кривая уха показывает постепенный спад высоких частот в этом месте. Удобно расположить микрофон у уха; однако для сохранения разборчивости речи требуется компенсация.
При размещении микрофона на щеке (гарнитура) диапазон 2–4 кГц лучше, чем в большинстве других положений. Однако потребность в подъёме на самых высоких частотах всё же есть. Гарнитуры DPA имеют встроенный подъемник.
Следует отметить, что уровень речи в «уголке улыбки» (у щеки) примерно на 10 дБ выше по сравнению с положением на груди.
Из кривых видно, что существует общая тенденция к повышению около 800 Гц, которую можно считать компенсированной. Однако наиболее значительным отклонением является затухание, вызывающее снижение разборчивости речи. Об этом всегда нужно заботиться!
(Ссылка: Бриксен, Эдди Б.: Спектральная деградация речи, улавливаемой миниатюрными микрофонами, установленными на головах и груди людей. Конвенция AES № 100, Копенгаген, Дания. Препринт 4284.)
4. Размещение микрофона
Исходя из этих условий, можно составить набор правил для выбора и размещения микрофона, когда важна разборчивость речи.Ручные вокальные микрофоны
- Ручные вокальные микрофоны должны располагаться перед ртом под углом ±30°
- При использовании направленного микрофона (кардиоидного типа или дробовика) адресация к нему должна быть направлена по оси (а не как к рожку мороженого)
- Слишком плотные ветровые стекла могут снижать высокие частоты. Не забудьте компенсировать это
Спектр речи при типичном положении на груди имеет недостаток частот в основном диапазоне 3-4 кГц. Если микрофон с плоской частотной характеристикой расположить на груди человека, диапазон 3-4 кГц следует усилить примерно на 5-10 дБ, чтобы компенсировать потери.
- На практике есть два решения: использовать микрофон с предварительной коррекцией для компенсации или не забыть сделать правильную коррекцию в процессе монтажа. Обратите внимание, что никакие микшеры или камеры ENG не компенсируют это автоматически, и для этого не предусмотрено никаких средств управления. Во многих случаях это никогда не компенсируется. Следовательно, разборчивость часто низкая
Микрофон гарнитуры
- Уровень микрофона гарнитуры примерно на 10 дБ выше, когда он сидит на щеке, по сравнению с положением на груди
- На спектр влияет меньше, чем на грудь.