Зачем мы говорим - Тревор Кокс
Шрифт:
Интервал:
Если у нас возникают проблемы с незнакомыми голосами, как обстоит дело с распознаванием знакомого голоса? Когда мои сыновья выросли, наши родственники в телефонном разговоре стали путать их изменившиеся за период полового созревания голоса с моим. Когда мои сыновья были маленькими, звонившие могли опираться на высоту тона, чтобы отличить мой голос – голос единственного взрослого мужчины в доме. Теперь родственникам приходилось вырабатывать новые стратегии, чтобы нас различать, – и даже сейчас у них это не очень хорошо получается [32]. Чтобы определить по голосу знакомого человека, обычно ему нужно произнести всего несколько слов. В романе Тома Вулфа «Костры амбиций» один из персонажей, Шерман Маккой, случайно набирает свой домашний номер и дозванивается до жены Джуди, а не до любовницы Марии.
Три гудка, и женский голос говорит:
– Алло.
Но это не голос Марии…
– Будьте добры, можно поговорить с Марией?
Женский голос спрашивает:
– Шерман, это ты?
Господи! Это Джуди! Он набрал номер собственной квартиры! Он ошеломлен – парализован!
– Шерман?
Он вешает трубку [33].
Способность узнавать знакомый голос мы приобретаем на самых ранних этапах развития. Скорость биения сердца плода возрастает в ответ на голос матери, но замедляется, когда он слышит голос незнакомого человека [34]. Через четыре месяца после рождения мозговая активность младенца показывает, что голос матери обрабатывается быстрее, чем голос незнакомой женщины или даже отца, голос которого еще плохо определяется на этом этапе. В знакомом голосе мы запоминаем несколько особенностей, уникальных для конкретного человека. Следовательно, нейронная обработка в этом случае является более сложной, чем для незнакомых голосов, где используются образцы голоса. Когда дело касается близких людей, нам нужно идентифицировать окружающих с большей точностью. Мы не знаем, какие части речи распознает новорожденный, чтобы определить голос матери. Но поскольку ребенок познакомился с голосом матери еще до рождения, слушая его через околоплодную жидкость, он может полагаться на мелкие детали. Вероятнее всего, особенно важны тон голоса (как средняя величина, так и изменения на протяжении фразы) и ритм речи.
В некоторой степени способность матери и ребенка узнавать голоса друг друга должна была предшествовать эволюции речи, поскольку эта способность есть у многих других видов животных. Представьте себе пингвина, ковыляющего обратно из похода за пищей и пытающегося отыскать свою пару или малыша в огромной колонии. Пингвины кажутся друг другу совершенно одинаковыми по внешнему виду и запаху, поэтому они преимущественно полагаются на издаваемые характерные звуки. Делать это им приходится в весьма неблагоприятных условиях, состязаясь со свистом антарктических ветров и какофонией, производимой остальными членами колонии.
У императорских пингвинов исключительно сложные модели звукового общения, которые резко выделяются из остального шума. Они вынашивают яйца на собственных лапах, поэтому птицы в колониях все время передвигаются, что затрудняет поиск пары. А когда птенцы вылупляются и сами начинают двигаться, дело еще больше осложняется. Императорские пингвины используют сложные сочетания особых звуковых приемов, чтобы опознать друг друга в этой гуще. Птицы производят звуки с помощью сиринкса, расположенного в месте соединения бронхов и трахеи. У сиринкса имеются две трубки, но большинство птиц при крике используют только одну. Императорские пингвины – исключение из этого правила, и исполняют дуэт сами с собой, гудя одновременно в обе трубки. Так создаются два звука, немного отличающиеся по частоте, звучание их голоса становится резким, потому что один тон сталкивается с другим. Получается, что голоса взрослых особей звучат так, как будто кто-то медленно извлекает кудахтающие звуки из губной гармоники. Научные эксперименты показывают, что императорские пингвины используют большое количество последовательностей, частот и тембров, чтобы родители и птенцы могли друг друга узнавать. Другим пингвинам, например папуанским, не приходится так стараться, потому что они устраивают гнезда и, следовательно, не так много перемещаются. Поэтому крики папуанских пингвинов значительно проще и похожи на праздничные фанфары. Эксперименты с воспроизведением, в которых биологи наблюдают, как животные реагируют на записи звуков различных голосов, показали, что для подтверждения идентичности папуанского пингвина требуется лишь высота тона его крика [35].
Такие эксперименты можно проводить и с людьми. В одном исследовании использовались голоса знаменитостей, таких как Дэвид Фрост и Леонард Нимой. Если проиграть речь Леонарда Нимоя в обратном порядке, его голос можно будет узнать по характерному тембру. При этом проигранная наоборот речь Дэвида Фроста менее выразительна и похожа на голос из «Твин Пикс» [36]. Характерная манера речи Фроста, которая делает его голос узнаваемым, искажается, если речь инвертируется. Эти примеры еще раз подтверждают, каким образом мозг использует особый набор характеристик для узнавания знакомых голосов. Используя множество разных признаков и индивидуализируя их, мы можем определять голоса удивительно точно: можно узнать любимого человека даже в том случае, если он сильно простужен. Хотя способность узнавать голос должна была появиться у человека еще до возникновения речи, сегодня мы значительно лучше с этим справляемся. Количество знакомых людей, которых мы способны узнать, намного больше, чем у любого другого вида, включая других приматов, живущих в социальных группах.
Необходимость в такой мощной системе узнавания в прошлом тормозила развитие технологий распознавания голоса, но сегодня ситуация изменилась. Банки, например британский HSBC, начали использовать системы распознавания голоса в 2016 году для упрощения доступа к счетам. Это освободило клиентов от необходимости запоминать пароли и другие данные. Подобно средствам обработки информации в мозге человека, компьютерное программное обеспечение использует огромное число характеристик для формирования отпечатка голоса, такого же индивидуального, как и отпечаток пальца. Примерно из сотни таких выделенных характеристик речи одни относятся к физическим характеристикам голосовой анатомии, а другие – к поведенческим привычкам, таким как скорость речи, тон и акцент [37]. Некоторые из этих характеристик не должны меняться, когда люди, например, простужаются, иначе система перестанет функционировать, если вы заболеете. Ее также должно быть невозможно обмануть, сымитировав голос человека. Журнал Wired проверил, смогут ли Кевин Спейси и другие пародисты обмануть систему распознавания голоса, выдавая себя за актера Кристофера Уокена в «Охотнике на оленей» [38]. И хотя для человеческого уха пародисты звучали вполне сносно, они не смогли обмануть компьютер. Пародисты могут скопировать поведенческие привычки, такие как акцент и скорость речи, но, как бы они ни старались, они не смогут воспроизвести все характеристики, определяемые голосовой анатомией. И все же существуют вокальные двойники, которые могут обмануть такие системы: в 2017 году репортер BBC Дэн Симмонс продемонстрировал, как его брат-близнец Джо обманул систему распознавания голоса в банке [39].
Поделиться книгой в соц сетях:
Обратите внимание, что комментарий должен быть не короче 20 символов. Покажите уважение к себе и другим пользователям!