Зачем мы говорим - Тревор Кокс
Шрифт:
Интервал:
Чтобы узнать больше о современных системах синтеза речи, я отправился в Эдинбург к профессору Саймону Кингу, который специализируется на обучении компьютера речи. Подобно механику, который разбирает и заново собирает мотоцикл, чтобы понять, как он работает, в своих программах Саймон анализирует и реконструирует речь, чтобы узнать больше о вербальной коммуникации. Слушая рассказы Саймона о проблемах, связанных с синтезом речи, я осознал, что, облекая язык в слова, мы совершаем невероятный человеческий подвиг – и принимаем это как должное!
Системе синтеза речи необходимо имитировать способность человека оживлять текст, но, чтобы это сделать, ей придется научиться распознавать определенные характеристики. Текст уже содержит некоторые явные подсказки относительно того, как нужно произносить слова: это, например, орфография и пунктуация. Скажем, вопросительный знак указывает на восходящий тон. Но в дополнение к этому придется учесть и использовать огромное количество внешних знаний, которых нет в самом тексте. Полезным может оказаться словарь произношения, особенно для таких языков, как английский, который не является фонетическим. Но ведь постоянно создаются новые слова, которые нельзя найти в словаре, и они обязательно вызовут проблемы. Саймон отвечает просто: «Обязательно будут ошибки».
Чтобы произведенная компьютером речь звучала убедительно, нужно также, чтобы он попытался извлечь из текста смысл. Возьмем 130-й сонет Шекспира, который начинается так: «Ее глаза на звезды не похожи»[35]. Если бы его читал человек, он бы подчеркнул слова «глаза» и «звезды», чтобы усилить контраст. Этот сонет – сатира на любовную поэзию, в нем целый ряд шаблонных сравнений, которые уж никак не подходят возлюбленной автора. Система синтеза речи должна будет определить функцию каждого слова, ей придется опознать контрастирующие слова, чтобы выбрать для речи соответствующее ударение. Попробуйте послушать этот сонет на своем компьютере в исполнении бесплатного онлайн-синтезатора. Конечно, результат будет комичным, но только потому, что компьютер исковеркает тщательно продуманную иронию.
Системы синтеза речи, производимые крупными технологическими фирмами, становятся лучше и лучше. Но если задать вопрос Алексе, персональному помощнику Amazon Echo, то единственное, что можно получить в ответ, – это короткую фактическую информацию. Очевидно, что сделать это значительно проще, чем прочитать пьесу или стихотворение. Amazon Echo – небольшой цилиндрик, который через микрофон фиксирует ваш голос и реагирует на ваши команды. В настоящее время к созданию более умных помощников подключились другие компании. Дело здесь в элементарной экономике: если люди покупают всякие голосовые штучки, то компании хотят получать прибыль. Но подобные устройства фиксируют то, чем люди занимаются дома, и предоставляют ценные сведения о поведении, которые тоже можно использовать в коммерческих целях. Большинство людей, по-видимому, не слишком озабочены тем, что посредством технологий раскрывают самые интимные детали своей личной жизни. Однако ввод фразы в поисковое устройство отличается от ситуации, когда компьютер по тону вашего голоса регистрирует случайную информацию, а вы даже не подозреваете, что ее предоставляете.
Беспокоит, однако, то, до какой степени некоторые люди очеловечивают технологические достижения. Дэрен Джилл, директор по управлению продуктами, занимающийся персональным помощником Amazon, в интервью New Scientist отметил: «Каждый день тысячи людей говорят Алексе “доброе утро”» [25]. Сотни тысяч людей объяснились в любви умному домашнему помощнику, а некоторые даже предложили ему руку и сердце. Вы можете представить, что пишете такое письмо своему компьютеру?
Наличие речи у технологического устройства предполагает его независимость и самостоятельность. В одном исследовании 50 студентам задали вопросы о том, как они воспринимают изменения в голосе робота. Участники опроса чаще очеловечивали машину, если голос робота звучал по-человечески и его пол соответствовал полу слушателя. Значение имела также способность машины двигаться – вот почему некоторые домашние помощники всегда повернуты к вам лицом, они так спроектированы. Поразительным примером того, как движение одушевляет машину, стало возмущение, вызванное дурным обращением с роботом-собакой [26]. В 2015 году был снят видеоролик, демонстрирующий возможности собаки-робота по кличке Спот (безголовой машины на четырех ногах, которая даже не напоминает живое существо) удерживать равновесие. В фильме кто-то дает Споту хороший пинок. Впечатляет, что робот не падает, а вместо этого перебирает ножками, как механический Бемби, а потом наконец стабилизирует свое положение. Это должно было продемонстрировать новую технологию восстановления равновесия, но совершенно неожиданно видео вызвало волну негодования. Некоторые люди сочли, что пинать робота жестоко: они действительно приписали ему характеристики собаки.
На самом деле очеловечивание – это когнитивная ошибка. Такой перенос осуществляется потому, что схожие отделы мозга работают в тех случаях, когда мы думаем о поведении человека, и в тех, когда мы пытаемся понять движения объектов и животных. Будучи высокосоциальным животным, человек нуждается в том, чтобы предвосхищать действия, настроения и намерения других людей. Важной подсказкой является движение тела. Представьте, что в темноте вам навстречу идет человек, а по контуру его тела расположены 15 ярких маленьких пятнышек, позволяющих вам распознать движения его ног и верхней части туловища. Поразительно, что хотя вы и не видите деталей, кроме пятнышек, вы можете тем не менее определить пол человека, нервничает он или в хорошем настроении. Этот навык начинает формироваться в раннем возрасте: пятилетние дети легко определяют пол человека по движениям его тела, причем статистические показатели выше средних ожидаемых [27].
Писательница Джудит Ньюман обнаружила удивительную возможность использования говорящего умного помощника: он стал неоценимым помощником в воспитании ее сына Гаса, который страдает аутизмом (ASD) [28]. Гас ведет с Siri интерактивную переписку в айфоне, у него как будто есть воображаемый друг, воплощенный в этом техническом устройстве. Люди с аутизмом находят общение с компьютером более предсказуемым и поэтому менее нервозным, чем общение лицом к лицу с человеком. Как и у многих других людей с аутизмом, у Гаса нескончаемый и утомляющий поток вопросов. Но Siri, в отличие от собеседника-человека, никогда не теряет терпение, всегда отвечает вежливо и никогда не осуждает.
Кроме того, Ньюман обнаружила, что Siri помогла Гасу научиться более четко произносить слова. «В обычной беседе Гаса трудно понять, – говорит Джудит. – Нам приходится постоянно напоминать ему, что нужно говорить медленно и отчетливо, но он все равно иногда об этом забывает. А Siri вынуждает его так делать. Если он хочет получить информацию, у него просто нет выбора». Гас болтает с Siri, как будто она человек, но Ньюман настоятельно подчеркивает, что их случай – это не печальная история подростка, который общается исключительно с компьютером. Это не похоже на историю из фильма «Она» (2013), в котором одинокий писатель вступает в нездоровые отношения с управляемым голосом компьютером. Гас использует Siri и для общения с людьми. Он ищет информацию о хобби других людей, чтобы это помогало ему заводить с ними беседу и преодолевать социальные затруднения.
Поделиться книгой в соц сетях:
Обратите внимание, что комментарий должен быть не короче 20 символов. Покажите уважение к себе и другим пользователям!