Зловещая долина: когда роботы становятся слишком человечными
Вы когда-нибудь видели робота, анимационного персонажа или даже героя видеоигры, который был настолько похож на человека, что это казалось почти… зловещим? Было ли вам трудно понять, человек это или нет, и вызывала ли эта неопределенность странное, нервирующее чувство? Если да, то вы, вероятно, испытали явление, известное как «зловещая долина». Но что это такое и почему оно вызывает у нас такую сильную реакцию?

Термин «зловещая долина» был введен японским профессором робототехники Масахиро Мори в 1970 году. Мори заметил, что по мере того, как робот становится все более человекоподобным, наша симпатия к нему возрастает – до определенного момента. Когда сходство становится почти идеальным, но не совсем, эта симпатия внезапно резко падает, сменяясь чувством отвращения, страха или даже брезгливости. Мори изобразил этот резкий эмоциональный спад на графике, напоминающем долину – отсюда и название «зловещая долина».
Почему мы так себя чувствуем?
Существует несколько теорий, пытающихся объяснить, почему у нас возникает такая странная реакция. Вот несколько возможных объяснений:
-
Эволюционные причины: На протяжении миллионов лет наш мозг был «запрограммирован» на обнаружение тонких отклонений во внешности и поведении человека. Эти отклонения могут сигнализировать о болезни, опасности или о том, что кто-то не принадлежит к нашему «племени». Роботы или персонажи, которые почти, но не совсем люди, могут запускать эту врожденную систему тревоги.
-
Трудности категоризации: Наш мозг любит классифицировать вещи: это человек, это животное, это предмет. Существа, находящиеся в зловещей долине, однако, выпадают из этих четких категорий. Нам трудно их классифицировать, и эта неопределенность вызывает дискомфорт.
-
Нарушение ожиданий: Когда мы видим робота или анимационного персонажа, у нас есть определенные ожидания относительно его поведения и движений. Если эти ожидания не оправдываются, это может вызывать раздражение. Например, если робот улыбается, но его глаза не «улыбаются» вместе с губами, наш мозг воспринимает это несоответствие, что может вызвать негативные эмоции.
-
Осознание смертности (напоминание о смерти): Некоторые исследователи предполагают, что мы ассоциируем неподвижные или неестественно движущиеся человекоподобные фигуры со смертью или болезнью. Поскольку сущности в зловещей долине выглядят как люди, но не совсем правильно, эта ассоциация может способствовать возникновению жуткого чувства.
Зловещая долина в повседневной жизни
Феномен зловещей долины не ограничивается робототехникой. Мы сталкиваемся с ним в различных областях:
-
Анимационные фильмы: Ранние CGI-анимации часто попадали в ловушку зловещей долины (вспомните фильм «Полярный экспресс»). Хотя современные анимационные технологии гораздо более совершенны, достижение идеального реализма без возникновения дискомфорта остается проблемой.
-
Видеоигры: Персонажи видеоигр становятся все более реалистичными, но зловещая долина по-прежнему может быть здесь серьезной проблемой. Игрокам может быть трудно идентифицировать себя с персонажем, который выглядит или двигается странно.
-
Протезирование: Современные протезы все больше имитируют человеческие конечности, но зловещая долина может возникнуть и здесь. Протез, который является гиперреалистичным, но несовершенным, может быть неприятным как для владельца, так и для окружающих.
-
Виртуальная реальность (VR): VR-опыт становится все более захватывающим. Зловещая долина может сильно повлиять на это погружение. Чем более человекоподобными становятся VR-персонажи, тем выше вероятность того, что пользователи могут воспринять их поведение как «странное» или жуткое.
Новые измерения зловещей долины: когда слова становятся жуткими
Хотя феномен зловещей долины традиционно связывался с визуальным обликом – особенно человекоподобных роботов – развитие искусственного интеллекта, особенно больших языковых моделей (LLM), открыло новые измерения этой проблемы. Сегодня не только зрение, но и звук и разговор могут вызывать это странное чувство.
Безопасность текста и ловушка голоса
Интересно, что зловещая долина, кажется, менее выражена в письменном тексте. Текст, сгенерированный LLM, может быть идеально сформулированным, логичным и информативным, но мы обычно не испытываем того же дискомфорта, который возникает при виде «почти человеческого» робота. Это может быть связано с тем, что письменный текст менее прямой, менее личный, чем визуальные или слуховые стимулы. У нашего мозга больше времени для обработки информации и он меньше полагается на инстинктивные реакции.
Однако, когда в дело вступает голос, ситуация резко меняется. Современные AI-синтезаторы голоса могут создавать реалистичные человеческие голоса, которые почти неотличимы от настоящих. И вот в чем проблема: если голос звучит совершенно по-человечески, но сущность за ним не является человеком, эффект зловещей долины может усилиться.
Почему голос вызывает большее беспокойство?
-
Интимность: Голос – гораздо более интимная форма общения, чем письмо. Тон, интонация и акцент несут в себе богатую информацию об эмоциях, намерениях и личности. Если эти элементы кажутся «неправильными», наш мозг немедленно подает сигнал тревоги.
-
Ожидания: Когда мы разговариваем с кем-то, мы постоянно – в основном подсознательно – оцениваем его вербальные и невербальные сигналы. С AI-голосом эти сигналы могут быть технически совершенными, но им может не хватать какого-то нематериального «человеческого» элемента, что делает опыт неприятным.
-
Потеря контроля: Мы можем в любой момент прекратить читать письменный текст или перечитать его. В голосовом взаимодействии, однако, у нас меньше контроля над ситуацией. Это чувство снижения контроля может усилить тревогу.
Зловещая долина в голосовом AI
-
Голосовые модели OpenAI: OpenAI, компания, стоящая за ChatGPT, также прилагает значительные усилия для разработки голосового искусственного интеллекта. Их более ранние модели, такие как GPT-3, могли генерировать впечатляющий текст, но синтез голоса все еще имел недостатки. Новые модели, такие как GPT-4, обладают мультимодальными возможностями, обрабатывая как текст, так и изображения. Модели OpenAI могут преобразовывать текст в речь. Хотя технология постоянно развивается, голоса более ранних версий иногда могли звучать «роботизированно» или «неестественно», потенциально вызывая зловещую долину. OpenAI открыто сообщает, что технология все еще находится в разработке, и рассматривает этические аспекты (например, опасность клонирования голоса).
-
Sesame AI: Sesame AI – это стартап, основанный соучредителем Oculus Бренданом Айрибом. Компания специализируется именно на «разговорном голосе» и стремится преодолеть зловещую долину. Sesame AI предлагает виртуальных собеседников по имени «Майя» и «Майлз», которые, по утверждению компании, используют «революционную» технологию. Их голоса звучат естественно, демонстрируют эмоциональные колебания и тональные сдвиги, и могут запоминать предыдущие разговоры. Sesame AI подчеркивает важность «голосового присутствия», то есть не только слова, но и подача, паузы и акцент звучат аутентично и естественно. По словам журналиста ZDNet, который попробовал Майю, разговор показался «удивительно человеческим», заставив его почти забыть, что он разговаривает с AI. В статье Ars Technica отмечалось, что голос Sesame AI динамичный, выразительный и даже включает в себя «несовершенства», такие как вздохи, смешки или самоисправленные оговорки.
-
Google Duplex: Технология Google Duplex, продемонстрированная как часть Google Assistant, может совершать телефонные звонки (например, бронировать столики в ресторанах). Однако первоначальная версия Duplex вызвала споры именно из-за зловещей долины: ее голос был настолько реалистичным, что люди, принимавшие звонки, не знали, что разговаривают с AI. Это вызвало этические опасения, и Google позже модифицировал систему, чтобы AI идентифицировал себя в начале звонка.
-
Клонирование голоса: Технологии клонирования голоса позволяют воспроизвести чей угодно голос. Эта технология обладает фантастическим потенциалом, но также может быть опасной с точки зрения зловещей долины. Например, AI, говорящий голосом умершего любимого человека, может быть одновременно утешительным и глубоко тревожным.
Производители роботов и избежание зловещей долины
Производители роботов хорошо осведомлены о феномене зловещей долины и используют различные стратегии, чтобы избежать ее:
-
Стилизованный внешний вид: Вместо того чтобы пытаться создать идеально человеческих роботов, многие компании выбирают стилизованные, «мультяшные» дизайны. Эти роботы выглядят милыми, дружелюбными и не создают впечатления, что «пытаются» быть людьми. Примеры включают робота Pepper от SoftBank Robotics или робота-собаку Aibo от Sony.
-
Нечеловекоподобные формы: Некоторые роботы вообще не похожи на людей. Эти роботы обычно выполняют определенные задачи (например, уборка, складская логистика), где функциональность важнее внешнего вида.
-
Ограниченное взаимодействие: Многие роботы предназначены для взаимодействия с людьми лишь в ограниченной степени. Например, робот за информационной стойкой может только отвечать на простые вопросы и не вступать в длительные разговоры.
-
Прозрачность: Важно, чтобы люди знали, когда они общаются с роботом или AI. Открытое признание искусственной природы может снизить недоверие и тревогу.
-
Фокус на эмоциональном интеллекте: Некоторые компании, такие как Hanson Robotics, работают над тем, чтобы сделать своих роботов не только человекоподобными, но и эмоционально интеллектуальными. Такие роботы могут распознавать и реагировать на человеческие эмоции, что потенциально делает взаимодействие более естественным. Их робот София является известным примером. Однако этот подход также рискован, поскольку аутентичное моделирование эмоций чрезвычайно сложно, и неудача может усилить эффект зловещей долины.
Будущие вызовы
Зловещая долина представляет собой серьезную проблему для технологического прогресса. По мере того как мы создаем все более человекоподобных роботов, анимации и виртуальных персонажей, мы должны уделять еще больше внимания избежанию этого жуткого эффекта. Исследователи и разработчики постоянно работают над пониманием и преодолением зловещей долины, стремясь к более гладкому и естественному взаимодействию человека и технологий в будущем.
Заключительные мысли
Зловещая долина – это странное, жуткое чувство, вызываемое почти человеческим роботом, реалистичной анимацией или даже слишком идеальным AI-голосом – это нечто большее, чем просто технологическое препятствие. На самом деле, это зеркало, обращенное к нам самим. Оно напоминает нам о том, насколько тонко настроены наши чувства, как инстинктивно мы ищем человеческие черты и насколько важно для нас подлинное, аутентичное общение – даже если это общение может быть с искусственной сущностью.
Конечно, первоначальное отвращение, «жуткость», – это естественная реакция. Наш мозг специализировался на протяжении тысячелетий, чтобы обнаруживать малейшие несоответствия и подавать сигнал тревоги, когда что-то кажется неладным. Но что, если мы выйдем за рамки этой первой, инстинктивной реакции? Что, если мы примем, что в будущем мы будем все чаще взаимодействовать с существами – будь то физические роботы, виртуальные помощники или голос из нашего телефона – которые почти люди, но не совсем?
Возможно, дело не в том, чтобы эти сущности идеально имитировали людей. Возможно, дело скорее в том, чтобы научиться сосуществовать с ними. Речь идет о поиске областей, где эти технологии могут по-настоящему помочь нам: в выполнении повседневных задач, общении, образовании, здравоохранении или даже в борьбе с одиночеством.
Только подумайте: пожилому человеку, живущему в одиночестве, может не понадобиться идеально человекоподобный робот-сиделка. Возможно, стилизованный, дружелюбный робот, который напоминает ему принять лекарство, читает ему новости и болтает о погоде, был бы гораздо полезнее. Виртуальный помощник, который не только отвечает на наши вопросы, но и понимает наше настроение и соответствующим образом адаптируется, может сблизить нас, а не оттолкнуть.
Ключом к будущему может быть не идеальная имитация, а гармоничное сотрудничество. Речь идет о поиске баланса между человеческим и искусственным. Речь идет о том, чтобы использовать преимущества, предлагаемые технологиями, сохраняя при этом то, что действительно делает нас людьми: эмпатию, креативность, воображение и способность общаться друг с другом – даже если это общение иногда кажется немного… зловещим.