Роботы постепенно проникают в больницы и другие клинические учреждения, оказывая основную помощь врачам и пациентам. Однако, чтобы облегчить их широкое использование в медицинских учреждениях, исследователи робототехники должны убедиться, что пользователи чувствуют себя непринужденно с роботами и принимают помощь, которую они могут предложить. Это потенциально может быть достигнуто путем разработки роботов, которые общаются сочувственно и сострадательно.
Имея это в виду, исследователи из Университета Окленда и Сингапурского университета технологии и дизайна использовали методы синтеза речи для создания роботов, которые звучат более чутко. В недавней статье, опубликованной в Международном журнале социальной робототехники, они представили результаты эксперимента, исследующего влияние использования эмпатического синтезированного голоса на восприятие пользователями роботов.
"Наше недавнее исследование основано примерно на трехлетних исследованиях, направленных на разработку синтетического голоса для медицинских роботов", - сказал TechXplore Джесин Джеймс, один из исследователей, проводивших это исследование. "Прошлые исследования показали, что тип синтезированного голоса, используемый роботами, может влиять на то, как пользователи воспринимают их, что может поощрять или препятствовать пользователям инициировать взаимодействие."
Исследовательская группа по изучению речи в Университете Окленда и Центр автоматизации и робототехники уже несколько лет пытаются разработать медицинские роботы, которые могут помочь людям в домах престарелых. В последнее время они сосредоточили свои усилия на попытке определить голоса, которые могли бы сделать роботов более приемлемыми в глазах людей, с которыми они взаимодействуют.
"Многие исследования и разработки в области робототехники направлены на расширение возможностей роботов", - пояснил Джеймс. "Однако пользователи могут быть полностью обескуражены от использования роботов, если они чувствуют недостаток взаимной эмпатии. Мы чувствовали, что голос робота играет важную роль в том, как люди воспринимают его, что в конечном итоге вдохновило нас на проведение нашего недавнего исследования."
Во-первых, Джеймс и ее коллеги проверили гипотезу о том, что голос робота может влиять на то, как пользователи воспринимают его, проведя простой эксперимент с использованием робота под названием Healthbot. Голос робота принадлежал профессиональному голосовому художнику, который записывался во время чтения диалогов в двух вариациях тона: ровный монотонный и сочувствующий голос.
Исследователи набрали 120 участников и попросили их поделиться своим восприятием после того, как они посмотрели видео Healthbot, говорящего с этими двумя разными голосами. Подавляющее большинство участников сказали, что они воспринимали робота как более чуткого, когда он говорил, используя более чуткий голос. Эти первоначальные результаты побудили исследователей изучить возможность создания синтетического голоса, воспроизводящего эмпатический тон, используемый профессиональным голосовым художником.
-Наше исследование преследовало две ключевые цели,- сказал Джеймс. "Один из них состоял в том, чтобы определить, какой тип синтезированного голоса лучше всего подходит для создания медицинского робота, который воспринимается как эмпатический. Как только мы определили его, мы попытались использовать методы синтеза речи, чтобы произвести этот голос."
Когда они проанализировали результаты короткого экспериментального исследования, исследователи поняли, что эмоции, которые больше всего влияют на то, воспринимает ли человек голос как эмпатический или нет, были не первичными эмоциями (то есть гневом, печалью, радостью и страхом), а более тонкими, вторичными эмоциями. Это сложные эмоции, которые часто передаются тоном человеческого голоса, который может быть, например, извиняющимся, тревожным, уверенным, восторженным или обеспокоенным. Это понимание вдохновило Джеймса и ее коллег на создание нового набора данных речевых записей, передающих эти вторичные эмоции, под названием JLCorpus.
Проанализировав образцы речи из этого набора данных, команда смогла создать модель, которая описывала эмоциональные качества, которые синтезированный голос должен был восприниматься как эмпатический человеческими слушателями. Эта модель учитывает такие характеристики, как высота тона, а также скорость и интенсивность речи. Затем они произвели синтезированный голос, который соответствовал эмоциональным качествам, которые они идентифицировали.
Впоследствии Джеймс и ее коллеги провели второй тест восприятия, в ходе которого пользователи просматривали видео Healthbot, говорящего синтетическим голосом, который они создали, и делились своим восприятием робота.
"В этом втором тесте восприятия участники увидели видео медицинского робота, говорящего синтезированным голосом, и оценили воспринимаемую эмпатию по пятибалльной шкале, основанной на модуле мотивационного интервьюирования целостности лечения (MITI)",-сказал Джеймс. -Это пятибалльная шкала, используемая для оценки эмпатии клинициста, и та же шкала использовалась здесь с модификациями, сделанными в соответствии с медицинским роботом."
В видеороликах, которые исследователи показали участникам, Healthbot имел нейтральное выражение лица, и его речь не сопровождалась какими-либо особыми жестами рук. Это означает, что он мог передавать эмоции и сопереживание только через свой голос. Подавляющее большинство тех, кто принимал участие во втором тесте, сказали, что они воспринимают робота как очень чуткого, высоко оценив его по пятибалльной шкале модуля MITI.
"Наши результаты показывают, что люди могут воспринимать эмпатию только по голосу, без какой-либо поддержки мимики или жестов", - сказал Джеймс. - Это означает, что голос робота играет ключевую роль в том, как люди воспринимают его. Этот голос-не просто средство общения с людьми; он действительно может влиять на их восприятие."
В дополнение к подчеркиванию важной роли, которую голос робота играет в том, как люди воспринимают его, недавнее исследование, проведенное Джеймсом и ее коллегами, показывает, что тонкие, вторичные эмоции-это то, что в конечном итоге делает голос более чутким. Эти результаты могут проложить путь к новым исследованиям вторичных эмоций, которые до сих пор изучались весьма скудно.
"Эти эмоции тонки по своей природе, могут быть специфичными для культуры и иногда их трудно определить и воспроизвести, но это захватывающая часть их анализа",-сказал Джеймс. "Мы не совсем уверены в том, что мы могли бы найти, и это делает его еще более интересным. Существует нехватка ресурсов и баз данных для изучения вторичных эмоций, поэтому разработка этих ресурсов будет следующим шагом вперед."
В будущем синтезированный голос, произведенный этой командой исследователей, может быть использован для создания медицинских роботов, которые звучат более эмпатично и по-человечески. Тем временем исследователи планируют продолжить изучение того, как люди передают тонкие вторичные эмоции в речи, чтобы они могли синтезировать голоса роботов, которые становятся все более убедительными и чуткими. Они также хотели бы разработать модели распознавания эмоций, которые могут автоматически обнаруживать эти эмоции в голосе говорящих людей.
"До сих пор мы проводили тесты восприятия, используя видео робота, говорящего с участниками", - сказал Джеймс. "Сейчас мы проводим тесты восприятия таким образом, что участники могут фактически сидеть рядом с физическим роботом и взаимодействовать с ним. Мы ожидаем, что присутствие робота рядом с участниками повлияет на их восприятие робота в дальнейшем." | |
Просмотров: 358 | |