Роботы для лечения аутизма с персонализированным «глубоким обучением»

20 июля 2018



Исследователи Медиа-лаборатории МТИ (англ. MIT Media Lab), лаборатории антидисциплинарных исследований Массачусетского технологического института разработали модель персонального машинного интеллекта, которая поможет роботам оценивать вовлеченность и заинтересованность ребенка во время взаимодействия, используя информацию, которая является уникальной для данного конкретного индивидуума. Вооруженные этими персонализированными сетями глубокого обучения роботы воспринимают реакцию детей, согласно оценкам экспертов-людей с 60 процентной степенью корреляции. Ученые опубликовали результаты исследования 27 июня 2018 в «Science Robotics».

Пример лечебного сеанса, дополненного использованием человекоподобного робота NAO компании SoftBank Robotics, который проводился в EngageMe. Отслеживание конечностей и выражения лиц выполнялось с использованием утилиты OpenPose для перцептивной лаборатории CMU.

Дети с расстройствами аутистического спектра испытывают трудности в распознавании эмоционального состояния окружающих их людей, например, при различении веселого и испуганного выражения лица. Чтобы скорректировать это, многие психотерапевты используют удобных для детей роботов, демонстрирующих эти эмоции и стимулирующих маленьких пациентов подражать эмоциям и отвечать на них подобающим способом. Данный тип лечения отлично работает, однако, только если робот сможет правильно интерпретировать поведение детей во время терапии — проявляет ли он или она интерес и возбуждение, обращают ли свое внимание. Экспертам, наблюдающим за детьми, бывает достаточно сложно прийти к согласию в вопросах понимания их вовлеченности и поведения. Степень корреляции обычно составляет 50-55%. Радович и его коллеги надеются, что роботы, прошедшие подготовку по наблюдению за людьми, как в данном исследовании, когда-нибудь смогут дать более точную оценку их поведению. «Долгосрочной целью является не создание роботов, которые заменят психотерапевтов, а усиление возможностей специалистов посредством снабжения их ключевой информацией, которая может использоваться для повышения вовлеченности и создания более естественного взаимодействия между роботами и детьми с аутизмом», — поясняет Огги Радович, постдоктор Медиа-лаборатории МТИ. Розалинда Пикард, соавтор исследования, профессор МТИ, руководившая компьютерной обработкой эмоций, говорит, что персонализация имеет особенное значение в терапии аутизма: «Есть одно меткое высказывание доктора Стивена Шора «If you’ve met one person with autism, you’ve met one person with autism — Если вы знаете одного человека с аутизмом, то вы знаете лишь одного человека с аутизмом». «Создание машинного обучения и ИИ (искусственного интеллекта), которые бы работали в области лечения аутизма, постоянно дебатируется, потому что методы ИИ нуждаются в огромном объеме информации, которая одинакова для каждой изучаемой категории. В случае аутизма, где правит непостоянство, достижения нормального ИИ терпят фиаско», — говорит Пикард. Радович, Пикард и члены их команды использовали, персонализированное глубокое обучение также в других областях, обнаружилось, что оно улучшало результаты мониторирования боли и прогнозирования прогрессирования болезни Альцгеймера. Робот-опосредованная терапия аутизма обычно работает следующим образом: психотерапевт показывает ребенку фото с различными лицами, выражающими разные эмоции, чтобы обучить его распознавать страх, печаль или радость. Психотерапевт программирует робота на демонстрацию этих эмоций ребенку и наблюдает за тем, насколько ребенок взаимодействует с роботом. Это поведение ребенка предоставляет необходимую обратную связь, которая нужна для продолжения урока.

Исследователи использовали в своей работе антропоморфных (человекообразных) роботов NAO компании SoftBank Robotics. Почти двух футов ростом, похожий на супергероя в броне, или дроида из «Звездных Войн», NAO способен демонстрировать эмоции посредством изменения цвета глаз или тона голоса, а также движений конечностей. В исследовании участвовали 35 детей с аутизмом в возрасте от 3 до 13 лет, 17 из Японии и 18 из Сербии. Их реакция на роботов во время 35-минутной сессии варьировала в широких пределах: в каких-то случаях это была скука и сонливость, в каких-то возбужденное прыганье по комнате, хлопанье в ладоши и смех или обнимание робота. Большинство детей в данном исследовании, как говорит Радович, реагировали на робота не как на простую игрушку, они уважительно общались с NAO, как будто робот был реальной личностью, особенно во время рассказывания историй, когда психотерапевт спрашивал, как NAO будет себя чувствовать, если ребенок даст ему попробовать мороженое. Одна 4-х летняя девочка спряталась за свою маму во время проведения сессии, но стала вести себя более открыто с роботом и в конце терапии уже смеялась. Сестра одного из сербских детей обняла NAO и в конце сеанса сказала ему «Я тебя люблю», добавив, что она была очень рада видеть то, как ее брату нравилось играть с роботом.

«Психотерапевты говорят, что привлечения внимания ребенка даже на несколько секунд — достаточно сложная для них задача, а роботы притягивают внимание детей», — сказал Радович, объясняя, почему роботы так полезны в данном типе терапии. «Кроме того, люди проявляют свои эмоции чрезвычайно различающимися друг от друга способами, а роботы всегда делают это одинаково, и это вызывает меньше разочарований у детей, меньший обман их ожиданий, так как они учатся схематичному способу демонстрации эмоций». Исследовательская команда Массачусетского технологического института пришла к заключению, что машинное обучение, называемое глубоким обучением, может быть полезным для робот-опосредованной терапии для более легкого понимания поведения детей. Системы глубокого обучения используют иерархические, сложноустроенные уровни обработки информации, чтобы улучшить учебные задачи, притом, каждый последующий уровень имеет немного более абстрактное представление, чем исходные необработанные данные.

Хотя концепция глубокого обучения существовала с 1980гг., говорит Радович, возможно оно стало только сейчас, когда появились достаточно мощные компьютеры, способные обеспечить функционирования данного типа искусственного интеллекта. Глубокое обучений использует автоматическую речь и объект-распознающие программы, что делает его высокоадаптированным для решения таких проблем, как нахождение связи между сложными выражениями лица, положением тела, голосом, которые приводят к пониманию таких отвлеченных понятий, как детская заинтересованность. «Какая часть лица наиболее важна для мимики?», — спрашивает Радович. «Глубокое обучение позволяет роботу быстро извлекать наиболее важную информацию из этого потока, без необходимости для людей создавать эти функции вручную». Для лечебных роботов Радович и его коллеги применили наиболее продвинутую идею глубокого обучения и построили персонализированную структуру, которая может пополняться информацией, собранной на каждого отдельно взятого ребенка. Исследователи засняли каждого ребенка на видео: выражение лица, движения головы и тела, позы и жесты, аудио звучание. Зафиксировали информацию о пульсе, температуре, влажности кожи, мониторируя запястье (использовались пульсометры, термометры и влагомеры). Персонализированная сеть глубокого обучения роботов была построена на основе этих видео, аудио-данных и данных физиологического обследования, а также информации об аутизме, способностях ребенка, его культурных и гендерных особенностях. В последствие исследователи сравнили их оценки поведения детей с оценками пяти экспертов-людей. Эксперты оценивали такие показатели, как приятность, заинтересованность, вовлеченность.

Исследователи тренировали сети на персонализированных данных, а вот тестировали уже на информации, не использованной ранее во время тренировок или калибровки (настройки) моделей. Это улучшило, в большинстве случаев, способность роботов к оценке поведения ребенка. Исследования показали, что результаты такого подхода были лучше, чем если бы сеть использовала один универсальный подход для всех детей.

Радович и коллеги также смогли исследовать, как именно система глубокого обучения делает свои оценки, и это выявило некоторые интересные различия между детьми, например, различия, связанные с их культуральными особенностями. «Например, дети из Японии активнее двигались при высоком уровне вовлеченности, в то время как у сербов активность тела повышалась в моменты непринужденного общения», — добавил Радович.