Информация о движении обеспечивает критически важные визуальные подсказки

 

В большинстве исследований используются изображения для изучения того, как мозг конструирует то, что мы "видим", но мы живем не в статичном мире. Сигналы движения представляют собой богатый источник неиспользованной информации, которая может быть полезна для понимания того, как мозг классифицирует объекты. Новое исследование, проведенное в Университете Карнеги-Меллон в сотрудничестве с исследователями из Национального института психического здоровья, позволило с помощью нейровизуализации понять, как мозг регистрирует анимированные и статичные изображения. Результаты исследования опубликованы 25 января в журнале Journal of Neuroscience.

 

"Когда мы говорим о том, как изображения обрабатываются в мозге, мы традиционно говорим о двух путях - один из которых изучает, что представляет собой объект, а второй сосредоточен на том, как взаимодействовать с объектом", - сказала София Роберт, кандидат наук на факультете психологии CMU. Роберт является первым автором исследования. "Работа, которая породила эту теорию, была сосредоточена на фотографиях, застывших кадрах того, что мы видим в повседневной жизни".

Движение является важным стимулом, который предоставляет информацию об объекте. Предыдущие работы касались движения, но в основном в связи с движением человека. Роберт и ее коллеги хотели объединить эти две области, чтобы сравнить, как мозг обрабатывает объекты на статичных изображениях и динамичных видео.

"Много информации об объекте содержится только в том, как он движется", - говорит Мариам Вазири-Пашкам, научный сотрудник Национального института психического здоровья и старший автор статьи. "В этом исследовании мы хотели узнать, насколько хорошо люди умеют расшифровывать объекты по движению и какие области мозга используются для извлечения этой информации".

В ходе исследования команда разработала короткие анимационные ролики, в которых запечатлен контур движущегося объекта, изображенного точками. Во время видеоролика объект приходит в движение среди каскада одинаковых по размеру точек. Видеоролики в исследовании охватывают шесть категорий объектов: человек, млекопитающее, рептилия, инструмент, мяч и маятник/качели.

Команда попросила 430 участников идентифицировать объект в каждом видео. Они обнаружили, что участники точно определяли объекты в 76% случаев, даже если они были лишены формы, цвета или других визуальных признаков.

"Поразительно, насколько хорошо люди определяют объект на основе моделей движения", - говорит Вазири-Пашкам. "Как только вы видите видео, вы видите объект".

Команда продублировала это исследование с меньшей группой из 15 участников, которые просматривали материал во время прохождения фМРТ-сканирования. Участникам были показаны шесть видеороликов с наиболее высокими показателями распознавания объектов (точность 96%) и соответствующие неподвижные изображения того же объекта.

Исследователи использовали результаты сканирования для определения областей мозга, которые активизируются при просмотре статических и динамических объектов. Их работа была сосредоточена на нескольких областях мозга, отвечающих за сенсорное восприятие.

Их результаты подтверждают предыдущие выводы о том, как мозг обрабатывает визуальные данные, но они расширяют эти исследования, показывая, что области, обрабатывающие статичные и анимированные изображения, перекрываются и охватывают несколько исследуемых областей мозга. Кроме того, команда выявила новые области мозга, ранее не связанные с категоризацией объектов, которые активны во время сканирования.

"Дело не только в форме или движении", - говорит Роберт. "Мозг устроен так, чтобы получать как можно больше информации из окружающей среды, чтобы оптимизировать скорость и точность при категоризации объекта".

Эта работа представляет исследователям инструмент для изучения того, как человеческий мозг ежедневно обрабатывает сложную информацию, что может принести пользу многим различным дисциплинам. С точки зрения здравоохранения, он может быть использован клиницистами, изучающими группы населения с трудностями социального восприятия, например, аутизм. Это также может помочь исследователям, которые разрабатывают алгоритмы для обучения ИИ взаимодействию с людьми, помогая им "видеть" мир как человек.

"Это только начало", - говорит Вазири-Пашкам. "Движение содержит кладезь информации, которая может быть использована в самых разных областях".

Роберт и Вазири-Пашкам вместе с покойным Лесли Г. Унгерлейдером из Национального института психического здоровья участвовали в проекте под названием "Разделение представлений категорий объектов, управляемых динамическим и статическим визуальным входом".

Категория: Наука и Техника | Добавил: fantast (25.01.2023)
Просмотров: 189 | Рейтинг: 0.0/0