Глобальный набор данных с открытым исходным кодом изображений Земли с высоким разрешением - самый обширный и детализированный в своем роде - был разработан экспертами во главе с Калифорнийским университетом с использованием данных Европейского космического агентства (ЕКА). Бесплатный набор данных WorldStrat будет представлен на конференции NeurIPS 2022 в Новом Орлеане. Он включает в себя почти 10 000 км2 бесплатных спутниковых снимков, показывающих все типы местоположений, городских районов и землепользования - от сельского хозяйства, лугов и лесов до городов любого размера и полярных ледяных шапок.
Набор данных включает местоположения на Глобальном Юге и те, кто нуждается в гуманитарной помощи, которые часто недостаточно представлены на спутниковых снимках, поскольку они обычно собираются для получения коммерческой выгоды, поэтому непропорционально представлены более богатые регионы. Ученые говорят, что коллекция позволяет проводить анализ местности по всему миру для решения глобальных задач, таких как реагирование на природные и техногенные катастрофы, управление природными ресурсами и городское планирование. Работа над WorldStrat началась в 2021 году, и с момента ее запуска в июне 2022 года она была загружена более 3000 раз. Руководитель проекта, доктор Жюльен Корнебиз (UCL Computer Science), сказал: "Сочетание коммерческих изображений высокого разрешения и машинного обучения обладает огромным потенциалом для проведения общепланетного анализа, который может помочь в решении всех видов глобальных проблем - проблема в том, что коммерческие данные часто заблокированы за платным доступом". "Программа TPM ЕКА сделала наш проект возможным, предоставив бесплатный доступ к данным, которые обычно были бы очень дорогими". Команда использовала данные со спутников Airbus SPOT 6 и SPOT 7, заказанных ЕКА и запущенных в 2012 и 2014 годах соответственно. Спутники могут предоставлять изображения с разрешением до 1,5 м на пиксель, что означает, что каждый пиксель представляет собой площадь 1,5 м на 1,5 м на земле. Ученые использовали около 4000 высокодетализированных изображений со спутников SPOT. Даже если эти изображения имеют высокое (пространственное) разрешение, они имеют низкое временное разрешение, что означает в этом контексте, что каждый спутник не посещает и не фиксирует каждый объект регулярно. Это связано с тем, что изображения, сделанные спутниками, изначально предназначались для использования в конкретных коммерческих целях, а не для долгосрочного анализа. Чтобы бороться с этим, команда также использовала свободно доступные изображения с более низким разрешением со спутника Copernicus Sentinel-2. Они имеют более высокое временное разрешение, что означает, что они были сняты в более регулярные моменты времени каждые пять дней. Они сопоставили каждое точечное изображение с 16 изображениями с Copernicus Sentinel-2, используя в общей сложности около 64 000. Исследователи разработали набор данных, чтобы также поддержать разработку приложений машинного обучения для его расширения и улучшения, например, для дальнейшего улучшения разрешения изображения. Чтобы обеспечить разработку дальнейших приложений, ученые разработали инструментарий искусственного интеллекта, а также полный исходный код, позволяющий разработчикам воспроизводить, расширять и преобразовывать работу. Доктор Корнебиз продолжил: "Тысячи пользователей данных со всего мира уже загрузили WorldStrat, и мы с нетерпением ждем возможности увидеть, как они расширяют и улучшают его, используя методы машинного обучения". Предварительная версия исследования доступна на arXiv. | |
Просмотров: 176 | |