Когда дело доходит до прогнозирования бедствий, вызванных экстремальными явлениями (например, землетрясениями, пандемиями или "волнами-изгоями", которые могут разрушить прибрежные сооружения), компьютерное моделирование сталкивается с почти непреодолимой проблемой: статистически говоря, эти события настолько редки, что о них просто недостаточно данных, чтобы использовать прогностические модели для точного прогнозирования. когда они произойдут в следующий раз. Но команда исследователей из Университета Брауна и Массачусетского технологического института говорит, что это не обязательно должно быть так.
В новом исследовании в журнале Nature Computational Science ученые описывают, как они объединили статистические алгоритмы, которым требуется меньше данных для точных и эффективных прогнозов, с мощной техникой машинного обучения, разработанной в Brown, и обучили ее предсказывать сценарии, вероятности, а иногда даже временные рамки редких событий, несмотря на отсутствие исторических записей на них. Таким образом, исследовательская группа обнаружила, что эта новая структура может обеспечить способ обойти необходимость в огромных объемах данных, которые традиционно необходимы для такого рода вычислений, вместо этого, по сути, сводя грандиозную задачу прогнозирования редких событий к вопросу качества, а не количества. "Вы должны понимать, что это случайные события", - сказал Джордж Карниадакис, профессор прикладной математики и инженерии в Брауне и автор исследования. "Вспышка пандемии, подобной COVID-19, экологическая катастрофа в Мексиканском заливе, землетрясение, огромные лесные пожары в Калифорнии, 30-метровая волна, которая опрокидывает корабль, — это редкие события, и поскольку они редки, у нас не так много исторических данных. У нас недостаточно образцов из прошлого, чтобы предсказать их дальнейшее развитие в будущем. Вопрос, который мы рассматриваем в этой статье, заключается в следующем: какие данные являются наилучшими из возможных, которые мы можем использовать, чтобы минимизировать количество необходимых нам точек данных?" Исследователи нашли ответ в методе последовательной выборки, называемом активным обучением. Эти типы статистических алгоритмов способны не только анализировать вводимые в них данные, но, что более важно, они могут извлекать уроки из информации, чтобы помечать новые релевантные точки данных, которые одинаково или даже более важны для вычисляемого результата. На самом базовом уровне они позволяют сделать больше с меньшими затратами. Это имеет решающее значение для модели машинного обучения, которую исследователи использовали в исследовании. Модель, получившая название DeepOnet, представляет собой тип искусственной нейронной сети, которая использует взаимосвязанные узлы в последовательных слоях, которые примерно имитируют соединения, создаваемые нейронами в человеческом мозге. DeepOnet известен как глубокий нейронный оператор. Это более продвинутая и мощная технология, чем обычные искусственные нейронные сети, потому что на самом деле это две нейронные сети в одной, обрабатывающие данные в двух параллельных сетях. Это позволяет ему анализировать гигантские наборы данных и сценариев с головокружительной скоростью, чтобы выдавать столь же массивные наборы вероятностей, как только он узнает, что ищет. Узким местом этого мощного инструмента, особенно в том, что касается редких событий, является то, что операторам глубоких нейронных сетей необходимо обучить тонны данных для выполнения эффективных и точных вычислений. В статье исследовательская группа показывает, что в сочетании с методами активного обучения модель DeepOnet может быть обучена тому, какие параметры или предвестники следует искать, которые приводят к катастрофическому событию, которое кто-то анализирует, даже когда точек данных немного. "Цель состоит не в том, чтобы взять все возможные данные и поместить их в систему, а в том, чтобы активно искать события, которые будут означать редкие события", - сказал Карниадакис. "Возможно, у нас не так много примеров реального события, но у нас могут быть эти предвестники. С помощью математики мы идентифицируем их, что вместе с реальными событиями поможет нам обучить этого жадного до данных оператора". В статье исследователи применяют этот подход к точному определению параметров и различных диапазонов вероятностей опасных всплесков во время пандемии, поиску и прогнозированию волн-изгоев и оценке того, когда корабль расколется пополам из-за стресса. Например, с волнами—изгоями, размер которых более чем в два раза превышает размер окружающих волн, исследователи обнаружили, что они могут обнаружить и количественно определить, когда образуются волны—изгои, изучив вероятные волновые условия, которые нелинейно взаимодействуют с течением времени, приводя к появлению волн, иногда в три раза превышающих их первоначальный размер. Исследователи обнаружили, что их новый метод превзошел более традиционные усилия по моделированию, и они полагают, что он представляет собой основу, которая может эффективно обнаруживать и предсказывать все виды редких событий. В статье исследовательская группа описывает, как ученые должны проектировать будущие эксперименты, чтобы они могли минимизировать затраты и повысить точность прогнозирования. Карниадакис, например, уже работает с учеными-экологами над использованием нового метода для прогнозирования климатических явлений, таких как ураганы. Исследованием руководили Итан Пикеринг и Фемистоклис Сапсис из Массачусетского технологического института. DeepOnet был представлен в 2019 году Карниадакисом и другими исследователями Брауна. В настоящее время они ищут патент на эту технологию. | |
Просмотров: 183 | |