01:55
Среднесрочный прогноз максимального уровня Тобола в Кургане с использованием машинного обучения на базе инструмента Simple ML

Средняя абсолютная ошибка прогноза максимального уровня Тобола в Кургане. 2011-2024 гг. Чем ниже, тем лучше

 

Описанный ниже метод позволяет достаточно быстро и весьма точно рассчитывать максимальный уровень Тобола в Кургане в среднесрочной перспективе. В качестве входных данных для обучения нейросетевой модели используются максимальные уровни Тобола и даты прохождения пика в селе Звериноголовское. Создание модели происходит с использованием инструмента Simple ML for Sheets, который встраивается в Google Sheets. Обученная модель показывает более высокое качество, чем обычная линейная модель.

 

Между уровнем Тобола в селе Звериноголовское и Курганом есть тесная связь. Коэффициент детерминации достигает 0.92, что говорит о высоком качестве модели. Для создания линейной модели использовались данные за 63 года. Это выборка с 1939 по 1984 гг. и 2008 по 2023 гг. Тестовая ретроспективная выборка формировалась за период 2011-2024 гг. Обычная линейная модель за 50 лет дала среднюю абсолютную ошибку 68 см. В двух случаях ошибка была 110 и 145 см. R-квадрат между прогнозом и фактом был 0.923.

 

С использованием инструмента Simple ML for Sheets для Google Sheets была обучена первая модель. Выборка 50 лет. Для обучения использовался алгоритм Gradient Boosted Trees. На тестовой выборке модель показана среднюю абсолютную ошибку 53 см, что на 15 см ниже, чем линейная модель. За 14 лет не было ни одного случая, когда ошибка имела трёхзначное значение. R-квадрат между прогнозом и фактом был 0.983, что существенно выше, чем у линейной модели.

Создание модели происходит в Google таблицах за несколько секунд

 

Затем в таблицу были включены даты пика половодья в селе Звериноголовское. Даты преобразовывались в порядковый номер дня в году. Добавление даты позволило ещё сильнее снизит среднюю ошибку до 40 см, что на 13 см ниже, чем без даты пика. Новая модель успешно справилась с прогнозом уровня Тобола в 2024 году, когда река поднималась до 1015 см. Линейная модель за 50 лет ошиблась на 91 см, нейросетевая на 75 см, а нейросетевая с добавлением даты снизила ошибку до 62 см. Обучение новой модели с выборкой 63 года ещё больше снизило ошибку до 45 см.

 

Вполне возможно, что дата прохождения пика прямым образом связана со средними температурами. Чем выше температура, тем интенсивнее оттаивает почва на пойме Тобола между Курганом и селом Звериноголовское. Дата характеризует степень оттаивания почвы. Средняя разница пиков между гидропостами составляет 7 суток. Модель позволяет прогнозировать максимальный уровень Тобола в Кургане за 6-10 суток.

 

Исходные данные новой модели были опубликованы на Google Drive.

Просмотров: 2291 | Добавил: fantast | Рейтинг: 3.7/3
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]