”water level machine learning” + Googlimg で多数引っかかる内容です。
頭から読んでみたところ、地すべりのSusceptibility Map の作成の文献とは傾向が異なっており、アルゴリズムの比較が多く目につきました。データセットによって予測性能の良いアルゴリズムが異なる点はよく知られていますが、見事にバラバラ。それらのアンサンブルが少ないのは機械学習分野の流れと異なりますが、浸透するにはもう少し年月が必要なのでしょう。
内容的には玉石混合ですが、アルゴリズムの比較という点では有用ですので、引っかかったものから書き残しておきます。
- DNN, LSTM, XGBoost
- 1日前の水位を利用する場合はDNNがBEST。
- 7日間の予想ではLSTMが良好。
- データの量と質にに大きく依存する。
Deep Machine Learning-Based Water Level Prediction Model for Colombo Flood Detention Area
- DNN, LSTM
- Daily rainfall, Daily evaporation, minimum daily temperature, maximum daily temperature, daily relative humidity at daytime/nighttime, and daily average wind speed
- LSTMの方が良好
- Random Forest, XGBoost, RNN, BiLSTM, CONV1D-BiLSTM
- XGBoostがBEST
- 線形回帰 (LR)、相互作用回帰 (IR)、ロバスト回帰 (RR)、ステップワイズ回帰 (SR)、サポートベクター回帰 (SVR)、ブーストツリーアンサンブル回帰 (BOOSTER)、バッグドツリーアンサンブル回帰 (BAGER)、XGBoost、ツリー回帰 (TR)、ガウス過程回帰 (GPR)
- 29年間の日降水量を使用。
- 自己相関関数によるラグタイムを考慮した4つの入力データ(シナリオ)で試行
- 過学習対応のため、Lossをearly stoppingに使用
- 異なるフォールド(3、5、7、9)を使用
- GPRがBEST
- 精度を高めるには長いラグデータが必要
- 過学習の問題は通常、小さなデータセットを使用してモデルを開発するときに発生するが、1990年から2019年までの日次データの長さはそのような問題を回避するのに許容できる長さであった
- 不確実性分析を実施
Modeling the fluctuations of groundwater level by employing ensemble deep learning techniques
- DL, アンサンブルDL
- 4 つの井戸の地下水位から残りの井戸の地下水位の予測
- 最大 20 日前の地下水位記録の時系列を入力として5つの井戸の翌日の地下水位を予測
- 合計レコード数 276、2017 年 10 月 20 日から 2018 年 5 月 1 日までトレーニングセット (70%、194 レコード) 、2018 年 5 月 2 日から 2018 年 7 月 22 日までテストセット(30%、82 レコード)
- EDLの方が良好
0 件のコメント:
コメントを投稿