State Space Models for Forecasting Water Quality Variables
State Space Models for Forecasting Water Quality Variables(KDD2018 Applied Track Papers)を読んでまとめました。
解釈間違い等ある時がありますので、その場合指摘いただけると助かります。
目次
背景と概要
- クルマエビの養殖のような水産養殖において、水質は生産量や品質に非常に重要な要素となっており、その正しい推定は重要。
- 溶存酸素(DO)は主要な要素であり、その低下により生育が不十分になる等の影響を受ける事がある。
- 光合成等の影響を受けるので、昼多い・夜少ない等といった状況になる
- 溶存酸素(DO)は主要な要素であり、その低下により生育が不十分になる等の影響を受ける事がある。
- 実際のデータはセンサーによるノイズの乗ったものであるため、その要素を考慮した値の推定が必要となる
- 従来のアプローチとして、ecosystem-based modelやneural network等を用いたdata-driven modelがあるが、今回のものはそれらとは異なる新しいアプローチ
- 今回のモデルでは線形ガウスモデルと非線形ガウスモデル両方で検証されており、その推定にKalman Filterやunscened Kalman Filterが用いられている
Model formulation
論文で考えているものは、下図のようなDOの推移。
データは以下より構成されている
- oscillatory function
- 日次で起こる振動
- stochastic offset
- 様々な要因からの影響
- 例
- 藻類の濃度
- 外部からの入力(水の入れ替え等)
- oscillatory function
- 一般式は正弦曲線を用いて以下で表される
- 酸素濃度はセンサーを用いて測られている。そのため各々の時刻tにおいて、ノイズの乗ったセンサーによる測定結果が出力されている。
- 上記の変数は計測されず、計測されるにより表現される。
→これらの変数はlatent vectorで統合される - 今回は線形ガウスモデルと非線形ガウスモデルを用いて検証を行っていた。
線形ガウスモデル
- state noise processおよびmeasurement noiseがガウス分布に従う場合に(1)式は以下のように書ける。
- 今回は振幅が時間変化していない仮定となっている。
latent vectorは状態空間形式において、およびの1階および2階時間微分を使って以下のように表される
は以下のようになり、(2)および(3)の推定にKalman Filterが使われている。
非線形ガウスモデル
線形ガウスモデルでは定数と扱われていたが時間変化する場合、以下のように表し、推定にunscened Kalman Filterが用いられている。
結果
データセット
- 15分毎に取得した45日間分のDOおよびpHデータを2種類(4320サンプル)
- 0.18haの大きいgrow-out pond(一部データ点が無い)
- 0.022haの小さいnursey pond(外れ値が一部存在)
- 今回は最後の5日を学習に使わず、推定されている。
結果
- MAPEより、本論文では線形ガウスモデルの方が良いパフォーマンスを出していると結論付けている。
- 考察:ただ、そんなに大きな差ではない?
まとめと考察
- 酸素濃度等、周期性を持つ時系列データに対して状態空間モデルを適用。
- oscillatory functionとstochastic offsetの成分に分け式を定義
- oscillatory functionの仮定に基づいて、モデルを使い分け結果の比較を行っている
- MAPEから線形ガウスモデルの方がパフォーマンスが良いと結論付けられている
参考文献
State Space Models for Forecasting Water Quality Variables