Multivariate Time Series Missing Data Imputation Using Recurrent Denoising Autoencoder

Multivariate Time Series Missing Data Imputation Using Recurrent Denoising Autoencoder

Abst
 LSTMとDAEで消失データを埋める。

1. Inrto
 多変量の時系列データを考える。データの紛失は以下の理由が考えられる。MCAR:ランダムに消失して、周辺にも残ってない。MAR:ランダムに消失してるが、観測に依存している。MNAR:観測にも観測できていないところにも依存している。
 たくさんの研究で消失データの帰属が研究されている。LSTMやGRUには問題がある。LOCFは変数間の関係を無視するし、その性能はサンプリング周波数が低いと悪化する。Decay modelは過去のデータに依存するとするモデルだ。
 我々が提案するモデルは、LSTMとDAEに依存する。Bi-LSTMをエンコーダに利用し、変数間の相関を学習する。これは全ての時系列で行い、各時間で表現を取得する。0で適当に埋めて、それを復元させる。

 

感想
なんかデータを人工的に作ってるのは残念だな。(そりゃそうか。)
各々エンコードして、潜在変数に落として、個々に復元していく。

 

単語
ubiquitous:至る所にある
Multivariate:多変量
imputation:帰属
deteriorate:悪化させる
corrupt:破損した