Learning Sleep Quality from Daily Logs
Learning Sleep Quality from Daily Logs(KDD2019 Applied Track Papers)を読んでまとめました。
解釈間違い等ある時がありますので、その場合指摘いただけると助かります。
目次
背景と概要
背景
概要
- 不眠症患者の睡眠効率予測フレームワーク
- 腕に巻くようなバンド状のデバイスから下記の様な様々な種類のデータが取れる。
- 睡眠の記録
- 日々の活動
- 人口統計(demographics)
- 今回の予測モデル
- 欠損値の補完:Improved Generative Adversarial Imputation Networks (Imp-GAIN:GANベース)
- 個々のユーザーの睡眠効率予測:interpretable LSTM-Attention (LA Block) neural network model
- 2段階でLA Blockを活用
- 不眠症患者の個別治療が可能
- 高い不眠のポテンシャルを持つユーザーのランク付け:Pairwise Learning-based Ranking Generation (PLRG)
- 全4段階あり、LSTMやDeep Forest、XGBoostを活用
- 誰のリスクが高いのかを把握できる
- データ
- 50人参加者がFitbitで計測
- 期間:6週間
- 本手法は他のノイズがあり、不完全な時系列の人間活動データの分析に応用できる余地がある。
MISSING DATA IMPUTATION
概要
- ここから欠損値データとそれ以外に分け、欠損値の補完が満たすべき条件を示すと以下の様になる。
- 本論文では、GANベースのGenerative Adversarial Imputation Nets (GAIN)が採用されているが、採用理由として以下があげられている。
- 上記を踏まえて、今回の欠損値補完では最後に補正(shiftとscale)する関数を使い以下のように補完している
評価
- 元が欠損でないデータを使い、以下の補完方法で評価(MAE)している。
- Imp-GAIN
- ori-GAIN(補正関数なし)
- User Avg:平均値埋め
- KNN
- データ分割
- 学習データ:ランダムに80%
- testデータ:残り20% 結果は以下となっている。
Sleep Efficiency Prediction
概要
- 今回の分野において、説明力は精度と同じくらいに重要である。
- この予測で興味があるのが、先週までのデータを使って、明日等の近い未来の睡眠効率を予測する事となる。
- 本論文では、LSTMにattentionを加える事で説明力を担保している
- モデル構成:2段
- 1段目:上述のLSTM-Attention(LA) block
- 8つの睡眠に関する特徴量
- 6つの活動に関する特徴量
- 2段目:LA blockのアンサンブル
- demographicsはここで活用
- 1段目:上述のLSTM-Attention(LA) block
評価
- 元が欠損でないデータを使い、以下の補完方法で評価(MAE)している。
- Linear Regressor
- KNN Regressor
- LASSO Regressor
- Random Forest Regressor
- Basic RNN
- Basic LSTM
- LA block1段目のみのモデル
- 2段モデル
- データ分割
- 学習データ:前半80%
- testデータ:残り20%
Insomnia Ranking
概要
- 以下の問題を考える
- Insomnia Rankingのゴールは特徴量の差をべースとした relative ranking relationを推定する事にある。
- 今回適用するPairwise Learning-based Ranking Generation (PLRG)は4段階に分かれている
- Ranking Pair Construction
- 2人のユーザーの関係性を考慮したuser-pair featureを生成
- Feature Representation Learning
- LSTMを使用
- 以下の変数を生成
- learning sequential features
- 観測するデータの時系列的な連続性を表現
- interaction features
- 睡眠効率と他の特徴量の相互作用を表現
- learning sequential features
- Ranking Relation Prediction
- Deep ForestとXGBoostのcombine
- Ranking List Generation
- Ranking Pair Construction
評価
- 以下の手法を評価している
- RankNet
- LambdaMART
- LSTM-R
- user-pair featureを使用しない
- Deep ForestとXGBoostを使用しない
- LSTM-B
- Deep ForestとXGBoostを使用しない
- DF-XGB
- learning sequential features、interaction featuresを使用しない
- PLRG
参考資料
Learning Sleep Quality from Daily Logs KDD 2019 | Learning Sleep Quality from Daily Logs