Learning from Weak-Label Data: A Deep Forest Expedition
Learning from Weak-Label Data: A Deep Forest Expedition(AAAI2020 Accepted paper)を読んでまとめました。
解釈間違い等ある時がありますので、その場合指摘いただけると助かります。
目次
背景と概要
- マルチラベル分類を行う場合に、学習データで全てのラベルにちゃんとラベルづけがされていない等不完全なデータとなっている場合があり、その解決方法の一つとしてWeak-label learningがある
- 本論文ではWeak-label learningの手法として、LC Forest:Deep Forestをベースとしたアルゴリズムを提案している。
- Deep Forest:決定木系のアルゴリズムの一つであるrandom forestを多層化
- 主要な要素は以下となる。
- Label Complement Structure:アノテーションされている弱ラベル行列を補足するラベルの埋め込み
- 以下のようなデータで検証されていた。
- Gene Function Analysis Task
- Text Categorization Task
- Scene Classification Task
- Medical Natural Language Processing Task
Weak-label learning
概要
- 弱教師ありマルチラベル学習の一つ。
問題の定義
以下の空間を考える。
今、以下の弱ラベルのtraining setが与えられているとする。
Weak-label learningでは以下の関数fを求める事を目的とする。
アルゴリズム(LCForest Method)
ラベルの補足:Label Complement Structureの基本構造
- LCForestでは、Label Complement Structureがアノテーションされている弱ラベル行列を補足するラベルとして、cascade forestに埋め込まれる。
- t層目のcascadeにおいて、training data setである Dt = { Xt, Yt} をcross validationで処理する。
- それぞれのfoldにおいて、下図のようにt層目のrandom forestがtraining-foldのデータを学習し、test-foldのデータを予測する。
- test-foldのi番目にあたるサンプルのk番目のラベルについて、j番目のrandom forestによる予測がpositiveの場合、
- それぞれのfoldにおいて、下図のようにt層目のrandom forestがtraining-foldのデータを学習し、test-foldのデータを予測する。
- i番目のサンプルのk番目のラベルのt+1層目のラベルは以下の式で表される。
- j番目の予測ラベルとオリジナルのラベルのいずれかが1ならば1の要素を持つ行列をrandom forestのモデルの数分作り、その総乗を取っている。
LCForestでのLabel Complement Structure導入
- LCForestでは以下のように導入されている。
- 初期状態:全ての成分は0
- それぞれのクラスにおいて、予測確率がcascadeの中の1つの層で閾値θを超えた場合その成分は1となり、その後はずっと1のままとなる。
- 最終的に各成分は以下の式で表され、アルゴリズムは下図のようになる。
LCForestの全体構成
※アルゴリズムからでは、新たに結合した特徴量の削除を次の層で行っていないため、学習を進める毎にデータが大きくなっているのではないかと思われる。
検証
- 画像、言語等以下のタスクにおいて検証されていた。
- 1.Gene Function Analysis Task
- 酵母の遺伝子機能クラス(14クラス)を予測する
- 2.SIAM Text Mining Competition (TMC) 2007
- Text Categorization Task
- 3.Scene Classification Task
- a multi-label semantic scene classification task
- 4.Medical Natural Language Processing Task
- 1.Gene Function Analysis Task
- 比較アルゴリズムは以下となる。
- ML-kNN
- RF-PCT
- DBPNN
- WELL
参考文献
Learning from Weak-Label Data: A Deep Forest Expedition