次元削減は、教師なし学習の代表例の一つ。

次元削減は、多次元の特徴を、できるだけ元の情報を保持したまま低次元の特徴に落とすもので、得られた特徴は元の特徴とは異なる。

人間が可視化しやすいように多次元のデータ圧縮をした場合や、情報を圧縮するために自然言語処理などの分野で頻繁に使われている。

(1)主成分分析とはなにか。

主成分分析とは、PCA(Principal Component Analysis)と呼ばれる。

主成分分析は、多次元の相関関係にある特徴を、低次元の相関の少ない特徴に落とす手法である。

高次元データにおいて、分散が最大となる方向(主成分)を見つけ出し、元の空間よりも低次元な新しい空間にデータを射影する。

次元を落とすことで、複雑なデータをわかりやすい形にまとめて見ることができる。