主成分分析を行うと、主成分間が無相間になりますが、無相間になるメリットは何でしょうか?

ご質問ありがとうございます。
メリットの一つは、より多くの情報を少ない成分数で表現できるということです。ある変数と別の変数とが相関しているとは、それらの二つの変数のもつ情報が重複していることを意味しますす。重複している情報は、どちらか一方で構わないはずですので、もったいないです。主成分分析では、主成分同士が無相間ですので、上のような情報の重複は存在しません。よって、より少ない成分で多くの情報を表現できます。
もう一つのメリットは、主成分分析の後に回帰分析やクラス分類を行う際に、解析しやすいということです。特に入力変数間に強い相関があると、例えば回帰分析の際に、回帰係数の値の絶対値が大きくなる傾向があり、適切なモデルとはいえません。事前に主成分分析を行うことで入力変数が無相関になると、そのような心配なく解析できます。

View more

Ask @univprofblog1:

About 大学教授:

データ解析周辺、日頃のできごとからデータ解析につながる種のようなもの、広く研究・教育などについて書いています。

http://univprof.com/

#データ分析 #データ解析 #ビッグデータ #機械学習 #データマイニング #教育 #大学 #子育て