@univprofblog1

大学教授

Ask @univprofblog1

Sort by:

LatestTop

Previous

主成分分析 (principal component analysis) でもpartial least squares (PLS) でも主成分の間の関係は無相間です。これらの違いは何でしょうか?

ご質問ありがとうございます。
おっしゃる通り、PCAでもPLSでもそれぞれすべての主成分間は無相関です。PCAとPLSとの違いは、まずPCAは説明変数のみで実行できるのに対し、PLSでは説明変数に加えて目的変数も必要です。そして、PCAでは主成分の分散が大きくなるように主成分を抽出するのに対し、PLSでは主成分と目的変数との共分散が大きくなるように主成分を抽出します。
このようにPCAでは説明変数の情報量をなるべく大きく表現できる主成分を得ることが目的であり、PLSでは目的変数の情報量をなるべく大きく表現できる主成分を得ることが目的であり、PCAとPLSとでは目的が異なります。
Liked by: 大学教授

主成分分析を行うと、主成分間が無相間になりますが、無相間になるメリットは何でしょうか?

ご質問ありがとうございます。
メリットの一つは、より多くの情報を少ない成分数で表現できるということです。ある変数と別の変数とが相関しているとは、それらの二つの変数のもつ情報が重複していることを意味しますす。重複している情報は、どちらか一方で構わないはずですので、もったいないです。主成分分析では、主成分同士が無相間ですので、上のような情報の重複は存在しません。よって、より少ない成分で多くの情報を表現できます。
もう一つのメリットは、主成分分析の後に回帰分析やクラス分類を行う際に、解析しやすいということです。特に入力変数間に強い相関があると、例えば回帰分析の際に、回帰係数の値の絶対値が大きくなる傾向があり、適切なモデルとはいえません。事前に主成分分析を行うことで入力変数が無相関になると、そのような心配なく解析できます。
Liked by: 大学教授

前処理に関する質問で恐縮ですが… 1、データセットが工学的な実験の結果です。日によって少しずつ結果が変動するので毎回同じ標準の条件(説明変数)で実験して結果(目的変数)を見て、その後異なる条件で実験しています。例えば10日間x10回(異なる条件)+1回(標準の条件)実験した場合、この100回の結果はどのように規格化する方法がありますか?今は最初の標準結果に揃うように割り算しています。分散には正規性がありそうです。 2、データセットに説明変数が同じですが、やや異なる結果のデータがあります。どのように処理するのが良いでしょうか、平均でしょうか。 単純ですが資料が見つかりません…何卒お願いします

ご質問ありがとうございます。
詳細について理解していない中で恐縮ですが回答させていただきます。
1.
基本的には、すべてのサンプルを合わせて変数ごとにオートスケーリング
http://univprof.com/archives/16-07-18-4803187.html
が良いと思います。
ただ、日によって少しずつ結果が変わるとのことですが、条件が全く同じ(説明変数の値が全く同じ)でも、目的変数の値が日によって変わってしまうということでしょうか?
もしその場合は、オートスケーリングに少し工夫をしたほうが良いです。一つは、全体の平均ではなく標準の条件の値で引き、全体の標準偏差ではなく日ごとの標準偏差で割る、ということです。もしくは、すでにやられているように最初の標準結果に揃うように割ってから、全体のオートスケーリングをすることもありえます。
2.
この状況は、説明変数の値が同じにもかかわらず目的変数の値が異なるということでしょうか?
その場合、根本的な解決をするには、(既存の説明変数の値が同じで)目的変数の異なる値を説明できるような新たな説明変数を追加しなければなりません(たとえば室内温度とか湿度とか?)。新たな説明変数を追加できない場合は、同じ説明変数の値ごとに目的変数の値の平均値を代表値とすることになります。
Liked by: 大学教授

Related users

カーネル主成分分析の後に、主成分ベクトルの軸の意味づけを行うにはどうしたらよいでしょうか?

非線形モデルの解釈は難しいのが現状です。
線形の主成分分析では、各ローディングベクトルが各変数の重みのようなものですので、ローディングベクトルを見ることで解釈可能ですが、カーネル主成分分析は各ローディングベクトルが各サンプルの重みのようなものです。
そこで、一つの解釈の仕方として、ローディングベクトルの絶対値の大きいいくつかサンプルを見て、そのサンプルが特異的に値の大きい(もしくは負に大きい)変数を見るのはいかがでしょうか?
その変数が対象の主成分軸に効いていることになります。
Liked by: 大学教授

Language: English