初めまして、データ解析初心者です。クロスバリデーションについて質問があります。 クロスバリデーションには、LOOCV、k分割、ブートストラップ等いろいろありますが どのクロスバリデーションを使えばもっともよくモデルの性能を評価できますか? モデルの性能評価に、どの方法を使えば良いかわからず困っております。 それとも単純に、サンプルの数から計算コストを考えてどの方法を使うか決めるのでしょうか。お手数ですがご回答いただけるとうれしいです。どうぞ宜しくお願い致します。

こむぎこ
ご質問いただきありがとうございます。
"モデルの性能" として何を評価するのかによりますが、たとえば、PLSの成分数などのハイパーパラメータを決めるためのモデルの評価をするときには、5-fold クロスバリデーションを使えばまず問題ありません。
あと、LOOCVでは特にサンプル数が多いときにクロスバリデーションの効果が出ないため使わないほうが望ましいです。

View more