k-分割交差検証とはトレーニングデータをk分割(データを”k”個に分ける)
k個から1個引いた個数を学習用に使用し、
引いた1個はテストに使用する
10個に分割すれば9個を学習用1個をテスト用にするという事
これによりk個の学習モデルとk個の性能テストができるので
k回の学習とテストを行い、それらの平均を算出する
これによってホールドアウト法よりバリアンス(過学習)を低く抑えられる
通常kの値は10前後になり、データが多い場合はkの値を増やした方が良い
但し、k値を大きくし過ぎるとバリアンス(過学習)が高くなり、
逆にk値を低くしすぎるとバイアス(学習不足)が高くなる可能性がある
コメントを残す