過学習と未学習 公開日:2020年1月19日 Python 学習データを用いた場合には、高い精度が出るのに、未知のデータでは精度が出ない状態を過学習(Overfitting)と言う。 過学習は、学習データに対して、過度に適合した結果である。 練習問題は合格点だが、実際のテストでは不合格といった具合だ。 ★モデル評価のため、データセットを学習データとテストデータに分ける。 これは過学習が発生していないかを確認する非常に有効な方法だ。 逆に学習データ、テストデータの両方で制度が出ない状態を未学習(Underfitting)と言う。 関連記事 ロジスティック回帰クラスタリング汎化・高バリアンス・高バイアス最小二乗法k近傍法(k-NN) 分類法多項式 投稿ナビゲーション 多項式汎化・高バリアンス・高バイアス