過学習と未学習 公開日:2020年1月19日 Python 学習データを用いた場合には、高い精度が出るのに、未知のデータでは精度が出ない状態を過学習(Overfitting)と言う。 過学習は、学習データに対して、過度に適合した結果である。 練習問題は合格点だが、実際のテストでは不合格といった具合だ。 ★モデル評価のため、データセットを学習データとテストデータに分ける。 これは過学習が発生していないかを確認する非常に有効な方法だ。 逆に学習データ、テストデータの両方で制度が出ない状態を未学習(Underfitting)と言う。 関連記事 Python入門講座回帰k-means法(k平均法)k近傍法(k-NN) 分類法汎化・高バリアンス・高バイアス教師あり学習②(分類) 投稿ナビゲーション 多項式汎化・高バリアンス・高バイアス