学習データを用いた場合には、高い精度が出るのに、未知のデータでは精度が出ない状態を過学習(Overfitting)と言う。

過学習は、学習データに対して、過度に適合した結果である。

練習問題は合格点だが、実際のテストでは不合格といった具合だ。

★モデル評価のため、データセットを学習データとテストデータに分ける。

これは過学習が発生していないかを確認する非常に有効な方法だ。

逆に学習データ、テストデータの両方で制度が出ない状態を未学習(Underfitting)と言う。