評価と類似度 公開日:2020年1月19日 Python (4)評価と類似度 クラスタリングは教師なし学習であるため、性能の評価が難しい。 うまくグルーピングできているかどうかを推し量るのが、類似度である。 特徴量の類似度に基づいてデータをグルーピングするのがクラスタリングである。 類似しているとは、距離が近いことを意味し、二乗の総和(またはその平方根)を算出し、それが小さければ小さいほどクラスタ内の点が近くに寄せ集まっていることを意味する。 クラスタリングが上手く行われていると評価できる。 関連記事 標準化と正規化過学習と未学習k近傍法(k-NN) 分類法分類モデルの評価ニューラルネットワーク様々な分類手法 線形SVM・非線形SVM 投稿ナビゲーション k-means法(k平均法)エルボー法