評価と類似度 公開日:2020年1月19日 Python (4)評価と類似度 クラスタリングは教師なし学習であるため、性能の評価が難しい。 うまくグルーピングできているかどうかを推し量るのが、類似度である。 特徴量の類似度に基づいてデータをグルーピングするのがクラスタリングである。 類似しているとは、距離が近いことを意味し、二乗の総和(またはその平方根)を算出し、それが小さければ小さいほどクラスタ内の点が近くに寄せ集まっていることを意味する。 クラスタリングが上手く行われていると評価できる。 関連記事 k近傍法(k-NN) 分類法スケーリング分類モデルの評価ディープラーニング誤差逆伝播法(バックプロパゲーション)[単回帰分析] 投稿ナビゲーション k-means法(k平均法)エルボー法