評価と類似度 公開日:2020年1月19日 Python (4)評価と類似度 クラスタリングは教師なし学習であるため、性能の評価が難しい。 うまくグルーピングできているかどうかを推し量るのが、類似度である。 特徴量の類似度に基づいてデータをグルーピングするのがクラスタリングである。 類似しているとは、距離が近いことを意味し、二乗の総和(またはその平方根)を算出し、それが小さければ小さいほどクラスタ内の点が近くに寄せ集まっていることを意味する。 クラスタリングが上手く行われていると評価できる。 関連記事 汎化・高バリアンス・高バイアス誤差逆伝播法(バックプロパゲーション)ディープラーニングPython入門講座予測したい変数(目的変数)混同行列(Confusion Matrix) 投稿ナビゲーション k-means法(k平均法)エルボー法