マハラノビス距離とは値とデータ平均値の距離のこと
通常ユークリッド距離を使いそうだが
異常度にユークリッド距離を使うともともとバラつきの大きい変数の
寄与が大きく、バラつきの小さい変数の寄与が小さくなるので適していない
これに対応するには各変数の距離を分散で割る
これをマハラノビス距離と呼びぶ
マハラノビス距離の計算方法
データx
, y
に対して、与えられた平均値mean
、共分散行列cov
〇マハラノビス距離
〇mean
とのユークリッド距離
の計算結果
マハラノビス距離の方がユークリッド距離と比べて
分散が大きい変数の距離への寄与が小さくなる
コメントを残す