距離

距離というと一般的には直線距離(ユークリッド距離)のことを指していることが多いです。
しかし、ユークリッド距離の他にも多くの距離が存在します。

そもそも距離とは
x=y \Rightarrow d \left(x,y\right) =0
d \left(x,y\right) = d \left(y,x\right)
d \left(x,y\right) + d \left(y,z\right) \geq d\left(x,z\right)
が成り立つものを距離といいます。
さらに詳しく知りたい方はWikipediaなどを参照してください。

パターン認識などでよく用いられる距離を紹介していきたいと思います。

ユークリッド距離

d \left(x,y\right) = \sqrt{\left(x_{1} -y_{1} \right)^{2} + \left(x_{1} -y_{1} \right)^{2} }
言わずと知れた距離の代表格です。
名前を知らない人でも、何度か使ったことはあるはずです。

マハラノビス距離

d \left(x,y\right) = \sqrt{ \left( \vec{x} - \vec{\mu} \right)  \Sigma^{-1} \left(\vec{x}-\vec{\mu} \right) }
\Sigma:共分散行列
\vec{\mu}:平均

このマハラノビス距離はあるデータの分散や平均という尺度水準によらない距離です。
そのため、統計学などでよく用いられます。
共分散行列が単位行列の場合、ユークリッド距離と一致します。
このマハラノビス距離を見たことがない方でも、もしかしたら一度は見ているかもしれません。
なぜなら、このマハラノビス距離は正規分布の式の中にいるからです。

f \left(x\right) = \frac{1}{ \sqrt{2 \pi } \sigma} \exp \left(- \frac{\left(x-\mu\right)^{2}}{\sigma ^{2} }\right)
\sigma\Sigmaとみれば、全く同じであることが分かります。


以上で挙げた距離のほかにも、マンハッタン距離などの多くの距離が存在します。
それぞれの距離において面白い性質があります。

大切なのは、距離にはいろいろ種類があるという点です。
これから距離と聞いた時はその距離はどのような距離なのかを考えてみてください。