1. 유클리디안 거리란?

유클리디안 거리(Euclidean Distance)는 두 점 사이의 “직선 거리"를 측정하는 수학적 척도입니다. 이는 우리가 일상적으로 사용하는 “직선 거리” 개념과 동일하며, 가장 간단하고 직관적인 거리 계산 방법 중 하나입니다. 이 개념은 피타고라스의 정리에서 유래하며, 2차원뿐만 아니라 n차원 공간에서도 적용됩니다.

Table of Contents


2. 유클리디안 거리 공식

두 점 $𝑃(𝑥_1, 𝑦_1)$와 $𝑄(𝑥_2, 𝑦_2)$ 사이의 유클리디안 거리는 다음과 같이 계산됩니다:

$$d(P,Q) = \sqrt{(x_2 - x_1)^2 + (y_2 - y_1)^2}$$

일반화된 공식 (n차원 공간)

n차원 공간에서 두 점 $P(x_1, x_2, …, x_n)$과 $Q(y_1, y_2, …, y_n)$ 사이의 유클리디안 거리는 다음과 같습니다:

$$d(P,Q) = \sqrt{\sum\limits_{i=1}^n (x_i - y_i)^2}$$


3. 유클리디안 거리의 특징

  1. 직선 거리: 두 점 사이의 최단 거리를 측정합니다.
  2. 대칭성: $d(P, Q) = d(Q,P)$ (두 점 사이의 거리는 방향에 영향을 받지 않음).
  3. 비음성성: 거리는 항상 0 이상이며, $d(P, Q) = 0$은 두 점이 같은 경우입니다.
  4. 직관적 이해: 실생활에서 가장 익숙한 거리 개념입니다.

4. 유클리디안 거리의 사용 사례

1) 데이터 분석

유클리디안 거리는 데이터의 유사성을 측정하는 데 사용됩니다. 예를 들어, 클러스터링 알고리즘(예: K-평균)에서 데이터 포인트 간 거리를 계산하여 유사한 그룹으로 묶습니다.

2) 컴퓨터 비전

이미지 픽셀 값을 벡터로 변환한 후, 유클리디안 거리를 사용해 두 이미지의 유사도를 측정합니다.

3) 추천 시스템

유클리디안 거리를 사용하여 사용자 선호도를 벡터로 표현하고, 유사한 선호도를 가진 사용자 간 거리를 계산하여 추천 항목을 도출합니다.

4) 로봇 공학

로봇이 특정 좌표에서 목표 지점까지 이동해야 할 때, 유클리디안 거리를 활용하여 최단 경로를 계산합니다.


5. 유클리디안 거리의 한계

  1. 스케일 문제
  • 각 축의 값 범위가 다를 경우(예: 키와 몸무게), 특정 축이 결과에 과도한 영향을 줄 수 있습니다. 이를 방지하려면 데이터를 정규화(Scaling)해야 합니다.
  1. 고차원 공간에서의 비효율성
  • 차원이 증가하면 거리 계산의 효율성이 떨어지며, 모든 점이 유사한 거리를 가지는 “차원의 저주(Curse of Dimensionality)” 문제가 발생할 수 있습니다.
  1. 비선형 데이터 처리 한계
  • 데이터 간 관계가 비선형적일 경우, 단순 유클리디안 거리로는 유사성을 제대로 측정하지 못할 수 있습니다.

6. 유클리디안 거리 계산 예제

2차원 공간에서

점 $A(2, 3)$와 $B(5,7)$의 유클리디안 거리:

$$ d(A, B) = \sqrt{(5 - 2)^2 + (7 - 3)^2} = \sqrt{3^2 + 4^2} = \sqrt{9 + 16} = 5 $$

3차원 공간에서

점 $A(1, 2, 3)$과 $B(4, 6, 8)$의 유클리디안 거리:

$$ d(A, B) = \sqrt{(4 - 1)^2 + (6 - 2)^2 + (8 - 3)^2} = \sqrt{3^2 + 4^2 + 5^2} = \sqrt 50 \approx 7.07 $$


7. 유클리디안 거리와 다른 거리 척도 비교

거리 척도설명특징
유클리디안 거리두 점 간의 직선 거리직관적이고 간단한 거리 계산
맨해튼 거리수직 및 수평 선에 따라 이동한 거리도시 거리처럼 직선 이동 제한
코사인 유사도두 벡터 간의 각도 기반 유사성 측정방향이 중요한 겨우 유용
마할라노비스 거리데이터 분포를 고려한 거리통곚거 분석에서 자주 사용

결론

유클리디안 거리는 가장 단순하면서도 강력한 거리 측정 방법 중 하나입니다. 특히 데이터 간의 유사성을 빠르게 계산하고, 다양한 애플리케이션에서 유용하게 사용됩니다. 그러나 데이터의 스케일이나 고차원 문제를 다룰 때는 추가적인 전처리나 다른 거리 척도와의 조합이 필요할 수 있습니다.