Blog
지수 분포(Exponential Distribution) 본문
정의
$$ \text{pdf}: f(x) = \lambda e^{-\lambda x}, \quad \text{cdf}: F(x) = \int_{0}^{t} \lambda e^{-\lambda x} dx = 1 - e^{-\lambda t} \\ \lambda \geq 0 \\ mean = \frac{1}{\lambda}, \quad variance=\frac{1}{\lambda^2} $$
사건이 서로 독립적일 때, 일정 시간 동안 발생하는 사건의 횟수가 포아송 분포를 따른다면, 다음 사건이 일어날 때까지 대기 시간은 지수분포를 따른다.
지수 분포의 중요한 파라미터는 $\lambda$(단위 시간내 평균 사건 발생횟수)로 포아송 분포의 $\lambda$와 동일한 값이다.
포아송 분포와의 관계
단위시간 1 당 평균이 $\lambda$인 포아송 분포가 있을 때, 단위시간를 t로 바꿔줄 경우 단위시간 t당 평균은 $\lambda t$가 된다.
이러한 파라미터를 가지고 아래와 같이 포아송 분포로 표현할 수 있다.
$$ P(X = k) = \frac{(\lambda t)^k e^{-\lambda t}}{k!} \text{, for } t \text{ interval} $$
포아송 분포에서 t시간안에 사건이 일어날 확률은 아래와 같이 구할 수 있다.
$$ \begin{align*}P(X \geq 1) &= 1 - P(0) \\&= 1 - e^{-\lambda t}\end{align*} $$
마지막으로 정리된 식은 지수분포의 CDF와 동일하다는 것을 알 수 있다.
포아송 분포는 일정 시간 간격 동안 발생하는 사건의 수를 모델링하고, 지수분포는 연속적인 시간에서 한 사건과 다음 사건 사이의 시간 간격을 모델링한다.
포아송 과정에서 사건들 사이의 시간 간격은 지수분포를 따른다.
포아송 분포에서 t 시간 내에 적어도 하나의 사건이 일어날 확률과 지수 분포에서 첫 번째 사건이 t시간 이전에 발생할 확률이 동일하다는 것을 알 수 있다.
기억 상실 특성
지수 분포는 이전의 조건이 현재 확률에 영향을 미치지 않는 기억상실 특성을 가진다.
어떤 시스템이 시간 임의의 시간 t 까지 살아있을 때, 추가적으로 T 시간만큼 더 살아 있을 확률을 구하고 싶다고 해보자.
해당 확률은 조건부 확률로 아래와 같이 나타낼 수 있다.
$$ P(X > t + T | X > t) = \frac{P(X > t + T \cap X > t)}{P(X > t)} $$
여기서 누적 분포 함수를 사용하여 다시 정리하면 아래와 같이 정리 할 수 있다.
$$ \begin{align*}&= \frac{P(X > t + T)}{P(X > t)} = \frac{1 - F(t + T)}{1 - F(t)} \\[10pt]&= \frac{1 - (1 - e^{-\lambda(t+T)})}{1 - (1 - e^{-\lambda t})} = e^{-\lambda T}\end{align*} $$
이 값을 지수분포의 CDF함수를 통해 아래와 같이 표현할 수 있다.
$$ 1-F(T)=P(X>T) $$
마지막으로 정리된 식을 보면 이전 조건에 해당하는 t가 사라진 것을 볼 수 있다. 즉, 이전 조건이 현재 확률에 영향을 미치지 않는다는 것을 알 수 있다.
지수 분포 활용 예시
배틀로얄 게임에서 플레이어들의 평균 생존 시간은 10분이고 지수분포를 따른다고 한다.
어떤 플레이어가 20분 넘게 살아남을 확률을 구해보자.
평균이 10분이기 때문에 $\lambda$ = 1/10이 된다.
찾아낸 $\lambda$를 지수함수의 CDF에 적용해 20분 넘게 생존한 확률을 아래와 같이 구할 수 있다.
$$ P(X>20) = 1-F(20)\\ = 1 - (1-e^{-2})\\ =e^{-2}\approx0.135 $$
약 13.5퍼센트 확률로 20분 넘게 생존할 수 있다고 예측할 수 있다.
참고자료
'Math' 카테고리의 다른 글
가우시안 분포(Gaussian Distribution) (1) | 2024.11.18 |
---|---|
포아송 분포(Poisson Distribution) (0) | 2024.11.18 |
기하 분포(Geometric Distributions) (0) | 2024.11.18 |
조건부 평균과 분산(Conditional Mean and Variance) (0) | 2024.11.18 |
확률변수의 평균과 분산(Mean and Variance of Random Variable) (0) | 2024.11.18 |