Blog
조건부 평균과 분산(Conditional Mean and Variance) 본문
조건부 평균
$$ \begin{equation*} E[X|A] = \begin{cases} \text{discrete RV:} & \sum_{x_k \in A} x_k P(x_k|A) \\[2ex] \text{continuous RV:} & \int_{x \in A} x f(x|A) dx \end{cases} \end{equation*} $$
조건부 평균이란 표본 공간의 조건에 대한 확률 변수의 평균을 의미한다.
여기서 조건이란 확률 변수 X의 축소 또는 제한된 범위를 나타내는 집합이라고 생각할 수 있다.
$$ P(x_k|A) = \frac{P(x_k \cap A)}{P(A)} = \frac{P(x_k)}{P(A)} $$
이산 확률 변수일 경우 조건부 확률을 위와 같이 표현할 수 있지만, 연속 확률 변수 일 경우에는 확률 밀도 함수 값이 확률이 아니기 때문에 누적 분포 함수를 추가로 이용해서 구할 수 있다.
연속 확률 변수의 조건부 평균 계산
연속 확률 변수 X, A = { X ≤ a} 일 때 조건부 평균 E[X|A]를 계산하는 하는 방법을 알아보자
$$ E[X|A] = \int_{x \in A} x f(x|A) dx $$
연속 확률 변수의 조건부 평균을 구하는 식이다. 우리는 f(x|A) 값을 바로 구할 수 없기 때문에, 다른 식으로 변형하여 계산해야한다.
$$ \begin{align*} & f(x|A) = \frac{dF(x|A)}{dx}\\ & = \frac{d}{dx} P(X \leq x | X \leq a)\\ & = \frac{d}{dx} \frac{P(X \leq x \cap X \leq a)}{P(X \leq a)} = \begin{cases}
- \frac{d}{dx} \frac{P(X \leq x)}{F(a)} = \frac{f(x)}{F(a)}, & \text{for } x \leq a \\[2ex]
- \frac{d}{dx} \frac{P(X \leq a)}{P(X \leq a)} = 0, & \text{for } x > a \end{cases} \end{align*} $$
확률 밀도 함수를 누적 분포 함수의 x에 대한 미분으로 표현할 수 있다. 범위에 대한 확률로 바꾸어 주면 분자는 x와 a의 범위의 교집합에 해당하는 확률, 분자는 a의 범위에 대한 확률로 정리할 수 있다.
여기서 x의 범위에 따라 계산하는 식이 달라진다.
- x가 a보다 작을 경우 분모가 F(a)가 되어 f(x)/F(a)로 표현할 수 있다.
- x가 a보다 클 경우 분모가 P(X ≤ a)가 되어 1 이라는 상수가 되고 이를 미분하면 0이된다.
이처럼 연속 확률 변수에 대한 조건부 확률을 구할 수 있고, 이를 이용해 아래와 같은 식으로 변형하여 조건부 평균을 구할 수 있다.
$$ E[X|A] = \int_{x \in A} x f(x|A) dx = \int_{x \leq a} x \frac{f(x)}{F(a)} dx $$
조건부 분산
$$ Var[X|A] = E[X^2|A]-E[X|A]^2\\ $$
조건부 평균을 이용해 조건부 분산를 정의 할 수 있다.
분산을 구할 때 쓰이던 기댓값이 조건부 평균(기댓값)으로 대체됐다고 생각하면 이해하기 수월하다.
참고자료
https://www.youtube.com/watch?v=vUZdV81Ycpw&list=PL4KjArv2DnjAaEjXXUJnVNeuli32JPQ-A&index=12
'Math' 카테고리의 다른 글
지수 분포(Exponential Distribution) (0) | 2024.11.18 |
---|---|
포아송 분포(Poisson Distribution) (0) | 2024.11.18 |
기하 분포(Geometric Distributions) (0) | 2024.11.18 |
확률변수의 평균과 분산(Mean and Variance of Random Variable) (0) | 2024.11.18 |
전체확률의 법칙(Law of Total Probability) (1) | 2024.11.18 |