Notice
Recent Posts
Recent Comments
Link
«   2025/05   »
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Tags
more
Archives
Today
Total
관리 메뉴

Blog

조건부 평균과 분산(Conditional Mean and Variance) 본문

Math

조건부 평균과 분산(Conditional Mean and Variance)

Nicator 2024. 11. 18. 18:33

조건부 평균

$$ \begin{equation*} E[X|A] = \begin{cases} \text{discrete RV:} & \sum_{x_k \in A} x_k P(x_k|A) \\[2ex] \text{continuous RV:} & \int_{x \in A} x f(x|A) dx \end{cases} \end{equation*} $$

조건부 평균이란 표본 공간의 조건에 대한 확률 변수의 평균을 의미한다.

여기서 조건이란 확률 변수 X의 축소 또는 제한된 범위를 나타내는 집합이라고 생각할 수 있다.

$$ P(x_k|A) = \frac{P(x_k \cap A)}{P(A)} = \frac{P(x_k)}{P(A)} $$

이산 확률 변수일 경우 조건부 확률을 위와 같이 표현할 수 있지만, 연속 확률 변수 일 경우에는 확률 밀도 함수 값이 확률이 아니기 때문에 누적 분포 함수를 추가로 이용해서 구할 수 있다.

연속 확률 변수의 조건부 평균 계산

연속 확률 변수 X, A = { X ≤ a} 일 때 조건부 평균 E[X|A]를 계산하는 하는 방법을 알아보자

$$ E[X|A] = \int_{x \in A} x f(x|A) dx $$

연속 확률 변수의 조건부 평균을 구하는 식이다. 우리는 f(x|A) 값을 바로 구할 수 없기 때문에, 다른 식으로 변형하여 계산해야한다.

$$ \begin{align*} & f(x|A) = \frac{dF(x|A)}{dx}\\ & = \frac{d}{dx} P(X \leq x | X \leq a)\\ & = \frac{d}{dx} \frac{P(X \leq x \cap X \leq a)}{P(X \leq a)} = \begin{cases}

  1. \frac{d}{dx} \frac{P(X \leq x)}{F(a)} = \frac{f(x)}{F(a)}, & \text{for } x \leq a \\[2ex]
  2. \frac{d}{dx} \frac{P(X \leq a)}{P(X \leq a)} = 0, & \text{for } x > a \end{cases} \end{align*} $$

확률 밀도 함수를 누적 분포 함수의 x에 대한 미분으로 표현할 수 있다. 범위에 대한 확률로 바꾸어 주면 분자는 x와 a의 범위의 교집합에 해당하는 확률, 분자는 a의 범위에 대한 확률로 정리할 수 있다.

여기서 x의 범위에 따라 계산하는 식이 달라진다.

  1. x가 a보다 작을 경우 분모가 F(a)가 되어 f(x)/F(a)로 표현할 수 있다.
  2. x가 a보다 클 경우 분모가 P(X ≤ a)가 되어 1 이라는 상수가 되고 이를 미분하면 0이된다.

이처럼 연속 확률 변수에 대한 조건부 확률을 구할 수 있고, 이를 이용해 아래와 같은 식으로 변형하여 조건부 평균을 구할 수 있다.

$$ E[X|A] = \int_{x \in A} x f(x|A) dx = \int_{x \leq a} x \frac{f(x)}{F(a)} dx $$

조건부 분산

$$ Var[X|A] = E[X^2|A]-E[X|A]^2\\ $$

조건부 평균을 이용해 조건부 분산를 정의 할 수 있다.

분산을 구할 때 쓰이던 기댓값이 조건부 평균(기댓값)으로 대체됐다고 생각하면 이해하기 수월하다.

참고자료

https://www.youtube.com/watch?v=vUZdV81Ycpw&list=PL4KjArv2DnjAaEjXXUJnVNeuli32JPQ-A&index=12