Stochastic Process
확률과정은 \( \{ X(t), t \in T \} \)는 시간에 따라 변화하는 확률변수들의 집합이다.
여기서는 \( X \)가 아니라 \( X(t) \)가 확률변수가 된다.
\( t \)는 지표(index)라고 하고 일반적으로 시각이나 시간(time)으로 해석된다.
\( X(t) \)는 \( t \)에서의 확률과정의 상태(state)라고 한다.
예를 들면, \( X(t) \)는 다음과 같은 state를 나타낼 수 있다.
- \( t \) 시점에 슈퍼마켓에 들어온 총 고객 수
- \( t \) 시점까지 슈퍼마켓에서 기록된 총 매출액
\( T \)는 집합으로, 지표집합(index set)이라고 한다.
\( T \)가 가산집합(countable set)이면, 확률과정은 이산시간과정(discrete-time proces)이라고 한다.
반대로, \( T \)가 실수 구간(interval of real line)이면, 확률과정은 연속시간과정(continuous-time proces)이라고 한다.
- \( \{ X_n, n=0, 1, 2, \dots, \} \)는 음이 아닌 정수로 지표화된 이산시간 확률과정이다.
- \( \{ X(t), t \ge 0 \} \)는 음이 아닌 실수로 지표화된 연속시간 확률과정이다.
상태공간(state space)는 확률변수 \( X(t) \)가 가질 수 있는 모든 값들의 집합니다.
(마치 확률에서 표본공간(sample space)가 실험(probability experiment)이 일어날 수 있는 모든 가능한 결과 집합인 것 처럼)
따라서 확률과정은 어떤 (물리적, physical) 과정의 시간에 따른 변화를 설명하는 확률변수들의 모음(family)이다.
※ 종종 random process와 stochastic process는 동의어로 간주되고, index set이 명확히 정의되지 않아도 서로 혼용한다.
※ collection과 family라는 용어를 혼용하여 사용한다.
※ index set 대신에 parameter set(매개변수 집합), parameter space(매개변수 공간)라고도 한다.
※ index set이 실수가 아니라 n차원 유클리드 공간(\( \mathbb{R}^n \)) 또는 다양체(manifold)일 경우 (process 대신에) random field라고도 한다.
Example 1
\( m+1 \)개의 노드(정점)들이 원형으로 배열되어있고 각가 \( 0,\ 1,\ \dots,\ m \)이라고 하자.
각 step마다 입자(particle)이 시계방향 또는 반시계 방향으로 한 위치 이동할 확률이 동일하다.
\( n \) 번째 step에서 입자의 위치가 \( X_n \)일 때,
\[ P(X_{n+1} = i + 1 \mid X_n = i) = P(X_{n+1}= i - 1 \mid X_n = i) = 0.5 \]
이때 \( i=m \)이면 \( i+1 \equiv 0 \)이고 \( i=0 \)이면 \( i-1 \equiv m \)이라 하자.
이제, 입자가 \( 0 \)번 노드에서 출발하여 규칙에 따라 계속 움직인다고 하자.
이때, 노드 \( i \ (i=1, 2, \dots, m) \)가 마지막으로 방문되는 노드일 확률은 얼마인가?
solution)
입자가 원형으로 연결되어있고, 시계/반시계 방향으로 이동할 확률이 동일하고, 모든 노드에 대해 동일한 조건이므로 대칭성을 이용해서 풀 수 있다. 즉 어떤 노드가 마지막으로 방문될 확률도 동일하다.
\( 0 \)번 노드를 제외하면 \(m \)개의 노드가 있으므로 정답은
\[ P(i \text{ is the last node visited}) = \cfrac{1}{m} \quad i=1, 2, \dots, m \]
Example 2
각 도박에서 승리할 확률과 패배할 확률이 동일하다고 하자.
0원에서 시작하고, 승리하면 1원 획득(+1), 패배하면 1원 손실(-1)이라고 한다.
도박사의 목표 금액이 \( k \)원이고, \( n \)원 손실이면 파산하여 더이상 도박을 진행하지 못할 때, 도박사가 \( k \)원을 얻을 확률은?
solution)
이 문제는 도박사가 특정 상태(이익 또는 손실)에 도달할 확률을 구하는 문제이다.
\( P_x \)를 현재 잔고가 \( x \)원일때, 목표 \( k \)원에 도달할 확률이라고 하자.
즉, 이때 가능한 정수 \( x \)는 \( -n \le x \le k \) 이다.
그리고 \( P_k=1 \)이고 (이미 목표 성공) \( P_{-n}=0 \) 이다. (이미 파산)
그리고 \( P_k \)의 재귀적 구조를 작성하면
\[ P_x = \cfrac{1}{2}P_{x+1} + \cfrac{1}{2}P_{x-1}, \quad -n < x < k \]
이는 등차수열의 재귀식이므로 바로 일반항을 작성하면 \( P_x = ax + b \)
그리고 양끝조건 \( P_{-n}=0, P_{k}=1 \)을 이용하여 일반항을 구하면
\[ P_x = \cfrac{x+n}{n+k} \]
도박사는 0원에서 시작하므로 정답은 \( P_0 = \cfrac{n}{n+k} \) 이다.
Continuing Topics
- Markov Chains
- Poisson Process
- Queueing Theory
- Brownian Motion
- Stationary Process
- etc.