Bayesian Inference - Parametric Inference, Predictive Inference
베이지안 추론에서의 파라메트릭 추론과 예측 추론
베이지안 추론은 확률론을 기반으로 데이터를 분석하고 불확실성을 정량화하는 방법론입니다. 이러한 베이지안 추론에서 파라메트릭 추론과 예측 추론은 서로 다른 목적을 가지고 사용되는 중요한 개념입니다.
1. 파라메트릭 추론 (Parametric Inference)
파라메트릭 추론은 모형의 파라미터를 추정하는 것을 목표로 합니다. 즉, 우리가 관찰한 데이터를 생성했다고 가정하는 확률 분포의 파라미터를 추정하는 것이죠. 예를 들어, 코인 던지기 실험에서 앞면이 나올 확률 (p)을 추정하는 것이 파라메트릭 추론의 한 예입니다.
- 핵심:
- 모형 가정: 특정 확률 분포 (예: 정규 분포, 베르누이 분포)를 가정합니다.
- 사후 분포: 사전 분포와 관측된 데이터를 이용하여 파라미터의 사후 분포를 계산합니다.
- 점 추정: 사후 분포의 평균, 중앙값 등을 이용하여 파라미터의 값을 추정합니다.
- 구간 추정: 신뢰 구간을 이용하여 파라미터의 값이 어떤 범위에 있을지 추정합니다.
- 예시:
- 코인 던지기: 베르누이 분포를 가정하고, 베타 분포를 사전 분포로 사용하여 앞면이 나올 확률 p의 사후 분포를 구합니다.
- 선형 회귀: 정규 분포를 가정하고, 베이지안 선형 회귀 모델을 이용하여 회귀 계수를 추정합니다.
2. 예측 추론 (Predictive Inference)
예측 추론은 미래 데이터를 예측하는 것을 목표로 합니다. 즉, 이미 관찰된 데이터를 기반으로 새로운 데이터가 어떤 값을 가질지 예측하는 것입니다. 예를 들어, 내일의 기온을 예측하거나, 새로운 고객이 어떤 제품을 구매할지 예측하는 것이 예측 추론의 예입니다.
- 핵심:
- 예측 분포: 사후 분포를 이용하여 새로운 데이터의 예측 분포를 계산합니다.
- 점 예측: 예측 분포의 평균, 중앙값 등을 이용하여 새로운 데이터의 값을 예측합니다.
- 구간 예측: 예측 구간을 이용하여 새로운 데이터의 값이 어떤 범위에 있을지 예측합니다.
- 예시:
- 새로운 데이터 포인트 예측: 선형 회귀 모델에서 새로운 입력 값에 대한 출력 값을 예측합니다.
- 생존 분석: 환자의 생존 시간을 예측합니다.
두 개념의 관계
- 상호 보완: 파라메트릭 추론을 통해 얻은 파라미터의 사후 분포를 이용하여 예측 분포를 계산할 수 있습니다. 즉, 파라메트릭 추론은 예측 추론의 기반이 되는 경우가 많습니다.
- 목표의 차이: 파라메트릭 추론은 모형의 파라미터에 초점을 맞추는 반면, 예측 추론은 새로운 데이터에 대한 예측에 초점을 맞춥니다.
결론
베이지안 추론은 파라메트릭 추론과 예측 추론이라는 두 가지 중요한 개념을 통해 불확실성을 정량화하고 데이터를 분석합니다. 파라메트릭 추론은 모형의 파라미터를 추정하는 데 사용되며, 예측 추론은 새로운 데이터를 예측하는 데 사용됩니다. 두 개념은 서로 밀접하게 연관되어 있으며, 실제 문제 해결에 있어서 함께 활용될 수 있습니다.
핵심 키워드: 베이지안 추론, 파라메트릭 추론, 예측 추론, 사후 분포, 예측 분포, 파라미터 추정