Home 인과 관계의 다양한 구조와 분석 방안
Post
Cancel

인과 관계의 다양한 구조와 분석 방안

현실에서 나타나는 현상은 시간에 따라 변화한 무언가를 말한다. 그리고 그런 시간에 따른 변화는 독립적으로 이루어지는 건 많지 않아, 그 변화 속에서 다양한 인과 관계가 형성된다. 그리고 사람들은 그 관계를 특정하고 싶어하고, 이를 수치적으로 풀고자 한다. 하지만 이를 풀어내는 것은 쉽지 않고 오용되는 경우가 너무나도 많아, ‘상관관계는 인과관계를 의미하지 않는다’는 말을 다들 입에 달고 살게 되었다. 하지만 여전히 이 말만 유명하고, 이 이상으로 나아가지 않는다. 심지어 이를 이상하게 해석한 후 마치 진실인 양 호도하는 이야기마저도 눈에 띈다. 물론 데이터에서 인과 관계를 아예 찾을 수 없냐면, 그렇지는 않다. 그 과정이 생각보다 조금 더 단계가 많을 뿐이다.

이전 글에서 인과 추론의 단계를 이야기하면서 인과 관계가 다양할 수 있다는 것을 간단히 언급했다. 그러면 어떤 식으로 다양할 수 있는지를 이해해야 인과 관계를 가정하고 조건적 사고를 진행할 수 있을 것이다. 그래서 인과 구조 모델링에 활용될 수 있는 인과관계의 다양한 구조와, 각 구조에서 어떤 식으로 접근할 수 있는 지에 대해서 아주 간단히 설명하려고 자료를 만든 김에, 블로그 포스팅으로도 정리해 보았다.


단방향 인과관계 (Unidirectional Causality)

가장 기본적인 형태의 인과 구조로, X라는 변수는 Y라는 변수에 영향을 미치지만, Y는 X에 영향을 미치지 않는 구조다.

예시: 중앙은행의 금리 결정(X)이 시장 이자율(Y)에 영향을 미치는 경우

1
2
X → Y (금리 결정 → 시장 이자율)

분석 방법:

  • 그랜저 인과성 검정(Granger Causality Test)
  • 단순 시차 회귀분석(Lagged Regression)
  • 충격반응함수(Impulse Response Function)

주의 사항: 단방향성을 확신하기 위해서는 잠재적인 제3의 변수(confounding variable)의 영향이 없다는 전제조건이 필요하다.

양방향 인과관계 (Bidirectional Causality)

두 변수가 서로에게 영향을 주고받는 구조입니다. 피드백 루프의 가장 기본적인 형태라고 볼 수 있습니다.

예시: 주식 가격(X)과 거래량(Y)은 서로 영향을 주고받음

1
2
X ⟷ Y (주식 가격 ⟷ 거래량)

분석 방법:

  • VAR(Vector Autoregression) 모형
  • 양방향 그랜저 인과성 검정
  • 공적분 분석(Cointegration Analysis)과 오차수정모형(VECM)

주의 사항: 이런 구조에서는 한 변수의 변화가 다른 변수를 통해 다시 자기 자신에게 돌아오는 피드백 효과가 발생할 수 있다.

공통 원인 구조 (Common Cause)

제3의 변수 Z가 X와 Y 모두에 영향을 미치는 구조. 이 경우 X와 Y 사이에 상관관계가 관찰되더라도, 실제로는 인과관계가 아닌 허위 상관관계(spurious correlation)일 수 있다.

예시: 아이스크림 판매량(X)과 소아마비(Y)는 모두 기온(Z)이라는 공통 원인에 영향을 받습니다.

1
2
X ← Z → Y (아이스크림 판매량 ← 기온 → 소아마비)

분석 방법:

  • 조건부 독립성 검정(Conditional Independence Test)
  • 구조적 방정식 모델링(Structural Equation Modeling)
  • DAG(Directed Acyclic Graph) 분석

주의 사항: 이러한 구조를 고려하지 않고 분석하면 X와 Y 사이의 직접적인 인과관계를 잘못 추론할 위험이 있다.

간접 인과 구조 (Indirect Causality)

X가 Z를 통해 Y에 간접적으로 영향을 미치는 구조로, 매개 효과(mediation effect)의 형태로 나타납니다.

예시: 통화량 증가(X)가 인플레이션(Z)을 통해 실업률(Y)에 영향을 미칠 수 있습니다.

1
2
X → Z → Y (통화량 → 인플레이션 → 실업률)

분석 방법:

  • 매개 변수(mediator) 분석
  • 경로 분석(Path Analysis)
  • 구조적 방정식 모델링(SEM)

주의 사항: X가 Y에 미치는 영향은 Z를 통한 간접 효과와 직접 효과(X → Y)로 분해될 수 있습니다.

피드백 루프 (Feedback Loop)

변수들이 순환적으로 영향을 주고받는 구조. 복잡한 시스템에서 흔히 발견되며, 자기 강화적(self-reinforcing) 또는 자기 안정화(self-stabilizing) 속성을 가질 수 있다.

예시: 경제 성장(X)이 소비(Y)를 증가시키고, 소비 증가는 기업 이익(Z)을 증가시키며, 기업 이익 증가는 다시 경제 성장으로 이어지는 순환 구조가 나타난다.

1
2
X → Y → Z → X (경제 성장 → 소비 → 기업 이익 → 경제 성장)

분석 방법:

  • 시스템 동역학(System Dynamics) 모델
  • 비선형 VAR 모형
  • 순환 인과 다이어그램(Causal Loop Diagrams)

주의 사항: 피드백 루프는 시스템의 동적 복잡성을 증가시키며, 장기적으로 예측하기 어려운 행동을 만들어 낼 수 있다.

시간 지연 효과 (Time-Lagged Effects)

X가 Y에 즉각적으로 영향을 미치지 않고 일정 시간이 지난 후에 영향을 미치는 구조. 시계열 데이터를 다룰 때 종종 나타나며, 이를 고려해서 분석해야 하는 경우가 다수 있다.

예시: 금리 인상(X)이 경제 성장률(Y)에 미치는 영향은 보통 6-18개월 후에 나타난다.

1
2
X(t) → Y(t+k) (금리 인상(t) → 경제 성장률(t+k))

분석 방법:

  • 분산시차분포(Distributed Lag) 모형
  • ARDL(Autoregressive Distributed Lag) 모형
  • 최적 시차 결정 기법(Optimal Lag Selection)

주의 사항: 적절한 시차(lag)를 식별하지 못하면 인과관계가 과소평가되거나 발견되지 않을 수 있어서, 이 효과가 예상되는 경우 꼼꼼히 살펴보는 것이 필요하다.

구조적 변화 (Structural Breaks)

시간에 따라 인과 구조 자체가 변하는 경우. 특정 시점을 기준으로 변수 간의 관계가 변할 수 있다.

예시: 금융 위기 이전과 이후의 이자율과 투자 사이의 관계가 달라질 수 있습니다.

1
2
3
4
[X → Y] (t < T)

[X ↛ Y] (t ≥ T)

분석 방법:

  • 구조 변화 검정(Structural Break Tests)
  • 시변 계수 모형(Time-Varying Coefficient Models)
  • 레짐 전환 모형(Regime-Switching Models)

주의 사항: 구조적 변화를 고려하지 않으면 전체 기간에 대한 평균적인 효과만 추정하게 되어 중요한 패턴을 놓칠 수 있다. 주요 사건의 ‘개입’ 효과 분석이 필요하다.

비선형 인과관계 (Nonlinear Causality)

X와 Y 사이의 관계가 선형이 아니라 복잡한 비선형 형태를 가지는 경우. 많은 실제 시스템은 비선형적 특성을 갖는다.

예시: 인플레이션(X)과 경제 성장(Y) 사이의 관계는 특정 임계점을 기준으로 다른 양상을 보일 수 있습니다.

1
2
X →^f Y (여기서 f는 비선형 함수)

분석 방법:

  • 임계 회귀 모형(Threshold Regression Models)
  • 평활 전이 회귀(Smooth Transition Regression)
  • 비모수적 방법(신경망, 가우시안 프로세스 등)

주의 사항: 비선형 관계는 특정 구간에서 변수의 영향력이 강화되거나 약화될 수 있으며, 극단적인 값에서 예상치 못한 행동을 보일 수 있다. 여러 시계열을 동일한 방식으로 한 번에 병렬처리해서 계산하는 경우 주의가 필요하다.


정리: 인과성의 사다리를 오르기

시계열 데이터에서 인과 구조를 파악하는 것은 손쉽게 진행하던 상관관계 분석을 넘어서는 과정이다.

이 글에서 설명한 인과 구조들을 이해하고 적절한 분석 방법을 선택하는 것은, 앞서 소개한 인과성 사다리를 오르는 과정에서 중요한 단계다. 시계열 데이터에서 인과 구조를 올바르게 식별하고 해석한다는 것은, 단순한 예측 이상으로 이를 사용해서 이후에 무엇을 할 수 있을 지 의사 결정을 하는 데에 필요한 통찰을 얻기 위해 반드시 필요한 과정이며, 인과 분석이 완벽하지 않더라도 이를 제대로 활용하는 데에 필요한 과정이기도 하다.

물론 인과의 사다리를 제대로 올라가기 위해서는 다양한 시각에서의 접근과, 도메인 지식 등이 요구된다. 하지만 어차피 데이터를 사용해서 무언가 답을 낼 것이고, 그 답이 답은 정해져 있는 데에 ‘데이터’라는 이름을 얹어서 자신의 주장만을 고집하려는 의도가 아니라면, 데이터를 최대한 제대로 활용해서 원인을 파악하기 위해 노력해야 할 것이다. 인과 구조를 이해하는 것은 이를 위한 접근에 분명 필수적인 도움이 될 것이다.

    This post is licensed under CC BY 4.0 by the author.

    인과의 사다리

    이 많은 사람이 틀릴 리 없잖아요? – 대중에 호소하는 오류에 관하여