● Model Explainer

모델 설명 — 이론, 의의, 그리고 수식.

금융을 처음 접하는 분도 따라올 수 있도록 각 모델의 배경과 원리를 풀어 썼습니다.

PRO2016

계층적 위험 분산 (Hierarchical Risk Parity)

Marcos López de Prado · Building Diversified Portfolios that Outperform Out of Sample (2016)

Markowitz 모델의 약점인 공분산 역행렬 계산 없이, 자산을 “비슷한 그룹”으로 묶어 안정적인 비중을 산출하는 머신러닝 기반 알고리즘.


01

한 줄 요약

마코위츠 최적화의 가장 큰 약점인 공분산 행렬의 역행렬을 쓰지 않고, 자산을 “비슷하게 움직이는 그룹”으로 먼저 묶은 다음 그 그룹들 사이에서 위험을 나누는 방식의 알고리즘입니다.

02

왜 만들어졌나요?

마코위츠 모델을 실제로 돌려보면 종목 수가 많아질수록 결과가 이상해지는 경험을 하게 됩니다. 어떤 종목에 99%, 어떤 종목에는 0.1%처럼 극단적인 비중이 나오기도 하고, 입력 데이터를 살짝만 바꿔도 결과가 완전히 달라지기도 합니다.

그 이유는 마코위츠 공식 안에 있는 “공분산 행렬의 역행렬(Σ⁻¹)”때문입니다. 종목 수가 데이터 길이에 비해 많아지면 이 역행렬이 수치적으로 불안정해지고, 그 불안정성이 그대로 비중 결과로 튀어나오는 것입니다.

López de Prado는 2016년 “애초에 역행렬을 안 쓰면 되지 않을까?”라는 발상에서 출발해 머신러닝의 클러스터링 기법을 가져와 HRP를 제안했습니다.

03

핵심 원리 (3단계)

HRP 의 비중 산출 과정은 세 단계로 이루어집니다 — 각 단계가 무엇을 하는지 그림과 함께 살펴봅시다.

① Tree Clustering — 비슷한 종목을 나무로 묶기

먼저 모든 종목쌍의 상관계수(ρ)를 거리(distance)로 변환합니다 — d(i, j) = √(½ · (1 − ρᵢⱼ)). 상관관계가 1 에 가까울수록 거리가 0 에 가까워지고, 음의 상관일수록 거리가 멉니다. 그 다음 가장 가까운 두 종목부터 차례로 묶어 올라가면서 나무 구조(덴드로그램, dendrogram) 를 만듭니다. 아래 그림처럼 “비슷하게 움직이는 종목” 이 자연스럽게 같은 가지에 모이고, “다르게 움직이는 자산(예: 채권 ETF TLT)” 은 마지막에 합류하는 구조가 나옵니다.

Hierarchical clustering dendrogram with horizontal cut showing different cluster partitions
Fig. 1
덴드로그램의 일반 개념 — 데이터 점들이 거리에 따라 단계적으로 묶이는 트리 구조
Image: Stathis Sideris (original PNG, 2005) / Mhbrugman (SVG conversion, 2009), Wikimedia Commons, CC BY-SA 3.0. 원본 그래프 — 라이선스 유지 위해 변형 없이 사용.

위 그림이 덴드로그램의 “일반 형태” 입니다 — 가까운 데이터끼리 먼저 쌍을 이루고, 점차 거리가 먼 그룹들이 합쳐져 마지막에 모든 데이터가 하나의 트리로 묶이는 구조. 그림의 점선처럼 어느 높이에서 자르느냐에 따라 군집의 수가 결정됩니다. HRP 는 이 트리 구조를 그대로 “자산 군집 구조” 로 활용합니다 — 아래는 본 도구가 6 종목을 실제로 처리할 때 만드는 덴드로그램 예시입니다.

0.000.250.500.751.00AAPLMSFT005930035720SPYTLTTech USKR ITDISTANCEASSETS (sorted by similarity)
Fig. 2
자산 간 거리 행렬에서 만들어지는 덴드로그램 — 단계별 군집 형성 (DIVA Quantizer 적용 예시)
개념 도식 (DIVA Quantizer 자체 제작) · 출처 이론: M. López de Prado, “Building Diversified Portfolios that Outperform Out of Sample,” Journal of Portfolio Management, 2016.

② Quasi-Diagonalization — 공분산 행렬을 재배치

덴드로그램에서 얻은 “비슷한 종목이 인접하는 순서” 로 공분산 행렬의 행과 열을 다시 배치합니다. 처음에는 종목이 무작위 순서였다가, 정렬 후에는 큰 값이 대각선 근처에만 모이는 모양으로 바뀝니다 — 여기서 “준대각화(Quasi-Diagonal)” 이라는 이름이 나왔습니다. 이 정렬은 다음 단계의 재귀적 분할에 필요한 사전 작업입니다.

정렬 전비슷한 종목이 흩어져 있음1.00-0.100.300.550.300.78-0.101.00-0.10-0.10-0.10-0.100.30-0.101.000.420.780.300.55-0.100.421.000.420.550.30-0.100.780.421.000.300.78-0.100.300.550.301.00AAPLTLT005930SPY035720MSFTAAPLTLT005930SPY035720MSFT정렬 후 (Quasi-Diagonal)대각선 근처에 큰 값이 모임1.000.780.300.300.55-0.100.781.000.300.300.55-0.100.300.301.000.780.42-0.100.300.300.781.000.42-0.100.550.550.420.421.00-0.10-0.10-0.10-0.10-0.10-0.101.00AAPLMSFT005930035720SPYTLTAAPLMSFT005930035720SPYTLT
Fig. 3
Quasi-Diagonalization — 정렬 전후 공분산 행렬 비교
개념 도식 (DIVA Quantizer 자체 제작) · 출처 이론: López de Prado (2016) HRP 알고리즘의 quasi-diagonalization 단계.

③ Recursive Bisection — 그룹을 반복적으로 둘로 나누며 비중 분배

이제 정렬된 종목 리스트를 둘로 쪼갭니다. 그리고 각 절반의 “클러스터 분산” (cluster variance) 을 계산해, 분산이 큰 쪽에는 작은 비중을, 분산이 작은 쪽에는 큰 비중을 줍니다 (역분산 가중). 그 다음 각 절반을 다시 둘로 쪼개고 같은 작업을 재귀적으로 반복합니다 — 더 이상 나눌 수 없는 개별 종목까지. 마지막에 모든 종목의 비중이 결정됩니다.

핵심은 마코위츠와 달리 공분산 행렬 전체의 역행렬 Σ⁻¹ 을 한 번도 계산하지 않는다는 점입니다. 매 단계 “두 부분의 분산” 만 비교하면 되므로, 종목 수가 많고 데이터 기간이 짧아 Σ 가 수치적으로 불안정해도 결과가 흔들리지 않습니다 — 이것이 HRP 의 강건성(robustness) 의 핵심입니다.

04

의의와 활용

  • 종목 수가 많고 데이터 기간이 짧을 때 마코위츠보다 안정적인 비중을 줌
  • 한 자산이 폭락해도 같은 클러스터 안에서만 영향이 머무르도록 설계됨
  • 리스크 패리티 ETF, 멀티 에셋 펀드의 비중 결정에 실제로 사용
  • 크립토·신생 ETF처럼 장기 데이터가 부족한 자산군에 특히 유리
05

한계

HRP는 분산을 잘 하는 데 초점이 맞춰져 있어, 기대수익을 적극적으로 추구하지 않습니다. 그래서 마코위츠가 이론적으로 줄 수 있는 “효율적 프론티어 위의 점”에 도달하지는 않습니다. 또한 클러스터 결과가 의미 있으려면 자산 간 상관 구조가 기간에 걸쳐 안정적이어야 합니다.

06

더 읽을 자료

NEXT

Hierarchical Risk Parity 모델로 직접 분석해 보세요.

포트폴리오를 입력하면 위에서 설명한 지표들이 실제 숫자로 나옵니다.