본문 바로가기
주식 공부 하기/주식 투자 공부

퀀트 투자의 허와 실[유튜브, 월가아재 영상 추천]

by 꺼 2021. 10. 3.
반응형

가끔 보는 월가아재님의 영상입니다. 내용 간단히 정리하려 했으나 딱히 간단히 정리되지 않기에 영상 시청하는 것을 추천드립니다.

혹시나 문제 되는 부분이 있다면 댓글로 알려주시면 비공개 처리하겠습니다.

 

내용 요약을 하면 다음과 같습니다.

 

퀀트 투자를 할 때 주의할 점

- 파라미터를 미세 조정하는 과최적화를 피해라.

- 과거에 수익성이 좋은 패턴을 찾는 건 쉽다. 하지만 미래에도 좋을 전략을 찾는 건 어렵다.

- 데이터 학습 구간과 검증 구간을 나눠서 백테스트 하되, 검증은 단 한번이다. 2회 이상의 검증은 검증 구간도 학습 구간으로 오염된다.

- 데이터 오염을 피하라. 누군가가 클렌징한 데이터 그리고 내 데이터에 생존편향이 없는지 확인하라.

- 시장 성질 변화에 주의해라.

- 20년의 백테스트 기간보다 3년이 낫다. 20년은 시장 성질 변화의 위협에 취약하다.

 

해당 영상에 대한 예고를 보고 퀀트는 사기다. 퀀트로 절대 못번다. 등을 말하려는 것이라고 생각하는 분들도 계셨는데 역시나 그런 의미의 내용은 전혀 아니였습니다. 다만, 어떤 방법이든지 누구나 노력없이 쉽게라는 것은 없다는 내용입니다. 

 

영상으로 전하고자 한 내용

- 수익을 위해서는 그만한 부단한 노력과 리스크 관리가 수반되며, 요즘 광고로 누구나 쉽게 간단하게 벌 수 있다는 것에 현혹되지 말자.

- 짧은 시간 지평을 사용하여 유의미한 데이터가 많은 퀀트 트레이딩이 아닌 긴 시간 지평을 사용하여 데이터 수가 적은 퀀트 투자에 대해서는 회의적인 시각을 지니고 있다.

ex) 하루의 주가를 사용하는 방법은 1년에 250개의 데이터가 있지만, 연 단위 리밸런싱을 하는 계량 투자의 경우 20년 백테스팅 해봐야 데이터가 20개에 불과하다.

 

 

 

국내 퀀트 관련 서비스 업체의 코멘트

더보기

젠포트 코멘트

월가아재님, 안녕하세요.백테스팅 툴 '젠포트'를 서비스하는 뉴지스탁입니다.

먼저 퀀트 투자에 있어 놓칠 수 있는 부분들을 너무나도 잘 정리해 주셔서 감사합니다.

본 영상을 통해 '젠포트'가 앞으로 나아가야 할 방향을 확립할 수 있는 기회가 된 것 같습니다.

 

영상에서 말씀주신 부분을 젠포트에 도입해 현재 적용되어 있는 부분과 적용되어야 할 부분을 정리해 봤습니다.

 

*퀀토피안의 몰락

- 퀀토피안은 개인이 쉽게 백테스팅을 구현할 수 있는 툴을 제공하고, 타인과 생각을 공유할 수 있는 커뮤니티가 존재하며, 우수한 전략은 헤지펀드 라이선스를 보유한 퀀토피안이 직접 운용해서 수익을 쉐어합니다. 상당 부분이 젠포트와 유사하지만 다른 점은 첫째, 백테스팅에 코딩 수준의 스킬이 필요하다는 점입니다. Drag&Drop의 쉬운 UI/UX를 가진 젠포트와 달리 높은 진입장벽을 가지고 있어 미국이라는 큰 시장에서 서비스했음에도 불구하고 젠포트보다 훨씬 낮은 수의 백테스팅 숫자를 기록했습니다. 둘째는 유저 개개인이 직접 전략을 만들고 타인과 공유하며 주문까지 연동할 수 있는 플랫폼이 아닌, 퀀토피안이 직접 유저의 전략을 빌려 자산을 운용한다는 점입니다. 이로 인해 코로나19 급락장을 버티지 못했고 실적은 크게 감소했습니다. 사업 모델의 방향성이 개인을 위한 툴 보다는 본인들의 운용 실적에 치우쳐 있었다는 점도 작지만 굉장히 큰 문제였습니다. 마지막으로, 로빈후드가 퀀토피안 경영진들을 대부분 스카우트했다는 점도 퀀토피안 서비스 종료에 큰 영향을 미쳤습니다. 실제로 업계 2, 3등 기업들은 여전히 서비스를 유지하고 있습니다.

 

*퀀트 투자에서 조심할 점 10가지

1. 데이터를 의심하라

- 젠포트는 국내외 데이터 기업에서 직접 데이터를 구매해 사용 중이며, 국내 최초의 HTS(Window)로 알려진 대신증권 CYBOS를 개발한 문홍집 의장을 비롯한 증권 전산 전문가들이 매일 데이터 클리닝 작업을 진행합니다. 실제로 권리사항 반영 등의 이슈는 증권사보다 앞서는 경우가 많습니다.

- 젠포트는 현재 한국과 미국 주식(ETF 포함) 데이터만 커버하기 때문에 저점, 고점, MDD 부분에서 말씀주신 오류는 발생하지 않습니다. 또한, ‘이나 데이터에서 발생할 수 있는 괴리도 을 사용하면 꽤 줄일 수 있습니다. - 상장폐지 된 종목들도 모두 커버하기에 말씀하신 생존자 편향은 발생하지 않습니다.

2. 미래 선지 편향

- {시가총액 순위}100위 내 종목만 타겟하게 로직을 짜 놓으면 그 당시 100위 종목을 대상으로 매매한 것으로 백테스팅하기 때문에 말씀하신 현재 시점에서의 시가총액 상위 100개 종목 선정문제는 발생하지 않습니다. 마찬가지로 실적 발표도 실제 발표 시점을 기준으로 백테스팅이 진행됩니다. 예를 들어, 지금 2021/10/01~ 백테스팅을 돌려도 아직 3Q 실적이 반영되지 않아 2Q 실적을 기반으로 백테스팅됩니다. 종가 기준 문제도 전혀 없습니다

.3. 과최적화를 피하라

- 과최적화를 줄이려면 유저 각각의 역할이 중요한데 다행이도 커뮤니티가 굉장히 활성화되어 있어 어떻게 하면 과최적화를 최대한 줄일 수 있는 지에 대한 아이디어 공유가 활발히 이루어지고 있습니다.

- 유저들은 기본적으로 백테스팅 모의투자 실전투자 테크를 밟습니다. 백테스팅만 좋다고 바로 사용하는 것이 아닌, 백테스팅 결과와 모의투자를 매일 해 본 결과의 통계적 괴리가 적을 경우 실전매매로 옮겨 자산을 관리합니다.

- 또한, 실전매매 시작 후 단기간 내 발생할 수 있는 백테스팅간의 괴리를 줄이기 위해 상관성이 낮은 복수개의 전략을 동시에 운용합니다. 신규 유저를 제외하고는 개인당 평균 5개 정도의 전략을 동시에 운용하고 있습니다.

- Out of Sample도 쉽게 테스트해볼 수 있는 환경이 구축되어 있습니다.

4. 검증 기회는 단 한번 뿐이다.

- 3(과최적화를 피하라)처럼 젠포트 내에서 모두 가능합니다. 이걸 유저들이 하나하나 분석해야 한다는 불편함이 있어 원클릭에 전진분석이 가능한 기능을 제공할 예정입니다.

5. 시대는 변한다.

- 당연히 맞는 말이지만 장기간 백테스팅이 꼭 나쁜 것은 아니라고 생각합니다. 일례로 젠포트 유저 대부분은 마켓타이밍이라고 어려운 시장에서는 현금을 확보하고 관망하는 로직을 넣습니다. 백테스팅을 통해 과거 금융위기와 같은 급락장을 모두 피해갔던 것을 검증했고, 실제로도 코로나19나 최근 하락장도 모두 피해갈 수 있었습니다. 앞으로도 급락장을 피해갈 수 있을지는 모르지만 젠포트 서비스를 운영했던 기간 동안에는 통했습니다.

- 가치주 장세, 추세주 장세 등 테마적 흐름도 계속 순환하기에 ‘3에서 말씀드린 것처럼 상관성이 낮은 전략을 동시에 운용하는 것도 도움이 됩니다.

6. 퀀트 투자의 맹점

- 젠포트는 틱 단위 백테스팅도 지원하기에 최대한 많은 수의 테스트를 진행할 수 있습니다. 실제로 실전매매 기준 10,000개 정도의 계좌로 월 1조원(한국 주식 거래의 0.2% 수준) 이상의 거래가 발생하기에 상당히 고빈도 매매가 이루어지고 있다고 보고 있습니다. 물론, 코로나19나 최근 하락장에서는 대부분 현금을 보유하기에 거래량이 1/10 수준으로 줄어들었습니다.다음 영상도 매우 기대가 됩니다.평소에도 좋은 말씀을 많이 해 주셔서 서비스 발전에 많은 도움을 받고 있습니다.앞으로도 잘 부탁드리겠습니다.

 

월가아재 코멘트

반갑습니다. 제 영상이 도움이 되셨다니 부끄럽네요. 
말씀하신 부분 중에서 퀀토피안의 몰락에 대해 제 시각은 조금 다른데 참고하시라고 말씀드리겠습니다. 

먼저 첫번째 부분에 대해서, 백테스팅 수는 다다익선이 아니라 생각합니다. 2부에서 다룰 것인데, 지나치게 잦은 백테스팅을 하면 할수록 시장의 무작위성에서 패턴을 픽업할 확률이 높고, 이러한 실험들을 다룬 논문들도 있습니다. 그리고 본인의 코딩을 반영할 수 있는 퀀토피안과 달리 쉬운 UI/UX로 해두었다는 것은, 편의를 얻는 대신 유연성을 포기한다는 의미입니다. 정말로 유의미한 알파는 새로운 데이터와 새로운 아이디어에서 생겨나기에 플랫폼이 hypothesis class를 한정지어 놓으면 한계가 있다고 생각합니다. 그래서 젠포트가 더 성장하기 위해서는 유저가 일정 부분 customize를 할 수 있게 코딩 extension이 추가된다면 좋을 듯 하네요. 

두번째 말씀하신 부분은 백테스팅 플랫폼의 사업체로서의 사업성과 지속성 문제이기에, 백테스팅의 실제 성과 여부와는 조금 결이 다른 문제라 봅니다. 개발한 전략의 end user가 퀀토피안 헤지펀드인가, 아니면 또 다른 타인인가의 차이기 때문입니다. 퀀토피안은 개인들의 알고리즘에서 오는 리스크를 본인들의 사업의 리스크로 가져갔고, 젠포트는 유저들끼리 전략을 사고팔도록 함으로써 알고리즘이 향후 실패해도 젠포트의 사업 상의 리스크가 되지는 않습니다. 개인적으로 사업체로서는 퀀토피안보다 젠포트같은 모델이 훨씬 더 리스크가 적고 수익성도 좋은 현명한 사업 방식이라 생각합니다. 

하지만 퀀토피안 경영진도 바보는 아니고, 여러 가지 비즈니스 모델을 시도해 보지 않은 건 아니었습니다. 그런데 퀀토피안 플랫폼에서 본인 개인의 자금을 운용할 수 있도록 허용했을 때 어떤 현상이 일어났는지 주목할 필요가 있습니다. 똑똑하고 코딩을 잘하며, 정말 알파를 잘 찾을 수 있는 유저들이 대거 이탈했는데, 그런 사람들은 구태여 본인들의 알고리즘이 노출될 리스크를 지면서 퀀토피안을 사용할 필요가 없었기 때문입니다. 그러면서 퀀토피안 플랫폼에서 나오는 알고리즘의 질은 더 저하되었습니다. 즉, 퀀토피안이 대주는 자금에 본인의 알고리즘을 적용해서 그 수익의 10%를 나눌 수 있는 게 그러한 상위 유저들을 붙들어두는 동기였던 것입니다. 아마 한국에서도 본인이 코딩해서 직접 퀀트 매매를 할 수 있는 고수들은 젠포트를 사용하지 않고 있을텐데, 그러한 유저들을 플랫폼으로 편입할 수 있다면 젠포트의 장기적인 성공에 큰 기여를 할 거라 생각합니다.

저는 개인도 퀀트 매매/투자에서 상당한 효용을 가져갈 수 있다고 생각합니다. 그래서 젠포트같은 서비스가 생겨나는 것에 대해서 매우 긍정적으로 보고 있고 응원합니다. 그저 일부 퀀트 투자에 대한 담론이 지나친 맹신으로 이어지는 것만 경계해보자는 입장입니다.

뉴지스탁과 젠포트 유저들이 상생하는 멋진 서비스가 되어 건승하시길 기원합니다.

 

젠포트 코멘트

말씀주신 것처럼 쉬운 UI/UX는 상대적으로 '낮은 자유도'를 의미합니다. 이 부분에 대해선 향후 현 버전과 코딩 수준의 스킬을 요하는 버전 2가지를 모두 제공할 계획입니다. 특히 글로벌 서비스로의 성장을 꿈꾸고 있기에 이는 꼭 필요한 부분이라 생각하고 있습니다.

두번째 말씀주신 부분(유저와 성과를 쉐어)은 라이센스/구조적 이슈와 충돌이 있어 진행을 못했습니다. 하지만 뉴지스탁이 지난 8월 DGB금융그룹(대구은행, 하이투자증권 등 10개의 금융회사가 소속)으로 피인수됨에 따라 관련 비즈니스를 영위할 수 있는 가능성이 높아졌습니다.
저희도 초기에 여러 방향성을 두고 사업을 진행했지만, 플랫폼이 완성되지 않은 상태에서 바로 자금 운용을 시작한다는 것에 대한 리스크가 커 지금과 같은 순서(플랫폼->운용)로 방향성을 잡았습니다. 퀀토피안의 성과 쉐어 모델도 곧 도입할 계획입니다.

알고리즘을 유저들 간 사고팔 수 있다는 점이 퀀토피안과 가장 큰 차이점이라 여기서 알파가 깨질 우려가 발생하지만, 실제로는 전체 알고리즘 중 4% 미만 만이 마켓에서 거래되는 알고리즘입니다. (알고리즘 판매에 여러 제한을 두기 때문)
알고리즘 마켓의 장점은 젊고, 알고리즘 구축 능력에서 스마트하지만 투자금은 적은 유저와 그 반대에 있는 유저간 니즈를 맞춰준다는 점에 있으며, 젠포트 입장에서 이런 스마트한 메이커를 유입시킬 수 있는 좋은 동기부여라고 생각합니다.
이 부분도 퀀토피안과 같은 방식(10% 쉐어)으로 풀려고 현재 구조를 잡고 있습니다. (여러 협력기관의 도움이 필요)

젠포트도 아직 나아가야 할 길이 너무나도 멀고나 험합니다.
앞으로도 월가아재님의 영상을 참고하여 진정으로 개인 투자자들에게 도움이 될 수 있는 플랫폼으로 성장하도록 하겠습니다.

감사합니다.

참고하려고 모아둔 질의 답변

더보기

구독자A 코멘트

오늘도 저와 같은 주린이들을 위해 노력해주시는 월가님 너무너무 감사합니다ㅠㅠ 확실히 과거가 미래를 보장하지 않는다는것은 알겠습니다. 그러면 대체 어떻게 투자하면 되는건가요? 가치투자 혹은 월가님이 말씀하시는 가설 매매 조차  어느정도 과거에 잘통한 투자방법이라서 앞으로도 잘 작동할 가능성이있다고 생각하시는거지 않나요? 약간의 가능성에 배팅하는게 투자라고 생각은 하는데.. 대체 뭘믿고 투자를 하면 좋을까요?

 

월가아재 코멘트

저는 어느 방법이든 불가능하다 말씀드리는 것이 아니라, 요즘 유튜브에서 이야기하듯이 쉽지는 않다고 말씀드리는 것입니다. 올바른 지식을 쌓고, 공부를 하고, 데이터를 모으고, 부단히 노력해서 그 노력에 걸맞는 적정한 수익률을 목표로 하며 리스크 관리를 하는 것이 올바른 투자의 길입니다. 쉽진 않겠죠... 하지만 세상에 쉽게 돈 버는 방법은 어느 분야나 없습니다. 유독 주식 시장에만 오면 불확실성과 무작위성 때문에 사람들이 쉬운 방법이 있다고 착각을 하는 것이 문제입니다.

 

구독자B 코멘트

k-fold validation이나 짝수년도훈련 -> 홀수검증 방식은 time series 데이터에는 적용이 어렵지 않을까합니다.. 사실상 2012년도 데이터에 2011년도 2013년도 데이터를 쓰는 것이니 훨신 문제가 쉬워지는거겠죠. look-ahead bias도 있게되구요

 

월가아재 코멘트

네 빈도가 잦지 않고 시간지평이 길어질수록 말씀하신대로 적용이 어렵습니다. 다만 빈도가 충분히 잦은 알고리즘 매매에서는 look-ahead bias 처리하고 사용할 수 있습니다. 그래서 저는 시간지평이 긴 "퀀트 투자"라는 개념에 조금 회의적입니다.

 

https://youtu.be/BFkPzl1uziE

 

 

위의 퀀트 영상과 별개로 아래의 영상의 재생 목록은 한 번쯤 꼭 보는 것을 추천합니다.

국내 주식 책 중에서는 아래의 내용을 언급하는 책을 문병로 교수님 책 밖에 못봤습니다.

외국 서적에서는 시장의 마법사 시리즈를 포함하여 많은 성공한 트레이더들이 중요하게 언급하는 개념들입니다.

https://youtu.be/IQ63sMK_y2s

 

반응형

댓글