기계학습, 고빈도매매 및 기계학습펀드의 실패

1.
현재 같이 일하고 있는 팀들의 금요일 퇴근 무렵. 나이가 비슷한 분들이라 이런저런 이야기를 나누다 핀테크를 주제로 이야기를 나누었습니다. 모두 저의 변경입니다.

“왜 로보어드바이저를 하지 않으세요?”
“미국 로보바이저가 대상고객을 명확히 하고 시작했지만 한국은 차별화할 수 없고 차별화하더라도 수수료경쟁에서 벗어날 수 없어서……”
“블록체인은?”
“플랫폼 비지니스를 할 수 있으면 도전해보겠지만 SI와 같은 시장에 없어서…”

핀테크가 금융을 뒤짚을 듯 하더니만 쑥 사그라들고 4차산업혁명이 그 자리를 메우고 있습니다. 그러나 유행이 사라지고나면 시장에서 실패한 전사자들만 남습니다. 다만 기계학습이나 인공지능은 오랜동안 생명력을 유지할 듯 합니다. 기술과 자본과 데이타를 가진 집단에게 이익을 보장하기때문입니다.기계학습과 트레이딩을 접목하는 것은 더이상 새롭지 않습니다. 그렇다고 HFT와 같이 시장에서 압도적인 위력을 발휘하지 않습니다. 자료가 없지만 인구에 회장하는 빈도가 적습니다. 아직은 관심이지 실제의 영역은 아닌 듯 합니다.

최근 살펴본 기계학습과 관련한 논문중 재미있는 주제를 다룬 두편을 소개합니다. 모두가 ‘이다’라고 할 때 ‘아니다’라고 하는 The 7 Reasons Most Machine Learning Funds Fail입니다. 2018년에 나올 Advances in Financial Machine Learning의 압축해서 정리한 발표자료입니다. 글을 쓴 Marcos Lopez de Prado도 HFT때부터 유명했고 논문으로 자주 졉했던 분입니다.

글 머리를 보면 다루는 목차가 있습니다. 앞서 ‘아니오’라고 했지만 정확히 ‘오류를 줄여라’를 이야기하는 논문입니다.

Download (PDF, 1.49MB)

글쓴이가 쓴 논문목록을 참고로 하시면 그중 Stock Portfolio Design and Backtest Overfitting을 참고로 올립니다.

Download (PDF, 535KB)

다음은 지금도 관심을 가지고 보고 있는 고빈도매매와 기계학습을 연결한 High Frequency Market Making with Machine Learning입니다.

This paper introduces a trade execution model to evaluate the economic impact of classifiers through backtesting. Extending the concept of a confusion matrix, we present a ‘trade information matrix’ to attribute the expected profit and loss of tick level predictive classifiers under execution constraints, such as fill probabilities and position dependent trade rules, to correct and incorrect predictions. We apply the execution model and trade information matrix to Level II E-mini S&P 500 futures history and demonstrate an estimation approach for measuring the sensitivity of the P&L to classification error. Our approach directly evaluates the performance sensitivity of a market making strategy to classifier error and augments traditional market simulation based testing.

Download (PDF, 907KB)

위의 배경이 되는 논문이 Classification-Based Financial Markets Prediction Using Deep Neural NetworksSequence Classification of the Limit Order Book using Recurrent Neural Networks입니다.

Download (PDF, 605KB)

Download (PDF, 610KB)

2.
Golden Compass가 Hang Seng Index Futures을 대상으로 기계학습모델에 따른 수익율을 비교하는 시험을 하였습니다. 이 때 사용한 방법들이 Neural Networks, Random Forest, Naïve Bayes, K-nearest neighbors 및 SVM입니다. 어떤 모델이 가장 좋은 결과를 얻었을까요? Comparing Supervised Learning Methods for Hang Seng Index Futures Long/Short Strategy에 담긴 결과를 참고하세요. 더불어 Golden Compass는 SVM을 이용하여 Nikkei 지수거래를 시험한 결과도 소개합니다.

SVM Trend Strategy on Nikkei 225 Mini Futures

앞서 결과와 비교해보시길 바랍니다.

1 Comment

  1. harry

    좋은 글 감사드립니다.
    혹시 첫번째 논문 “잘못된 라벨링” 내용중 삼중베리어로 라벨링하는 부분이 있는데 그림믈 봐도 이해가 잘 되지 않는데 설명을 부탁드려도 될는지요?상하 두영역은 알겠는데 수직영역은 어디를 의미하며,이미지에 샘플로 라벨링된 영역이 왜 1,1,1 인지 정말 궁금합니다.감사합니다.

    Reply

Leave a Comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.