기계학습시대의 미시구조론

1.
아시는 분은 아시겠지만 트위터를 통해 거의 매일 ‘기계학습과 금융’을 주제로한 논문을 소개하는 분이 계십니다. Carl Carrie입니다. 예를 들면 아래와 같은 트윗입니다.

저는 Arxiv를 RSS로 연결해서 논문을 살피는데 트위이 솔직히 편합니다. 누군가 정리해서 올려준 덕분입니다. 몇 일전 제목이 흥미로왔던 논문입니다.논문의 글쓴이를 보니까 익숙한 이름이 있습니다. Marcos M. López de Prado입니다.

Microstructure in the Machine Age

Download (PDF, 1.54MB)

Random Forest 기법을 이용하고 변수의 중요도(Variable Importance)를 측정하기 위하여 Mean Decreased Impurity (MDI)와 Mean Decreased Accuracy (MDA)을 사용합니다. MDI와 MDA는 생소한 개념이라 다른 자료를 찾아보니까 A Random Forest Guided Tour에서 잘 정리를 해놓았습니다. Understanding variable importancesin forests of randomized trees도 괜찮습니다.

Download (PDF, 597KB)


Download (PDF, 377KB)

위 논문을 관심이 갔던 또다른 이유는 Maureen O’Hara 입니다. HFT와 관련한 논문을 무척 많이 발표한 분입니다. 요즘은 어떤 논문을 쓰나 살펴보니까 Marcos M. López de Prado와 같이 쓴 The Volume Clock: Insights into the High Frequency Paradigm이 있네요. 재미있는 개념을 제안합니다. Volume Clock입니다. 혹시나 해서 찾아보니까 HFT와 VPIN, PIN때 소개한 논문입니다. 그냥 소개하고 Volume Clock에 관심을 가지지 않았었습니다.

Time can be understood as a measuring system used to sequence observations. Since the dawn of time, humans have based their time measurements in chronology: Years, months, days, hours, minutes, seconds, and, more recently, milliseconds, microseconds… Because we have been brought up to think in terms of chronological time, we can hardly visualize a different way of scheduling our lives. However, this is a rather arbitrary time system, arguably due to the key role played by the sun in agrarian societies.
Machines operate on an internal clock that is not chronological, but event-based: The cycle. A machine will complete a cycle at various chrono rates, depending on the amount of information and complexity involved in a particular instruction.

Download (PDF, 697KB)

2.
앞서 Carl Carrie가 올린 논문중 제목이 재미있어서 같이 소개합니다. Modeling Traders’ Behavior with Deep Learning and Machine Learning Methods: Evidence from BIST 100 Index으로 기술적지표와 인공지능을 결합한 모델을 만들어 시험을 하였습니다. 논문에서 사용한 기술적 지표는 다음과 같습니다.

그러면 “왜 기술적 지표를 사용했을까?”하는 의문이 드는데 아래 논문이 근거입니다. 여전히 많은 트레이더들이 사용하기때문입니다.

The Use of Technical Analysis by Fund Managers: International Evidence

Download (PDF, 1.63MB)

그리고 Marcos M. López de Prado가 쓴 Advances in Financial Machine Learning을 소개한 적이 있습니다. 글쓴이가 강의용 슬라이든 자료를 공개했네요. 참고하세요.

Advances in Financial Machine Learning: Lecture 1/10 The Pitfalls of Econometric Analysis.
Advances in Financial Machine Learning: Lecture 2/10 Financial Applications of Machine Learning.
Advances in Financial Machine Learning: Lecture 3/10 Data Analysis.
Advances in Financial Machine Learning: Lecture 4/10 Modelling.
Advances in Financial Machine Learning: Lecture 5/10 Backtesting I
Advances in Financial Machine Learning: Lecture 6/10 Backtesting II
Advances in Financial Machine Learning: Lecture 7/10 Machine Learning Portfolio Construction
Advances in Financial Machine Learning: Lecture 8/10 Useful Financial Features.
Advances in Financial Machine Learning: Lecture 9/10 High-Performance Computing.
Advances in Financial Machine Learning: Lecture 10/10 The 7 Reasons Most Machine Learning Funds Fail.
Advances in Financial Machine Learning: Numerai’s Tournament Preparation for Numerai’s Tournament.

Leave a Comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.