알고리즘트레이딩을 위한 데이터사이언스과정 (주말반)

알고리즘트레이딩을 위한 데이터사이언스과정 주말반을 모집합니다. 현재 주간에 진행중인 정규반과 달리 주말반은 데이터사이언스를 집중한 교육으로 만들었습니다. 주간에 시간을 내기 힘들거나 먼 곳에 계신 분들이 짧은 시간에 교육을 받을 수 있도록 하였습니다. 이에 따라 프로그램과 교육비가 바뀌었습니다. 아래에서 확인하세요

WHY Data Science

2008년 미국 와이어드지에 실린 The End of Theory: The Data Deluge Makes the Scientific Method Obsolete은 빅데이터시대를 연 칼럼이라고 합니다. 이 칼럼의 마지막은 이렇습니다.

Correlation supersedes causation, and science can advance even without coherent models, unified theories, or really any mechanistic explanation at all.

세상을 이해하고 예측하는데 빅데이터를 분석하여 도출한 ‘상관관계(correlation)’가 전통적인 이론과 모델을 통한 ‘인과관계(causality)’보다 정확하고 유효하다는 내용입니다. 이런 결론은 자본시장에도 적용할 수 있습니다. 자본시장에서 정량적인 데이터분석을 주도한 사람은 퀀트입니다. 그렇지만 ‘금융공학’보다는 ‘데이터’를 더 강조하는 빅데이터의 시대 데이터 과학자(사이언티스트)를 새로운 퀀트(New Quant)로써 자리매김하고 있습니다.

데이터 사이언티스트를 되기 위해서 크게 세가지 지식이 필요하다고 합니다.

2015-06-21-venn

좋든 싫든 데이터는 전자적으로(electronically) 거래되는 재화(commodity)이다. 따라서 이 시장에 참여하기 위해서는 프로그래밍을 좀 해야한다. 그렇다고 컴퓨터 공학을 전공해야 한다는 것은 아니다. 실제로 내가 아는 뛰어난 해커 몇명은 컴공 수업을 단 한 개도 들어본 적이 없다. 성공적인 데이터 해커가 된다는 것은 텍스트 파일을 명령줄(command line)에서 조작할 줄 알고, 벡터 연산을 이해하고, 알고리즘적으로 사고하는 등의 것을 말한다.

일단 데이터를 수집하고 정제했다면 다음 단계는 데이터에서 인사이트(insight)를 이끌어내는 것이다. 이를 위해서는 적절한 수학 및 통계학적 방법론을 적용하고, 그에 대한 최소한의 이해는 할 수 있어야 한다. 경쟁력 있는 데이터 사이언티스트가 되기 위해서 반드시 통계학 박사학위가 있어야 한다는 말은 아니지만, 적어도 최소자승법 회귀분석(ordinary least squares regression)이 무엇이고, 그것을 어떻게 해석해야하는지는 알아야 한다.

마지막 조각인 도메인 전문성은 이 주제에 대한 다른 사람들의 주장과 가장 큰 차이를 보이는 부분이다. 나는 데이터와 수학/통계의 결합은 기계학습(machine learning)밖에 되지 못한다고 생각한다. 당신의 관심 분야가 그것이라면 다행이지만, 데이터 사이언스라면 그렇지 않다. 사이언스, 즉 과학이란 원래 세상에 대한 흥미로운 질문이나 가설을 던진 후 데이터를 수집해서 통계적 방법론으로 검증하여 지식을 발견하고 쌓아나가는 것이다. 도메인 전문성과 수학 및 통계적 지식의 교집합은 대부분의 전통적인 학문이 속하는 영역이다. 많은 박사급 연구자들은 이 구역에서 전문성을 쌓는데 자기 시간의 대부분을 할애하며, 기술(technology) 습득에는 시간을 많이 투자하지 않는다. 이러한 성향은 연구자들의 기술 이해 수준에 대한 보상을 하지 않는 학계의 특성 때문이기도 하다. 물론, 나는 그런 전통을 타계하고자하는 젊은 학자 또는 대학원생도 많이 만났다.
데이터 사이언스 벤 다이어그램중에서

이번에 휘안리서치 (FIAN Research)와 협력하여 마련한 ‘알고리즘트레이딩을 위한 데이터사이언스’과정은

‘수학 및 통계에 대한 전문성’
‘도메인전문성(자본시장, 트레이딩)

을 결합하여 관련한 능력을 키우는데 목적을 두고 있습니다. 교육을 준비하면서 기초통계나 데이터 관리 도구에 다소 익숙하지 않아도 배울 수 있고 직접 실습을 통해 습득한 지식을 확인할 수 있도록 교육을 준비하였습니다. 약 두 달의 과정을 거치면 데이터 사이언티스트로서 1차적인 직무를 수행하실 수 있게 될 것입니다.
[wptab name=’교육 소개’]

목적

알고리즘 트레이딩 구현을 위해서 필요한 데이터 사이언스로의 입문 과정이며 예문 실습을 통한 개념의 직관적인 이해를 우선시하는 교육과정입니다. 통계 프로그래밍 언어를 사용하지 않고 보편적인 툴인 엑셀과 금융공학 add-in 프로그램 PrimaXL을 주 교재로 사용합니다.

대상

R, Matlab, Python 등을 사용한 경험은 유용하지만 교육을 수강하는데 필수는 아닙니다. 엑셀을 사용해본 경험이 있으시면 충분합니다. 금융공학과 관련한 지식은 있으나 실습을 필요로 하시는 분, 데이터분석을 위한 수학 및 통계적인 지식과 실습을 원하시는 분, 데이터를 이용하여 알고리즘전략을 구축하고자 하는 분이면 누구나 가능합니다. 또한 ‘알고리즘트레이딩 전략개발과정’이나 ‘알고리즘트레이딩을 위한 금융수학 과정’을 수강하신 분들은 지난 교육에서 배운 바를 더 넓히는데 도움을 줍니다.

준비물

핵심적인 교재는 이번 교육과정의 협력사인 휘안리서치 (FIAN Research)가 제공하는 PrimaXL입니다. 수강생들은 반드시 개인 노트북 컴퓨터를 지참하여 교재용으로 제공하는 PrimaXL을 직접 설치하시고 실습에 참여하셔야 합니다. 교육장에 설치한 노트북 컴퓨터를 이용할 수 있으나 PrimaXL의 라이센스때문에 사용하시는 컴퓨터를 지참하시면 좋습니다. 별도의 강의노트는 제공합니다.

fian3

교육일정 및 시간

주말반은 선 모집을 한 후 교육일정을 확정합니다. 현재 교육일정계획은 2015년 10월 31일, 11월 7일, 11월 14, 11월 21일 총 4회로 토요일에 진행합니다.
1회 교육시간은 각 6시간이며 토요일 이른 10시부터 5시까지입니다.(점심시간 1시간) 총 4회 24시간입니다.

교육비

4회 800,000원입니다. 부가세는 불포함한 가격입니다. 교재로 제공하는 PrimaXL의 비용을 포함한 가격이며 1회 인증용 라이센스를 제공합니다.(단 한대의 컴퓨터에서만 인증할 수 있습니다)
[/wptab]
[wptab name=’강사 소개’]

fian장순용(張淳鎔)

현) 휘안리서치(FIAN Research) 연구소장.
금융공학 모형 및 알고리즘 개발. 데이터 분석과 예측 모형 연구, 개발.

약력) 일리노이大(University of Illinois, Urbana-Champaign) 물리학 PhD. 워싱턴大, 오하이오 주립大 연구원 재직. 통계적 방법에 기반하는 전산 시뮬레이션 알고리즘 개발. 슈퍼컴퓨팅 알고리즘 개발. 초전도, 초유체 등 극저온 양자유체 현상 연구. 응집물리, 핵물리 연구.

저서) 알고리즘 트레이딩 시리즈 총3권. 국제 저널에 다수의 논문 게재

fian2
[/wptab]

[wptab name=’교육일정 및 내용’]
(*)1회당 교육시간은 동일하지 않습니다. 하루 교육시간에 몇 회의 교육을 진행할 수 있고 반대로 한 회의 교육을 몇 일씩 할 수도 있습니다.

순서주제내용
1회개요 및 기초데이터 사이언스에 기반한 알고리즘 트레이딩 소개.
교육과정 소개
교재용 프로그램 PrimaXL 설치와 사용법 소개. (실습)
꼭 알아두어야 할 확률과 통계 기초. (실습)
확률의 fat tail 분석과 Value At Risk (VAR)(실습)
심슨의 역설과 포트폴리오 최적화
2회데이터의 준비 및 시각화이상값 처리. 미싱 데이터 처리. (실습)
데이터 구하기: 일일 주식 데이터 내려받기. (실습)
내삽. 트랜드 피팅. 디트렌딩. (실습)
히스토그램, 바플롯, QQ플롯. (실습)
정규확률분포와 Student-t 확률분포 비교.
3회시계열시계열이란 무엇인가요?
정상시계열 vs 비정상시계열. 약정상시계열 정의.
자기공분사함수, 자기상관계수. (실습)
시계열의 시뮬레이션. (실습)
ARMA모형의 파라미터 피팅. (실습)
비정상 시계열과 ARIMA모형의 파라미터 피팅. (실습)
AR, MA, ARMA 모형을 적용한 예측 방법과 특성. (실습)
몬테카르로 방법을 적용한 예측 밴드의 산출. (실습)
비정상 시계열의 예측방법. (실습)
4회변동성과 파생상품
변동성이란? 변동성 계산방법.
ARCH와 GARCH 변동성 모형의 필요성과 소개.
ARCH와 GARCH 모형을 적용한 변동성의 시뮬레이션. (실습)
변동성 모형 ARCH와 GARCH의 파라미터 피팅. (실습)
ARCH와 GARCH 모형을 적용한 변동성 예측. (실습)
파생상품: 선물과 옵션.
옵션과 변동성: 역사적 변동성과 내재 변동성. (실습)
옵션의 변동성 트레이딩 전략.
통계적차익 트레이딩 전략.
5회시계열의 평활화와 내재적 가치 발견, 예측
이동 평균 계산과 시계열의 평활화. (실습)
Kalman 필터를 적용한 노이즈 필터링과 평활화. (실습)
Holt지수 평활화 파라미터 피팅. (실습)
Holt지수 평활화 방법 적용한 시계열 예측. (실습)
몬테카르로 방법을 적용한 예측밴드 산출. (실습)
6회공적분과 페어트레이딩
페어트레이딩 전략 소개.
상관계수와 공적분.
단위근이란?
Dickey-Fuller 단위근 테스트. (실습)
Augmented Dickey-Fuller 단위근 테스트. (실습)
Engle-Granger 공적분 분석방법. (실습)
벡터 시계열 모형 (VAR) 소개 및 파라미터 피팅. (실습)
벡터 시계열 모형 (VAR)을 사용한 예측. (실습)
스프레드의 예측. (실습)
7회머신러닝 기초
Bayes 통계법과 머신러닝의 원리. (실습)
선형회귀분석의 원리.
선형회귀와 분산분석(ANOVA). (실습)
선형회귀분석 결과의 진단. (실습)
선형회귀방법에 기초하는 학습-예측 모형. (실습)
선형회귀방법에 기초하는 트레이딩 모형. (실습)
8회머신러닝 심화Yes or No?? 로지스틱 회귀방법으로 분석. (실습)
로지스틱회귀방법에 기초하는 학습-예측 모형. (실습)
ROC 퍼포먼스 그래프와 해석. (실습)
로지스틱회귀방법에 기초하는 트레이딩 모형. (실습)
클러스터링 알고리즘: 자율학습을 통한 패턴 분류. (실습)
9회시장미시구조로시장미시구조론의 목적.
Roll모형: 호가와 매매비용.
순차적매매모형: 유정보 매매자의 영향.
O'Hara모형: Poisson확률 적용.
Kyle모형: 전략적 트레이딩의 영향.

[/wptab]
[wptab name=’교육장 소개’]

강의실 소개

구분설명
좌석8명
네트워크무선랜 AP 설치

20150914_131553

위치

서울특별시 영등포구 여의대방로 171 카페24 창업센터 3층 Conference Room

[wptab name=’참가 신청’]

참가신청

    이름 (필수)

    이메일 (필수)

    제목(필수)

    하시는 일(필수)

    세금계산서 발행(필수)

    아니오

    세금계산서 발행을 '예'라고 하셨으면 사업자등록증을 첨부해주세요

    코드값을 입력하세요(Input this code): captcha

    강사 및 주최측에 하고 싶은 말


    [/wptab]
    [end_wptabset skin=”default” location=”top” ]

    Leave a Comment

    이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

    이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.