데이타 과학자가 되기 위한 무료과정

1.
현대 트레이딩은 트레이더의 감각, 퀀트의 금융공학 및 컴퓨터기술을 필요로 합니다. 그래서 트레이더들은 매매 프로그램을 개발하느라 많은 시간을 사용합니다.

The traders here are mostly educated in math or physics, often outside the United States, and their desks are piled high with textbooks like the “R Graphs Cookbook,” for working with obscure computer programming languages. “Our best traders spend a lot of their time pounding away writing code,” said Ryan Sheftel, head of the bank’s automated Treasury bond trading, pointing at one of his young employees. “He is doing thousands of trades, but doesn’t need to be manually involved anymore. The code he wrote is making the trading decisions.

그렇지만 트레이딩의 흐름이 바뀌면서 새로운 역할이 중요해집니다. HFT가 최고점에 달했던 2012년 여름 HFT이후 방향을 정리한 글을 쓴 적이 있었습니다. 이 때의 주제가 빅데이타였습니다.

HFT 이후는 Big Data Trading?

이후 1년이란 시간이 지났습니다. 최소한 해외의 기사나 논문들을 보면 빅데이타를 바탕에 둔 전략이 회자하고 있습니다. ‘정보기술 더하기 빅데이타’가 트레이딩의 큰 방향으로 자리잡고 있습니다. 이제 빅데이타는 ‘할지 말지’의 문제가 ‘언제 어떻게 할지’의 문제가 되었습니다.

Top 10 data mining algorithms

Some FIs have already initiated steps in this direction and with timely thought leadership, sponsorship, and action, some FIs will emerge as leaders. Big data is no more a question of “whether-or-not” to implement. Nor it is a question of “when”. It is now a question of “how” to implement. Therefore, the time is now to pave the way, push the pedal and steer in the direction where Big Data will bring big gains. The biggest challenges that FIs must overcome for successful implementation of big data are self-assessment (to identify areas of priority), thought leadership (to identify better ways of implementation), and corporate sponsorship (to muster the resources required for implementation).
From Big Data to Big Gains – Take a Step Back 중에서

이제 빅데이타를 이용하기 위한 데이타과학이 필요합니다.

“빅데이터는 양도 많지만 특성도 너무 다양해 기존의 데이터에서 보지 못한 복잡성을 갖고 있습니다. 그래서 대용량 데이터 분석을 위해 새로운 방법이 필요했고, 과거와 차별화된 명칭이 요구됐죠. 데이터마이닝이 세상에 나온 이유라고 할 수 있어요.”
데이터 기술에서 데이터 과학으로중에서

2.
어디에서 출발해야 할까요? 아직 국내에는 데이타과학자를 육성하기 위한 프로그램이 마땅치 않습니다. 트레이더로써 데이타과학을 고민하는 분들을 위한 모음입니다.

먼저 MOOC (massive open online course)입니다.

Lower-Division Courses
Data Science 101 – Statistics One
Data Science 102 – Computing for Data Analysis
Data Science 103 – Data Analysis
Data Science 104 – Introduction to Data Science

Upper-Division Courses
Data Science 201 – Machine Learning I
Data Science 202 – Machine Learning II
Data Science 203 – Neural Networks for Machine Learning

Graduate Courses
Data Science 301 – Learning from Data (Caltech course CS101)
Data Science 302 – Machine Learning III (MIT course 6.867)

이상의 과정 말고 IBM이 후원하는 곳도 있습니다.

Big Data Unversity

온라인과정이라 매력적이지만 영어로 듣기가 가능해야 합니다.(^^) 듣기가 불편하시면 읽기는 어떤가요? 무료로 구할 수 있는 책들입니다.

Free Data Science Books

Mining of Massive Datasets
Bayesian Reasoning and Machine Learning (pdf)
Information Theory, Inference, and Learning Algorithms
Gaussian Processes for Machine Learning (pdf)
The Elements of Statistical Learning
Introduction to Machine Learning (pdf)
Think Bayes (pdf)

“배우고 때로 익히면 또한 기쁘지 아니한가(學而時習之 不亦說乎)”라고 공자님은 말씀하였습니다.
길은 시장에만 있지 않습니다. 데이타에도 있고 학습에서도 있습니다.

혹 여유가 있다면 제가 만든 ‘김도형박사와 함께 R로 배우는 금융수학과정‘을 신청하시는 것도 좋은 길이라고 생각합니다.(^^)

Leave a Comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.