1.
리서치. 운용보다 더 중요합니다. 시장의 변화에 따라 조사하고 연구하여 새로운 전략을 만들어내는 것은 트레이딩의 경쟁력을 유지하는데 핵심입니다. 어떻게 리서치를 할까요? 과거 어느 때보다 마켓데이타의 중요성이 점점 커지는 듯 합니다. 그래서 아래와 같은 표현을 주장하는 곳들이 많습니다.
Transforming the deluge of market data into an asset
마켓데이타를 자산(Asset)으로! 자산이 되기 위해서는 관리가 전제되어야 합니다. 단순한 저장이 아니라 데이타를 필요로 하는 곳이 사용할 수 있도록 준비를 해놓아야 합니다.
As if this wasn’t already a formidable challenge, making sense of the ever-increasing deluge of unstructured market data is adding to the complexity. Due to the recent economic crisis and subsequent market downturn, investment managers need to consider a wider array of information in their analysis while minimizing market data management overhead. Uncovering emerging trends in economics, commodities, options, short interest, and futures data can have a profound impact on individual securities and overall portfolio performance. In addition, managers may also need new data sets to explore the veracity of new investment strategies to keep up with competitive offerings.
To succeed, managers need to not only embrace the flood of market data, but transform it into an asset. This presents a huge market data management challenge. Attempting to deal with these intensifying data requirements exclusively with in-house market data management solutions is resource intensive and takes focus away from extracting insight from the data, a real source of sustainable differentiation.
Transforming the Deluge of Market Data into an Investment Management Asset중에서
2.
R&D를 위한 언어로 많이 사용하는 것이 Python과 R입니다. 이중에서 Python을 이용하여 마켓데이타 플랫폼을 구축하는 방법을 살펴보도록 하겠습니다. 기본 원리를 알면 다른 언어로 개발하는것은 쉬을 듯 합니다. 우선 마켓데이타. 그것도 대용량의 틱데이타를 관리하는 방법은 무엇이 있을까요? 가장 손 쉽게 접근할 수 있는 방법은 HDF5입니다.
Python과 HDF5를 결합하여 개발하는 방법은 PyCon 2012 때 주제인 Python and HDF5 – Fast Storage for Large Data을 참고하시면 됩니다.
아래 글도 도움을 줍니다.
Storing and analyzing equity tick data (trades and quotes) using HDF5 / h5py
HDF5가 아닌 다른 방법도 가능합니다. 그중에서 MongoDB를 이용하는 방법을 소개합니다. PyData 2014행사 때 발표한 자료입니다.