유럽은행(ECB)이 내놓은 감성지표

1.
코스콤이 발표한 K-Index. 한국형 소셜 감성지수입니다. 얼마전 기사는 발표이후 진행을 보여줍니다.

-사실 텍스트로 분석한다는 게, 신뢰성에 문제가 있을 수 있는 게 아닌가. 자신도 모르게 스스로를 속인다거나, 아니면 의도적으로 글을 올린다든지.

“그런 부분은 있다. 사실 그래서 트위터나 이런 쪽은 데이터 자체는 많지만 실제 쓸만한 데이터 비중은 적은 편이다. 가장 신뢰할 수 있는 건 뉴스 데이터다. 트위터가 1000만 건이라고 하면 활용할 수 있는 데이터는 1%가 채 안 된다. 뉴스 데이터는 50만 건이라면 70%~80% 정도 쓸 수 있다. 수집해서 보면 절대적인 양 자체는 비슷해질 수 있다. 의도적인 글, 신뢰성이 떨어지는 정보에 대해 준비는 할 것이다.

그런데 잘못된 정보도 주가에 반영되는 부분도 있다. 과거 백악관 폭파됐다는 오보 있었을 때 다시 회복되긴 했지만 시장이 크게 반응했다. 영향이 있었던 셈이다. 처벌 여부를 떠나서 주가에 영향을 준다는 측면에서 반영은 해야 하지 않나 생각한다.”

-언제부터 분석 시작했나.

“재작년, 작년 프로젝트하면서 시험을 거쳐 하려다 계약 상대방과 잘 안 맞는 부분이 있어 못 했다. 올해 다시 시작해 모델을 거의 살린 상태다. 10년 데이터 분석을 했고, 지난해 빠졌던 1년 치 데이터까지 채워 검증 작업 중이다.

-시장에는 어떤 식으로 제공되나.

“우선 데일리로 정서 분석을 통한 결과를 값으로 제공하는 방식이 될 것 같다. 감성 지수만을 제공할 수도 있다. 가격을 예측해서 보내는 것이니, 아침 장 시작하기 전에 데이터를 분석해, 오늘 이 주식이 어느 정도 될 거다. 이를 직접 활용해도 되고 감성 지수만 따로 받아 이를 각자 분석 방법에 맞춰 활용해도 된다.

감성만으로 시장을 분석하는 건 아니다. 기본적으로 종가 등을 통한 기존 분석 방식에 감성 지수를 더해 분석하게 된다. 과거 데이터에 감성 지수를 가미하니 좀 더 예측 정확도가 높아졌다는 점, 환율 등 기존 변수에 감성이라는 정확도를 높이는 것이 하나 늘어났다고 보면 된다.”

-앞으로 계획은 어떻게 되나.

“우선 분석 모델을 좀 더 보고 정확도에 따라 제공 대상을 선정할 예정이다. 검증 결과에 따라 증권사나 포털에 제공, 예측률이 높으면 개인에게까지 발표하는 것을 생각하고 있다. 여러 핀테크 기업과 협력하는 방안도 고려 중이다. 감성은 논리적인 설명이 실적에 기반을 둔 분석보다 어려운 편이다. 또 매일, 시각마다 바뀌는 부분도 있다. 다양한 분석 모델을 활용해 예측률을 높이기 위한 노력도 진행 중이다. 올해 말 정도에 서비스 형태로 시장에 제공할 계획이다.”
[빅데이터로 보는 경제]강태홍 코스콤 기술연구소장 “자본시장, 이제 ‘감성지수’로 분석· 예측”중에서

관건은 사업화입니다. 아무리 만들어도 시장에서 성공하지 못하면 실패한 프로젝트입니다. K-Index로 매매하려고 하는 투자자가 있을지 궁금합니다.

그동안 국내에서 감성지수를 개발하려고 했던 시도들이 있었고 논문도 나왔습니다.

감성지수과 트레이딩
트위터 감성지수를 이용한 예측지수 모형

이상이 다루었던 글이고 재무금융관련 5개 학회  에서 소개한 빅데이터(Big-data)에 나타난 감성 분석이 있습니다.

월스트리트는 벌써 상업화를 하여 수많은 서비스가 있지만 아직 한국은 마땅한 곳이 없습니다. 유일한 곳이 코스콤이었는데 발표후 잠잠한 이유가 있었습니다.

2.
유럽연합이 7월에 보고서를 내놓았습니다. Google, Twitter Bullishness – Impact On Stocks: ECB StudyGoogle, Twitter Bullishness – Impact On Stocks: ECB Study을 통해 읽은 보고서로
Quantifying the Effects of Online Bullishness on International Financial Markets입니다.

Download (PDF, 447KB)

WSJ가 소개한 특징입니다. 트위터가 구글에 선행하고 있다는 점입니다.

According to the paper, bullishness expressed on Twitter has a strong influence on Google searches the following week, “indicating that Twitter information precedes Google queries.”

The authors also found that Google searches for bull and bear market also appear to lead changes in equity market indexes.

“Interestingly, this is particularly the case in extreme market conditions. For example, Google bullishness touched bottom in mid-2008, before the market turmoil of late 2008 and early 2009 in the United States, United Kingdom and Canada,” the authors wrote.

“Similarly, Chinese Google bullishness reached a peak in early 2007, preceding the market peak of early 2008. Subsequently, a declining trend of bullishness was followed by a downward trend in the market until 2009,” they wrote.

논문에 나온 지표구하는 법입니다.

sentiment1

사실 글을 읽으면서 한국과 무슨 관계가 있을까 의문을 가질 수 있습니다.

오픈소스에서 오픈데이타로에서 소개한 Quandl이 제공하는 데이타중 European Central Bank (ECB) Bullish/Bearish Sentiment Index가 있습니다.

sentiment2

여러가지 언어로 데이타를 가져올 수 있는데 Python일 경우는 아래와 같습니다.

Quandl.get(“PSYCH/ECB_I”)

물론 유료일 경우 더 자세하고 최근 데이타를 사용할 수 있습니다. 세계시장의 변화와 연결한 전략을 만들 때 유효하지않을까요?

3.
혹시 소셜 감성지수와 관련한 논문을 찾으시면 아래를 확인해보세요.

Web Search Queries Can Predict Stock Market Volumes

Quantifying Trading Behavior in Financial Markets Using Google Trends

Notable Estimates and Associated Returns [Estimize research]

How Google Searches Foreshadow Housing Prices and Sales

Quantifying the Effects of Online Bullishness on International Financial Markets

Quantifying Wikipedia Usage Patterns Before Stock Market Moves

Leave a Comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.