트위터 감성지수를 이용한 예측지수 모형

1.
빅데이타를 이용한 주가예측. 신문을 보면 그동안 코스콤이 만든 시스템을 2014년 봄 상용 서비스를 한다고 합니다.

코스콤은 빅데이터 분석과 활용을 위한 파일럿 시스템 개발에 나섰다. 이 과정에서 데이터 분석을 가장 중요한 요소로 꼽았다. 빅데이터 자체를 모으는 것도 중요하지만, 수많은 데이터에서 가치있는 정보를 뽑는 게 우선이라고 판단했다.
“트위터에서 나오는 기업 관련 정보를 분석하면 주가를 예측할 수 있다고 생각했습니다. 소셜 감성을 활용하면 기업에 대한 긍정과 부정 이미지를 파악할 수 있고, 이를 바탕으로 충분히 주가의 향방을 파악할 수 있을 거라 생각했습니다.”

코스콤은 주식 정보를 분류해 담을 수 있는 데이터베이스와 소셜 감성 데이터 같은 비정형 데이터를 먼저 수집했다. 원활한 감성 데이터 분석을 위해 5만9천여개에 이르는 단어를 모으고, 형태소에 따라 부정과 긍정으로 어떻게 반응을 나눌지 분석했다. 통계청에서 제공하는 통계 관련 경제지표 300개도 활용했다. 그 다음 그린플럼 데이터베이스와 그린플럼 하둡을 사용해 데이터를 저장했다.

“95개 주가 종목에 대해서 예측할 수 있는 K인덱스를 만들었습니다. K인덱스는 지금 시장의 감성이 어떤 뱡항으로 흘러가고 있는지를 알 수 있게 도와주는 지표입니다. 이 인덱스를 활용하면 현재 시장이 하락 또는 상승, 과열 추세인지 소셜 감성을 보고 판단할 수 있습니다.”

코스콤은 짧게는 5일, 길게는 1개월에서 6개월까지 주가 동향을 미리 예측할 수 있다고 설명했다. K인덱스 외 단기 주가 동향을 파악하기 위해 K인덱스 SMD-12, 중기 주가 동향을 파악하기 위한 K인덱스 SMD-26 지표를 만들어 주식 동향을 살폈다. 트위터 정보 외 뉴스 정보도 더하면서 주가 예측율을 높였다.
“주가 예측률이 60%가 되면 실제 업무에 활용할 수 있다고 합니다. 저흰 내부적으로 시험해 본 결과 60% 넘는 예측률을 기록했습니다. 물론 일부 종목은 60%에 못 미치기도 합니다.”
빅데이터 사례 한곳에…EMC ‘이펙트데이’ 개최중에서

어떤 방법론을 적용하여 지수를 개발했는지, 이와 같이 좀더 자세한 내용을 알고 싶지만 없네요. 코스콤 보다 더 먼저라고 해야 할까요? 저도 몰랐던 사례가 있었습니다. 2013년 8월입니다. 한국내에서 트위터를 이용한 감성지수를 개발하고 이를 매매에 적용한 사례가 있었습니다.

실험이 시작된 건 2011년이다. 다음소프트는 트위터나 페이스북 같은 소셜네트워크서비스(SNS)와 블로그·온라인 커뮤니티 등에 올라온 글을 아홉 가지 감정(기쁨·사랑·바람·싫음·미움·슬픔·두려움·분노·수치)으로 분류하고 이를 기반으로 특정 제품이나 브랜드가 소비되는 행태를 분석하는 빅 데이터 처리업체다. 분석 결과를 토대로 마케팅 방향 등을 컨설팅한다. 사람들의 감정이 제품 소비에 미치는 영향을 분석하다 보니 ‘주가도 감정의 영향을 받아 움직이지 않을까’ 하는 궁금증이 생겼고, 국내 최초의 SNS 펀드 출범으로 이어졌다.

 펀드 운용의 핵심은 SNS에서 표출되는 사람들의 감정을 통계적으로 분석해 이를 투자와 연결시키는 것이다. 투자(investment)가 합리적인 이성 못지않게 감성적인 요인에 의해 좌우된다는 사실은 심리학에서 많이 연구된 사안이다. 이에 따라 하나의 종목과 트위터상에 나타난 9개 감정의 빈도 간 상관관계를 수학적으로 계산해 상관관계가 90% 이상인 것들만 골라낸다. 이 중에 감정 변화에 따른 변동률이 커 거래수수료를 빼더라도 수익이 나는 걸 다시 골라 매수 또는 매도에 나선다.
[J Report] 감정에 충실하니 상승 종목 보이네중에서

이 경우 위의 그림을 통해 어떤 방법론을 적용했는지 짐작할 수 있습니다.

2.
미국회사중 트위터 감성지수 분야에서 가장 큰 영향력을 가진 업체는 Social Market Analytics입니다. NYSE, Markit과 같은 회사를 통해 서비스를 제공중입니다. 이들이 만든 기술이 S-Factor Technology입니다.

S-Factor 기술을 이용하여 만든 감성지수가 S-Factor입니다.

이를 적용한 결과가 있을까요? 두가지 자료가 있습니다.

Deltix Quantitative Research가 Tabb Forum에 A Study on Using Twitter Sentiment in an Automated Trading Strategy입니다. 이와 관련한 자세한 투자 실적은 아래에 있습니다.

An Automated Trading Strategy Using Twitter Sentiment

또다른 보고서는 Markit 보고서입니다.

Download (PDF, 1.02MB)

Leave a Comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.