금융투자회사의 데이타관리, FIGI와 FIBO

1.
요즘 주변에서 듣는 이야기를 종합하면 금융투자회사의 화두중 하나가 ‘비용절감’이라고 합니다. 지난 몇 년의 흐름을 보면 당연합니다만 최근 다른 모습을 보입니다. 인력을 줄이는 것이 한계인 만큼 시스템 운영비를 절감하는 방안을 찾는 듯 합니다. 이를 위하여 금융투자회사들이 관심을 보이는 분야가 클라우드를 이용한 시세정보시스템 구축입니다. 금융투자회사가 매매중개하는 금융상품이 해외상품까지 넓어지면서 처리하여야 할 데이타가 많아졌습니다. 또한 HTS와 MTS로 제공하는 데이타는 속도 또한 중요합니다. 이 때문에 증권사들은 SUNDB와 같은 In Memory DBMS를 이용하여 대용량의 투자정보시스템을 구축하였습니다. 이를 NoSQL기반의 클라우드환경으로 전환하는 프로젝트입니다. 몇 증권사들이 추진하고 있다고 합니다. 적용하는 업무는 다르지만 클라우드를 업무에 적용한 사례는 유안타증권입니다.

국내 금융투자회사의 투자정보시스템은 HTS와 MTS와 같은 매매시스템의 근간을 이룹니다. 실시간 데이타뿐 아니라 과거데이타를 효율적으로 관리하여 고객에게 전달하여야 하기때문입니다. 그런데 지난 몇 년동안 투자정보시스템은 중개상품의 확대로 데이타의 처리용량에 커다란 변화를 보입니다. KRX가 제공하는 유가증권 및 파생상품시세은 기본입니다. FX마진을 제공하는 회사는 이종통화데이타까지 처리합니다. 여기에 몇 년전부터 급속도로 커지고 있는 해외거래소의 유가증권 및 파생상품시세까지 처리하여야 합니다. 국내에서 가장 큰 규모를 자랑하는 투자정보시스템은 코스콤이 제공하고 있는 CheckExpert입니다. 증권사가 구축한 투자정보시스템의 기술구조를 그대로 차용하였고 FID방식으로 데이타를 가공처리합니다. 그러면 해외는 어떻게 시장정보를 처리할까요? 가장 대표적인 시스템이 Thompson Reutere 및 Bloomberg의 MDS(Market Data System)입니다. 로이터와 블룸버그 시스템이 한국과 가장 큰 차이를 보이는 것은 데이타관리표준입니다. 로이터는 RIC(Reuters Instrument Code)와 FID를 사용하고 있고 블룸버그는 FIGI( Financial Instrument Global Identifier)를 적용하고 있습니다. 쉽게 말하면 코드관리를 각기 다른 방법으로 하고 있습니다. 로이터가 사용하는 방법은 한국 DMA와 HTS의 미래는 규제에 달렸다에서 간단히 소개하였습니다만 아래 자료로 RIC를 살펴보시길 바랍니다.

Download (PDF, 1.25MB)

반면 블룸버그는 Open Methodology를 채택하고 있고 이것은 OMG를 통하여 FIGI로 표준화되었습니다.

Download (PDF, 422KB)


Download (PDF, 187KB)

2.
다음은 메시징 및 이와 관련한 기술구조입니다. Reuters Market Data System은 OMM(Open Message Model)을 채택하고 있고 Pub/Sub기반의 메시징모델을 도입하였습니다. OMM을 소개한 자료입니다.

Download (PDF, 820KB)

다음으로 IBM이 작성한 RMDS의 기술구조입니다. 다만 블룸버그의 B-Pipe와 로이터의 RMDS는 증권사의 투자정보시스템에 비해 다른 역할을 합니다. HTS나 MTS의 기능은 Request/Reply방식과 Pub/Sub방식을 기본으로 한 독자적인 기술구조를 택하지만 RMDS와 B-Pipe는 코스콤의 시세분배시스템과 같은 시스템이라 메시징미들웨어를 이용한 기술구조를 적용하고 있습니다.

Download (PDF, 487KB)

이상을 좀더 자세하게 다루고 있는 것이 특허출원문서입니다.

Download (PDF, 3.67MB)

그리고 로이터는 단말방식의 서비스도 제공하지만 Robust Foundation API (RFA)와 같은 API를 별도로 제공하여 독자적인 시스템을 구축할 수 있도록 합니다. Python을 개발한 오프소스를 참고로 소개합니다.

PyRFA

Download (PDF, 5.69MB)

블룸버그 B-Pipe와 관련한 기술자료는 적습니다. 개발자 문서를 보면 Pub/Sub와 Request/Reply방식을 모두 제공합니다.

Download (PDF, 1.04MB)

Download (PDF, 488KB)

아울러 로이터처럼 블룸버그도 BLAPI로 독자적인 시스템을 개발할 수 있는 환경을 제공합니다.

Bloomberg API

이상에서 관심을 가질 부분은 데이타관리표준입니다. 국가, 거래소, 시장, 상품, 정보필드로 이어지는 하나의 체계를 만들어 데이타를 관리하는 것이 중요할 듯 합니다. 독자적인 모형이어도 좋고 FIGI와 같은 표준을 사용할 수도 있습니다.

3.
앞서 FIGI를 간단히 소개하였습니다. FIGI를 주도한 단체가 EDM Council입니다. 전사적데이타관리 협의회라고 할 수 있습니다. 이곳이 만든 또다른 표준이 FIBO입니다. FIBO는 시만텍 웹기술과 온톨로지(Ontology)를 금융에 적용한 표준입니다. 온톨로지는 ‘어떤 관심 분야를 개념화하기 위해 명시적으로 정형화한 명세서(an explicit and formal specification of a conceptualization of a domain of interest)’으로 자주 설명합니다.

Download (PDF, 835KB)

온톨로지와 비슷한 의미로 연상되는 단어가 메타데이터입니다. 메타데이터(metadata)는 데이터(data)에 대한 데이터로 Karen Coyle에 의하면 “어떤 목적을 가지고 만들어진 데이터 (Constructed data with a purpose)”라고도 정의합니다.

Download (PDF, 458KB)

메타데이타와 비슷한 개념이 마스터 데이터입니다.

메타데이터 관리는 종종 MDM과 혼동되곤 한다. 메타데이터라는 것 역시 기준 정보로 이해할 수 있기 때문이다. 그러나 MDM으로 통칭하는 마스터 데이터, 즉 기준 정보는 메타데이터와 구분되어야 한다. 쉽게 말해 메타데이터 관리는 데이터를 구성하는 정보를 관리하는 것이고 MDM은 실제 데이터를 관리하는 것이다. 이 때문에 MDM을 위해서는 메타데이터를 먼저 수집해야 한다. 데이터 통합뿐만 아니라 고객, 제품, 공급업체 등 데이터의 의미를 이해하기 위해서는 경험이 집적된 메타데이터 관리가 요구된다.

IT 시장 전문 분석 기업 가트너(Gartner)는 메타데이터를 ‘특정 정보 자산의 여러 측면을 기술하여 정보의 수명 주기 전반에 걸쳐 그 유용성을 개선하기 위한 정보’로 정의하고 있다. 즉, 정보를 자산으로 만들어 주는 것은 바로 이 메타데이터다. 메타데이터는 구조화된 정보를 분석, 분류하고 부가적 정보를 추가하기 위해 데이터에 따라가는 정보, 즉, 데이터를 위한 데이터라 할 수 있다.
메타데이터(Metadata)를 통한 효과적인 데이터 관리 전략중에서

일반적으로 데이타를 중심으로 한 시스템을 개발할 때 아래의 그림처럼 개념데이타모델 -> 논리적 데이터모델 -> 물리적 데이타모델로 진행합니다. 이 때 개념적 데이터모델을 다음과 같이 정의할 수 있습니다.

개념 데이터 모델은 핵심 엔터티(키엔터티, 메인엔터티)와 핵심 엔터티 사이의 관계 도출을 통해 핵심 구조라 할 수 있는 데이터 모델의 골격을 정의한 것이다. 이것은 데이터 아키텍처 상에서 개괄 데이터 모델로부터 업무 요건을 충족하기 위해서 데이터 주제영역별로 상세화하여 핵심 엔터티들을 도출하고 관계를 정의함으로써 생성되기도 하고, 수집된 엔터티 후보들을 검토하고 분류하여 핵심 엔터티들을 도출하고 이들 간의 관계를 정의함으로써 생성되기도 한다. 주제영역별로 작성된 개념 데이터 모델을 전사 영역으로 확장하여 하나의 개념 데이터 모델로 작성한 것을 전사 개념 데이터 모델(Enterprise Conceptual Data Model) 또는 확장 개념 데이터 모델(Extended Conceptual Data Model)로 부르기도 한다. 전사 개념 데이터 모델에서는 전사 관점의 핵심 엔터티와 관계를 통해 전사적인 핵심 데이터 구조를 정의한다.
개념 데이터 모델링 – 개념 데이터 모델 작성 중에서

개념적 데이타모델과 관련이 있는 것이 온톨로지, 메타데이타이라고 할 수 있고 금융비지니스와 관련한 국제적인 표준이 FIBO입니다. FIDO를 간단히 정리하면 아래와 같습니다.

What is FIBO?

The FIBO (Financial Industry Business Ontology) standard is an industry initiative to define financial industry terms, definitions and synonyms. It was driven by Dodd Frank and the industry requirement for improvements in data quality and transparency.

The FIBO ontology unambiguously describes, in business terms, contractual concepts for business entities, securities, derivatives, loans, market data, corporate actions and transactions.

FIBO is a key initiative of the EDM Council and is a collaborative effort among industry practitioners, semantic technology experts and information scientists to standardize the language used to precisely define the terms, conditions, and characteristics of financial instruments; the legal and relationship structure of business entities; the content and time dimensions of market data; and the legal obligations and process aspects of corporate actions.
Benefits of FIBO

The contextual meaning of FIBO provides a common standard reference point for data alignment across the industry and within internal applications, to make systems integration more economical. FIBO also aligns data for regulatory reporting, internal risk, compliance, and analytics.

The FIBO model can be effectively utilized to fulfil:

Regulatory governance
Data standardization
Risk management
Data analytics requirements

FIBO를 도입하면서 두가지가 달라질 듯 합니다. 첫째는 금융회사의 업무시스템을 구축할 때 통합마스타데이타시스템을 전제로 합니다. 대략 아래와 같은 그림입니다. 이 때 마스타데이타의 근거가 되는 부분이 메타데이타인데 온톨로지방식으로 메타데이타를 도출하고 이 때 FIBO를 도입하는 것입니다.

FIBO를 도입한 Deutsche Bank COO인 Shannon Walker의 발표입니다.

“Because FIBO is an ontology it gave us a jump from ETL [Extract-Transform-Load], 1990s style, to something new – Linked Data, semantic triple stores, and RDF,” noted Walker, with all the promise these offer of meaning and interaction.

As the bank saw it, the ontology’s benefits would revolve around creating an artifact that would be:

  • The practical representation of a common language for data elements, providing a way to decouple vendor terminology from what the bank is consuming and what systems it’s populating
  • A data model (including entities, attributes, and relationships)
  • Business rules
  • A taxonomy (classifications and hierarchies)
  • Code lists and enumerations (currency and country codes, for example)

Banking on FIBO: Financial Institutions Turn to Semantic Standard중에서

두번째는 전사적인 정보계를 Data Warehouse에서 Data Lake로 전환하는 것입니다. 빅데이타에 대한 관심이 높아지면서 전통적인 ETL방식의 DW를 대신하여 Data Lake라는 개념을 도입한 듯 합니다. 제가 이런 부분은 문외한이라 “듯 합니다”라고 표현하였습니다. Data Lake가 등장할 수 밖에 없는 이유를 설명한 그림입니다.What is a data lake?에서 옮겨온 도표입니다.

창고라는 뜻인 Warehouse를 Lake로 바뀐 이유를 생각해보면 창고가 내포한 의미에서 찾을 수 있습니다. 그림처럼 창고는 정리와 정돈을 전제로 합니다. 데이타의 양이 많아지면서 정리와 정돈을 하려면 비용이 늘어납니다. 효율성이 떨어집니다. 그래서 Lake라는 개념으로 변경하여 자연 그대로(Raw) 데이타를 담는 이미지를 만들어냈습니다. 때문에 ETL이 아니라 ELT로 바뀌어야 하는 것입니다. 때문에 차세대 정보계시스템의 비전을 말하면서 Data Lake를 소개하는 듯 합니다.

Download (PDF, 6.2MB)

여기서 한걸음 더 나아가면 Data Lake의 방대한 데이타를 효율적으로 분석하기 위해서는 Semantic 개념과 Data Lake를 결합하여 Semantic Data Lake가 나오고 이를 Smart Data lake라고 하는 곳도 있습니다. 이 때 FIBO와 같은 표준을 도입할 필요가 발생합니다. 이런 과점에서 FIBO와 Data lake를 결합한 사례가 영국 State Street Bank입니다. FIBO, FIBO, It’s Off to Work We Go가 소개한 내용입니다.

4.
국내 금융회사들이 국제표준에 대한 관심을 가지고 있는지 의문이 많습니다. 해외와 비즈니스환경이 다르기때문일 수 있습니다. FIGI와 FIBO가 국내 업무에 적용할 수 있을지 의문이겠지만 표준을 만들고자 했던 현실적인 요구와 이를 해결하고자 한 방향성은 의미가 있으리라 생각합니다. 좁게 보더라도 FIGI와 같은 개념은 통합시장정보(시세정보)시스템을 구축할 때 필요할 듯 합니다. 국내 투자자에게 제공하는 해외상품이 늘어날 뿐 아니라 해외로 진출하는 규모가 커지면서 표준은 점점더 중요해지리라 생각합니다. FIX처럼.

Leave a Comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.