고빈도매매와 FPGA가 만드는 IT의 미래

몇 일전 올렸던 부산 IDC는 치외법권지대?속의 대화를 다시 한번 복기를 해봅니다.

요즘은 없지만 한동안 Latency교육을 할 때 항상 하던 말이 있습니다.

“인류가 태어난 이후 상거래에서 항상 Latency는 중요했다.”

남들보다 정보를 빨리 알아서 매매에서 우위를 점하는 것은 기본입니다. 트레이딩에서 Latency도 경쟁에서 아주 중요합니다. 다만 동서고금을 막론하고 Latency는 공짜가 아닙니다. 비용이 들어갑니다. 들어간 비용보다 많은 이익을 얻을 수 있으면 충분히 감수하지만 그렇지 않으면 다른 방법을 찾아야 합니다. 불확실한 1 마이크로초를 줄이기 위하여 시간=비용을 투자하기 보다 데이타와 모델을 살펴보는 것이 더 효율적입니다.

그래도 Low Latency에 관심이 있는 분들을 위하여 최근의 흐름인 hardware acceleration을 Introducing FPGA-Based Acceleration for High-Frequency Trading 의 내용을 중심으로 정리합니다. Hardware Acceleration의 장점은 다음과 같습니다.

1.HFT is sensitive to both latency and jitter. Algorithms work better with deterministic latency segments. Hardware implementations provide the needed determinism.

2.HFT algorithms are highly proprietary and need to reconfigure fairly frequently. There are also always other traders monitoring orders at the exchange engine end (public data) applying sophisticated analytical algorithms to infer issuers’ identities and their types/parameters of execution algorithms. Particularly at the trader’s end, there are few template functions, and so hardware suppliers that target HFT platforms work more as custom-optimized FPGA solution providers.

HA와 관련한 영역을 그림으로 표현하면 아래와 같습니다.


그중 첫번째 네트워크 부문. 자주 다루었던 분야입니다만 여기서는 Switch와 FPGAC를 통합한 제품을 소개합니다. Xcel사의  XPM과 Enyx사의 nxlink이 있습니다. 그렇데 Cisco의 Nexus처럼 TCP Offload이 아닌 용도로 사용할 경우 금감원 규정을 위반합니다.

두번째 증거금과 같은사전위험관리입니다. CeloxicaGateLab이 제품을 내놓고 있습니다. 만약 한국 DMA를 위한 미니원장을 FPGA로 할 경우 어느 정도 비용이 들어갈까요? 그리고 얻을 수 있는 레이턴시 이익이 어느 정도일까요? 손익이 나옵니다.

세번째는 주문입니다. 최근 떠오르는 것이 NovaSparks의 옵션매매시스템입니다. 한국도 이와 같은 시스템을 도입한 경우가 있지만 탁월한 성과를 올렸는지 의문입니다.

네번째는 시세입니다. 오래전부터 강자가 Exegy입니다. 국내의 경우 한국거래소가 시세분배를 독점하고 있고 복수거래소도 없는 상태에서 도입할 필요가 있을지 의문입니다.

마지막으로 성능측정입니다. AdvancedIO와 같은 솔류션입니다.

이제 Low Latency와 관련하여 남은 부분은 마이크로웨이브입니다. 미국은 시카고와 뉴욕을 두고 차익거래를 하는 트레이더에게 인기가 있는 듯 합니다. 한국도 부산IDC를 이용하는 트레이더들이 관심을 가집니다. 그런데 비용이 아주 높다는 소문입니다. 무상으로 시세를 사용하는 것에 익숙한 국내 트레이더들이 자비를 들여서 시세를 사용할 의사도 없고 있다고 하더라도 영세한 규모로 인하여 지급여력이 없을 듯 합니다.

이상은 자주 읽었던 것이라 흥미가 없습니다. 그렇지만 몇 달 흥미를 유발한 기사들이 있습니다. 하나의 흐름을 보입니다. 출발은 마이크로소프트의 Catapult이었습니다. CPU 기술이 봉착한 난관이 배경입니다. 코아가 늘어나지만 CPU 속도는 빨라지지 않는 문제입니다.

Intel has yoked its entire business to the successful fulfillment of Moore’s Law, and proudly announces each new boost in transistor counts. And, yes, those “new” transistors can help to increase a compute core’s all-important instruction per cycle (IPC) metric – improved branch prediction, larger caches, more-efficient scheduling, beefier buffers, whatever – but the simple fact is that although chips have gone multi-core and are getting better at multi-tasking, those individual cores are not getting much faster due to any significant new discovery.

As AMD CTO Joe Macri recently told us, “There’s not a whole lot of revolution left in CPUs.” He did, however, note that “there’s a lot of evolution left.”
Microsoft ‘Catapults’ geriatric Moore’s Law from CERTAIN DEATH중에서

이를 해결하기 위하여 도입한 기술이 FPGA입니다.

The solution that Microsoft Research has come up with is to pair field-programmable gate arrays with typical x86 processors, then let some data-center services such as the Bing search engine offload certain well-understood operations to the arrays.

이렇게 얻은 결과는 성능 향상입니다.

MS, FPGA 칩 적용한 신개념 서버 개발

Microsoft는 이상의 결과를 토대로 A Reconfigurable Fabric for Accelerating Large-Scale Datacenter Services를 발표하였습니다.

Download (PDF, 1.57MB)

마이크로소프트는 위의 논문을 내놓기 이전인 2011년 Dark Silicon and the End of Multicore Scaling을 통하여 새로운 개념을 제안하였습니다. Transistor Utility Economics입니다.


Download (PDF, 4.61MB)

둘째는 인텔의 동향입니다. 마이크로소프트의 연구결과에 영향을 받았는지 알 수 없지만 인텔이 CPU와 FPGA를 통합한 제품을 내놓겠다고 합니다.

The FPGA provides our customers a programmable, high performance coherent acceleration capability to turbo-charge their critical algorithms. And with down-the-wire reprogramability, the algorithms can be changed as new workloads emerge and compute demands fluctuate. Based on industry benchmarks FPGA-based accelerators can deliver >10X performance gains. By integrating the FPGA with the Xeon processor, we estimate that customers will see an additional 2X in performance thanks to the low latency, coherent interface.

Our new Xeon+FPGA solution provides yet another customized option, one more tool for customers to use to improve their critical data center metric of “Performance/TCO”. It highlights our commitment to delivering the very best solutions across all data center workloads and our passion to lead in the transformation of the industry to cloud services.
Disrupting the Data Center to Create the Digital Services Economy중에서

하드웨어기술이 IT를 주도하고 있습니다. 그렇지만 기술적인 지평을 넓혀가는 하드웨어기술을 인간의 세계로 끌어오는 역할은 소프트웨어입니다. 아무리 비싼 제품을 사더라도 그것을 운용하는 알고리즘이 단순하면 ‘돼지에 진주목설이’입니다.

