10G 이야기 둘

1.
10G 이야기 두번째입니다. 스위치이야기를 한번 더 하려고 합니다. 그 전에 런던에서 있었던 증권IT관련 세미나를 소개하려고 합니다. 찾아보지 않아서 그런지 몰라도 국내에서 이루어지는 세미나중 눈에 띄는 것이 없습니다. 대부분 벤더들의 제품이나 전략을 소개하는 자리입니다. 아니면 거창한 비전이나 차세대전략과 같이 피부에 와닿지 않는 주제들입니다. 그에 비하면 월스트리트나 런던을 다양한 세미나들이 열립니다.

2000년대초 월스트리트의? 동향을 알아보기 위해 자주 찾았던 곳이 The Securities Industry Middleware Council입니다. 분기별로 주제를 잡아서 세미나를 하는데 하나같이 새겨볼 만 하였습니다. 지금은 거의 활동을 하지 않습니다. 최근에 증권IT 잡지나 분석회사가 주최하는 세미나가 많은 듯 합니다. 올라오는 자료를 보면 해외의 기술동향을 알 수 있어 좋습니다. 그 중 A-Team Group이 주최한 Low Latency와 관련된 세미나에서 나왔던 이야기를 소개합니다.

The Business and Technology of Low-Latency Trading

위를 선택하면 세미나때 발표된 여러 글들이 올라와 있습니다. 그중 아래는 한 번 읽어보시길 바랍니다.

LowLatency 101

후기의 출처는 아래와 같습니다. 후기라도 소개하는? 이유는 해외의 동향중 국내증권IT에도 의미있는 이야기가 있기 때문입니다.

Low Latency Conference Surfing in London

세계 어디서나 Low Latency 환경을 구축할 때 시작점은 병목구간이 어디인지를 확인하기 위한 시험을 하고 분석하는 일입니다. 그래서 이런 말을 합니다.

“If you can’t measure it you can’t fix it,”

이 때문에 PTP와 같은 표준이 중요함을 확인하였다고 합니다. Low Latency를 향한 노력이 FPGA로 이어지고 있고 거대한 흐름을 형성하고 있습니다.CPU에서 실행하는 알고리즘을 네트워크카드위의 실리코칩에 담아서 실행하는 방식입니다. 더 나아가면 네트워크카드가 아니라 스위치가 알고리즘을 실행하는 기기로 등장하지 않을까 예상하고 있네요.(^^) 아래 URL을 보시면 FPGA에 대해 자세히 설명하고 있습니다.

FPGA

NovaSparks라는 회사가 자사 홈페이지에서 소개한 FPGA를 이용한 Hardware Processing의 특징을 소개한 글입니다. 리얼타임 리눅스와 멀티코어 서버, RDMA를 지원하는 TOE카드 그리고 Core-2-Core IPC Messaging로 무장한 시스템과 또다른 지향점입니다.

What is Hardware Processing?
Trading latency is affected by two key elements: network latency and data processing latency

Network Latency
The goal of our ultra-low latency solution is to deliver information to algorithms in the fastest possible time and with guaranteed latency. The major challenge to this goal is the TCP/IP stack, NIC (Network Interface Cards) between the information from the market and the algorithmic trading appliance.

NovaSparks has addressed this completely; by removing the need for TCP/IP and NIC cards, the required information is delivered to the algorithm without needing to access the network.? This is achieved through PCIe outputs operating at 16Gb/s sending the information to a dedicated PCIe card within the algorithmic server. NovaSparks enhances this technology by providing user space device drivers that receive and process the order book efficiently with the lowest possible latency. This approach combined with our fan-out capability ensures NovaSparks clients receive the information they require, with deterministic latency and without incurring network latency during the trading cycle.

Data Processing Latency
Historically, latency has been reduced by using software programming solutions overlaid onto the processing speeds of the core hardware functionality.? This approach reduces the latencies significantly; however hardware processing provides the ultimate means to reducing the processing speeds of the core functionality itself.? This is only achieved using ‘FPGA’ processing, ‘Field Programmable Gateway Array’.

NovaSparks is the only firm to offer guaranteed sub-microsecond latency because all latency reduction is achieved using FPGA programming.? Other market solutions offer hardware and overlaid software combinations, however the combination is insufficient to ensure deterministic latency because the point at which software meets hardware creates additional latency in the end-to-end process.

Using a hardware-only approach, NovaSparks delivers end-to-end processing including data feed handling, order book processing, index computation & delivery direct to algorithmic trading black boxes.

Delivered through Unicast, Multicast, one or 10 Gb and PCI-Express, NovaSparks offers a proven, consistent and high performance approach, immune to market bursts and offering a fully scalable data input capacity.

Multi-Core, GPU 및 FPGA Processing까지 하드웨어를 기반으로 한 프로세싱이 시대의 흐름인 듯 합니다.

2.
위의 후기중 아주 중요하면서도 의미있는 글이 있습니다.

What’s the point of having network cards and switches turning over packets in under 10 micros when you spend 30 in the fire wall?

한국의 경우도 비슷합니다. 10G 스위치를 도입하거나 네트워크카드를 TOE나 RDMA를 지원하는 제품으로 바꾼다고 하더라도 방화벽에서 더 많은 지연이 발생하면 아무런 의미가 없어집니다. 그래서 월스트리트나 런던의 모임에서도 이런 이야기가 많았다고 합니다.우리가 주변에서 보는 방화벽은 방화벽과 관련된 여러가지 기능을 리눅스 커널에 구현한 제품들입니다. 그런데 위의 글을 보면 이를 극복하려는 시도가 있다고 합니다. FPGA를 이용하여 알고리즘트레이딩시스템을 구현한 것처럼 FPGA를 이용하여 방화벽을 구현하는 방식의 제품입니다. Fotinet이라고 하네요. 한번 참조하시길 바랍니다.

The firewall issue was raised at a couple of conferences, someone suggested that you could do without the firewall altogether and trust the exchange or add a line to the risk register. Good luck getting that past the audit committee and IT security. I know one vendor has implemented a firewall in silicon, Fortinet. They claim to have got the latency down to 3 micros, worth a look if your care about speed and keep the bad guys out.

성능이? 사실이라면 아주 뛰어납니다. 주변에 물어보니 한국에 진출했다고 합니다.

이제 본론입니다.지난 번 ’10G 이야기’에서 스위치와 네트워크카드를 간단히 이야기했습니다. 스위치와 관련하여? 짧지만 구매시 중요한 포인트를? 하나 이야기할까 합니다. 처음 제안서를 쓰기 위하여 가격조사를 하였습니다. 보통 본체 가격이 대부분이고 케이블은 사소하였지만 10G스위치는 다르더군요. 본체말고 광수신기와 케이블이 필요한데 이를 SR SFP+이라고 합니다.SFP+(XFP) 는 10GbE 용 Optical transceiver 입니다.SR은 Multi mode fiber용으로 300m 의 전송거리를 갖습니다. SRL(Short reach Light)은 Multi mode fiber용으로 100m 의 전송거리를 갖습니다.

그런데 스위치를 만드는 회사마다 SR SFP+정책이 다르다고 합니다. 자사 제품만 사용할 수 있고 타사 제품은 사용하지 못하도록 합니다. 물론 타사제품을 사용하였을 때 지연발생으로 성능저하를 우려할 수 있습니다. 하지만 시험하여 무시할 수 있는 수준이고 가격경쟁력이 있다고 하면 소비자로써는 선택가능한 경우입니다.

예를 들어볼까요. Force10 10GbE 48 port Switch의 정품 SR SFP+ (Force10)의 가격은 1,050,000원 정도입니다. 그런데 3rt party 호환제품은 250,000원 합니다. 48개를 구매한다고 할 경우 작지않은 비용의 절감을 이룰 수 있습니다.

예산없는 투자가 없기때문에 성능과 가격을 포함한 제품 검토로 효율적인 투자를 이룰 수 있습니다.

Leave a Comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.