MySQL vs. NoSQL and NewSQL: 2011-2015

1.
NoSQL의 시대입니다. 전통적인 DBMS를 뛰어넘는 새로운 개념들이 등장하고 발전하고 번성하고 있습니다. 이런 흐름속에서 뿌리는 전통적인 SQL이지만 성능이나 지향은 NoSQL제품들이 나오고 있습니다.

가끔 소개하였던 VoltDB와 같은 종류를 말합니다. 2011년 4월 ?451Group이라는 컨설팅회사가 이런 흐름은NewSQL 이라고 정의하였습니다.

“NewSQL” is our shorthand for the various new scalable/high performance SQL database vendors. […NewSQL vendors] have in common the development of new relational database products and services designed to bring the benefits of the relational model to distributed architectures, or to improve the performance of relational databases to the extent that horizontal scalability is no longer a necessity.

We would include (in no particular order) Clustrix, GenieDB, ScalArc, Schooner, VoltDB, RethinkDB, ScaleDB, Akiban, CodeFutures, ScaleBase, Translattice, and NimbusDB, as well as Drizzle, MySQL Cluster with NDB, and MySQL with HandlerSocket. The latter group includes Tokutek and JustOne DB. The associated “NewSQL-as-a-service” category includes Amazon Relational Database Service, Microsoft SQL Azure, Xeround, Database.com and FathomDB.
NoSQL, NewSQL and Beyond: The answer to SPRAINed relational databases?중에서

Ingres를 만들었고 Postgres와 Illustra를 만들었던 마이클 스톤브레이커는 the need for far more OLTP throughput, the need for real-time analytics으로 NewSQL이 등장한 배경을 설명합니다.

1)Traditional OLTP. This architecture is not ideal for New OLTP for two reasons. First, the OLTP workload experienced by New OLTP may exceed the capabilities of Old SQL solutions. In addition, data warehouses are typically stale by tens of minutes to hours. Hence, this technology is incapable of providing real-time analytics.

2)NoSQL. There have been a variety of startups in the past few years that call themselves NoSQL vendors. Most claim extreme scalability and high performance, achieved through relaxing or eliminating transaction support and moving back to a low-level DBMS interface, thereby eliminating SQL.

In my opinion, these vendors have a couple of issues when presented with New OLTP. First, most New OLTP applications want real ACID. Replacing real ACID with either no ACID or “ACID lite” just pushes consistency problems into the applications where they are far harder to solve. Second, the absence of SQL makes queries a lot of work. In summary, NoSQL will translate into “lots of work for the application”?i.e., this will be the full employment act for programmers for the indefinite future.

3)New SQL. Systems are starting to appear that preserve SQL and offer high performance and scalability, while preserving the traditional ACID notion for transactions. To distinguish these solutions from the traditional vendors, we term this class of systems “New SQL.” Such systems should be equally capable of high throughput as the NoSQL solutions, without the need for application-level consistency code. Moreover, they preserve the high-level language query capabilities of SQL. Such systems include Clustrix, NimbusDB, and VoltDB. (Disclosure: I am a founder of VoltDB.)

New SQL: An Alternative to NoSQL and Old SQL for New OLTP Apps중에서

NewSQL이라는 의미를 NoSQL의 연장선에서 사용을 하든 아니면 전통적인 의미의 DBMS가 Big Data시대에 새롭게 변화한 형태로 이해를 하든 배경은 Big Data입니다.

이상을 적절히 섞어서 소개한 논문은 아래입니다.

NewSQL ? The New Way to Handle Big Data

2.
제가 NewSQL을 한번 소개할까 준비를 하는데 Mimul님이 먼저 잘 정리한 글을 포스팅하셨더군요.

SQL과 NoSQL의 장점을 결합한 NewSQL에 대해

덧붙일 내용이 없어 그냥 트윗을 날릴까 하다가 451Group이 ‘MySQL vs. NoSQL vs.NewSQL survey? results’라는 자료를 발간하여 소개합니다.

3.
국내로 보면 알티베이스나 선재소프트의 신제품들이 NewSQL이라고 할 수 있을 듯 합니다.

메모리DB를 부담없이!

재미있는 일이 있습니다. 얼마전 기사를 보니 한국거래소가 빅데이타분석을 위하여 R이라는 제품을 도입하기로 했다고 합니다. 그런데 기사중 이런 문장이 있습니다.

현재 한국거래소에서는 R을 금융데이터를 분석하는데 사용하고 있다. 파생상품시장에서 주문과 체결을 진행할 때 오고가는 데이터를 수집해 이를 분석하고 있다. 하루치 분량의 호가 분석에 R을 적용하고 있으며 데이터 규모는 4기가 정도다. 현재는 테스트에 집중하고 있으며 향후 분석 용량을 늘려나갈 계획이다.
한국거래소(KRX)의 빅데이터 대응 전략, IT업계 비상한 관심중에서

하루 4기가라고 하면 20영업일 기준으로 하면 80기가이고 4개월정도면 320기가입니다. 분석용량을 늘리는 일은 결국 데이타관리와 관계하는데 어떻게 데이타를 관리할지에 대한 이야기가 빠진 듯 합니다.

Leave a Comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.