본문 바로가기

OSS on Azure/Database

불붙은 클라우드 기반 DW 성능 경쟁 - 애저가 아마존 Redshift를 앞서가나요 ~ ~

*글 최초 발행일자: 2018.07.23*

최근 클라우드 기반 데이터웨어하우스 서비스 경쟁이 갈수록 치열해지고 있습니다. 한동안 아마존 Redshift가 주도하나 싶더니, 오라클이 최근 오라클 오토노머스 데이터웨어하우스를 공개하면서 전통적인 강자(?)의 면모를 보여 주었죠. 이 경쟁에 마이크로소프트가 '나도 있다'라는 강력한 메시지를 보내고 있습니다. 마이크로소프트가 앞세우는 것은 성능과 가성비입니다. 

마이크로소프트가 제공하는 클라우드 기반 데이터웨어하우스 서비스 이름은 '애저 SQL 데이터웨어하우스(Azure SQL Data Warehouse)'입니다. 이 서비스 관련 벤치마크 결과를 마이크로소프트가 공개했는데요, 그 수치가 인상적입니다. 공정을 기하기 위해 기가옴 리서치(Gigaom Research)를 통해 벤치마크를 수행했는데요, 주요 결과를 보시죠. 

먼저 30TB 규모의 데이터를 대상으로 한 쿼리 수행 성능 비교입니다. 업계에서 널리 쓰이는 TPC-H 표준으로 벤치마크를 진행한 결과 애저가 아마존보다 67% 정도 빠른 것으로 나왔습니다. 노드 수에 관계없이 일정한 편차가 보이는 걸로 봐서 전반적으로 성능이 앞선다고 봐도 되겠습니다. 

 

성능 다음으로 중요한 포인트는 뭐니 해도 가격 대비 성능이죠. 30TB 규모의 데이터를 다루는 워크로드를 기준으로 '가성비'를 따져보니 애저가 아마존보다 23% 정도 저렴한 것으로 나타났습니다. 

 

데이터웨어하우스 운영자 입장에서 가장 중요한 보는 것이 하나 더 있습니다. 사실 운영자 입장에서 성능과 가격보다 이게 더 중요할 수 있습니다. 바로 동시에 처리할 수 있는 쿼리 수입니다. 이게 제약이 심하면 아무리 성능이 좋고 가격이 매력적이라도 엔터프라이즈 환경에서 쓸 때 운영자가 사용자들의 원성(?)을 들을 위험이 있죠. 그래서 어느 정도까지 동시 처리를 보장하는지 잘 살펴야 합니다. 

동시 처리 가능한 쿼리 수를 비교해 보면 애저 SQL 데이터웨어하우스가 아마존 Redshift보다 2배 이상 넉넉합니다. 애저에서는 동시에 128개의 쿼리 처리가 가능한 반면 아마존은 50개 제약이 있습니다. 50개 뒤로 들어오는 쿼리는 앞서 보낸 쿼리 수행이 끝날 때까지 대기해야 합니다. 

최근 엔터프라이즈 데이터웨어하우스 환경의 부하 분산 및 새로운 분석 수요를 클라우드에서 수행하는 것에 관심이 커지고 있습니다. 관련해 담당자는 성능, 가격, 동시 처리 등 여러 면을 잘 따져 봐야 할 것 같네요.

 

*이 외에도 락플레이스의(2021~) 최신 뉴스레터 소식을 받아보고 싶으시다면? *

락플레이스 뉴스레터 구독하기 click

 

 

*락플레이스 1:1 문의 바로가기*

 1:1 문의 바로가기 click

 

 락플레이스는 2005년에 출범하여 대한민국 리눅스의 역사와 성장을 함께 해온 오픈소스 전문 기업으로 국내 최다 엔지니어, 국내 최고 기술력, 국내외 유수기업 컨설팅의 풍부한 경험과 탄탄한 기술력으로 고객의 성공적인 오픈소스 플랫폼 구축과 응용 프로그램 전체 범위의 서비스를 제공하고 있습니다. 락플레이스는 레드햇코리아로부터 Elite Business Associate/Advanced Business Parter/채널 어워드 한국  파트너/FY15 champion 등을 수상 파트너며, Microsoft Microsoft Cloud Solution Partner(CSP)로서 함께하고 있습니다