본문 바로가기

PRODUCT/Solutions

AGI 시대를 위해 탄생한 EDB Postgres AI

최근 기업들은 데이터 관리와 활용 과정에서 복잡한 문제에 직면하고 있습니다. 과거에는 운영 데이터베이스와 데이터 웨어하우스라는 비교적 단순한 구조로 데이터를 관리했지만, 빅데이터와 AI 기술의 발전으로 데이터 레이크, AI 솔루션 등 다양한 시스템을 추가로 도입하게 되면서 데이터 기술 스택이 복잡해졌습니다. 이러한 복잡성은 관리 비용의 증가와 시스템 간의 연동 문제를 야기했습니다.

 

또한, 기업 내 여러 부서나 시스템이 각자 데이터를 분리하여 관리하는 '데이터 사일로' 현상은 데이터의 단절을 초래했습니다. 이는 통합적인 데이터 분석을 어렵게 만들어 기업 전체의 효율성을 저해하는 주요 원인이 되었습니다. 이러한 문제를 해결하기 위해 기업들은 핵심 운영 데이터와 AI/분석 시스템을 통합하여 데이터로부터 최대한의 가치를 창출하는 데 주력하고 있습니다.

 

복잡성과 사일로 문제에 대한 EDB의 해결책 'EDB Postgres AI'

데이터 환경이 복잡해지고, 사일로 문제도 해결이 어려운 상황에서 기업은 AI가 모든 엔터프라이즈 컴퓨팅 환경에 녹아 드는 새로운 시대를 맞이하고 있습니다. 이런 혼란스러운 상황을 정리하기 위해 EDB는 EDB Postgres AI라는 해결책을 내놓았습니다. EDB Postgres AI는 트랜잭션, 분석, AI 워크로드를 하나로 통합한 데이터 플랫폼입니다. PostgreSQL의 강력한 오픈 소스 엔진을 AI 영역까지 확장한 플랫폼이라 이해하면 됩니다. 기능적으로 보자면 단일 패키지로 OLTP(온라인 트랜잭션)와 OLAP(온라인 분석 처리), AI 벡터 처리까지 지원합니다. 오라클의 MySQL HeatWave와 컨셉이 비슷하다고 볼 수 있습니다.

 

EDB Postgres AI 주요 특징 둘러보기

EDB Postgres AI는 Postgres 엔진을 확장하여 AI 관련 고급 기능을 제공합니다. 벡터 데이터베이스, 생성형 AI 파이프라인, 데이터 레이크하우스 통합, 거대 언어 모델(LLM) 도구 등 다양한 기능이 내장되어 있습니다.

 

이미지 출처: EDB

 

 

이제 주요 기능을 하나하나 상세히 알아보겠습니다.

  • 네이티브 벡터 DB 기능: EDB Postgres AI는 pgvector 오픈소스 확장을 통합하여 벡터 임베딩 저장 및 유사도 검색을 지원합니다. 이를 통해 LLM 기반 애플리케이션의 핵심인 벡터 검색을 Postgres 내에서 수행할 수 있습니다. EDB는 벡터 쿼리 엔진을 최적화하여 기존 PostgreSQL 대비 더 빠른 벡터 쿼리 성능을 달성하였고, 효율적인 벡터 인덱싱으로 고차원 벡터의 유사성 검색 속도를 극대화했습니다. 이러한 통합으로 별도의 전문 벡터 데이터베이스 없이 Postgres 하나로 AI 임베딩 데이터를 관리하고 검색할 수 있습니다.
  • Analytics Lakehouse 통합: 실시간 분석 가속기를 통해 트랜잭션 데이터와 연동되는 레이크하우스(lakehouse) 기능을 구현하였습니다. Apache Arrow, DataFusion, Delta Lake 등의 오픈 기술을 접목해 데이터를 이중으로 복제하지 않고도 운영 데이터베이스에 연결된 분석 클러스터를 구성할 수 있습니다. 이 Analytics Accelerator는 쿼리를 벡터화(vectorized) 엔진으로 처리하여 표준 Postgres 대비 더 빠른 분석 쿼리를 제공하며, 계층형 스토리지로 콜드 데이터(cold data)는 객체 스토리지로 오프로드하여 고성능 SSD 비용을 절감합니다. 이러한 설계로 ETL 없이 운영 데이터에 대한 실시간 분석이 가능해져, 운영과 분석을 단일 플랫폼에서 병행할 수 있습니다.
  • AI Accelerator(생성형 AI 파이프라인): 생성형 AI 애플리케이션을 단 5줄의 SQL로 구축할 수 있는 AI 가속기 기능을 제공합니다. 이는 EDB가 자체 개발한 Pipelines 확장으로 구현되었으며, 벡터 임베딩 생성부터 갱신, 질의 응답까지 엔드투엔드 파이프라인을 데이터베이스 내부에 자동화한 것입니다. 예를 들어 텍스트 임베딩이나 챗봇 응답 생성 등을 위해 보통 수십~수백 줄의 코드와 외부 ML 서비스가 필요하지만, EDB Postgres AI에서는 단순 SQL 함수 호출 몇 개로 이를 수행할 수 있습니다. 이런 특징으로 데이터 파이프라인 관리 복잡도를 줄여 개발자들이 신속히 생성형 AI 기능을 애플리케이션에 내장할 수 있습니다.
  • AI Migration Copilot (LLM 기반 마이그레이션 도우미): EDB Postgres AI에는 Oracle 등의 기존 데이터베이스에서 Postgres로의 마이그레이션을 돕는 생성 AI 코파일럿이 포함되어 있습니다. 이는 OpenAI의 LLM과 EDB의 수년간 축적한 마이그레이션 지식을 접목한 챗봇 인터페이스로, Oracle 스키마 호환성 점검 중 발생하는 오류나 이슈에 대해 대화형으로 원인과 해결책을 안내합니다. Oracle 호환 모드로 전환 시 90% 이상은 자동 호환되지만 남은 비호환 요소를 사람이 일일이 수정해야 했던 부분을 Copilot이 맥락에 맞춰 해결 방법을 제시해 마이그레이션 시간을 단축시킵니다.
  • 하이브리드 컨트롤 플레인 & 모니터링: Hybrid Control Plane이라는 관리 콘솔을 통해 멀티클라우드/온프레미스에 분산된 Postgres 인스턴스들을 단일 화면에서 관측 및 제어할 수 있습니다. 여러 성능 지표를 실시간 모니터링하고, 자동화된 데이터베이스 운용 기능을 제공합니다. 이를 통해 관리자는 여러 환경에 걸친 데이터베이스들을 일관되게 운영하고 문제를 빠르게 파악할 수 있습니다. 또한, 백업/복구, 클러스터링 등의 엔터프라이즈 운영 기능도 기본 제공하여 고가용성과 데이터 보호를 보장합니다.
  • 보안 및 개방형 아키텍처(Secure OSS): 오픈 소스 소프트웨어에 대한 신뢰성과 보안 강화를 위해 SBOM(Software Bill of Materials) 제공 및 취약점 관리 강화도 특징입니다 . SBOM은 EDB Postgres AI에 포함된 모든 오픈 소스 구성요소를 투명하게 나열하여 공급망 보안 가시성을 확보하는데, EDB는 이를 통해 구성 요소의 검증과 취약점 최소화를 이루었다고 강조합니다. EDB는 100% 오픈 소스 기반 코드를 엔터프라이즈 보안 베스트 프랙티스를 기반으로 강화했으며, Zero Trust 및 FedRAMP 등 엄격한 보안 표준에 부합하도록 설계했다고 밝히고 있습니다. 이처럼 보안에 신경을 많이 쓰는 이유는 무엇일까요? 데이터와 AI 모델을 조직 내 통제 하에 안전하게 운영할 수 있어, 데이터 주권(Sovereign AI) 요구 사항을 충족하기 위해서라고 보면 됩니다.

 

이 외에도 EDB Postgres AI는 JSON, 시계열, GIS 등 다양한 데이터 모델의 통합, Kubernetes 기반 마이크로서비스 지원, Geo-분산 및 엣지-코어 데이터 파이프라인 등의 현대적 요구 사항도 포괄하는 옴니 데이터 플랫폼으로 진화하고 있습니다.

 

미래를 위한 준비

살펴본 바와 같이 EDB Postgres AI는 디지털 전환(DX), AI 전환(AX)을 주도하는 차세대 애플리케이션의 성장과 함께 확장 가능한 아키텍처를 제공합니다. 초기에는 소규모로 시작해도, 클러스터링과 분산 구성을 통해 성능 및 저장용량을 선형 확장할 수 있어 성장하는 데이터 수요를 감당할 수 있습니다. 또한, 멀티 클라우드 지원 덕분에 업무별로 최적의 인프라를 조합하거나 클라우드 종속을 피하는 전략적 클라우드 활용이 가능합니다. 기술적으로도 Apache Iceberg와 같은 최신 데이터 레이크 테이블 포맷 지원 예정 등 지속적인 기능 업그레이드가 로드맵에 있어 새로운 AI 알고리즘, 데이터 유형에도 유연하게 대응할 수 있습니다. 더 자세한 내용이 궁금하시면 락플레이스로 문의 바랍니다.