새로운 접근법으로 질의문 처리 속도 대폭 증가, 세계 최고
[대전=뉴스봄] 육군영 기자 = 세계 최고 성능을 자랑하는 국산 데이터베이스관리시스템(DBMS, DataBase Management System)이 국내 연구진에 의해 개발됐다.
23일 KAIST 전산학부 김민수 교수 연구팀은 데이터베이스 성능의 척도라 할 수 있는 질의 언어 SQL(Structured Query Language, 구조화 질의어) 처리 성능을 미(美) 옴니사이(OmniSci) DBMS 대비 최대 88배 빠른 DBMS를 만들었다고 밝혔다.
KAIST 관계자에 따르면 김 교수 연구팀은 데이터 처리를 위해 산업표준으로 사용되는 SQL 질의를 기존 DBMS와는 전혀 다른 방법으로 처리했다.
이 기술은 오라클·마이크로소프트 SQL서버·IBM DB2 등 타 DBMS에도 적용할 수 있어 고성능 SQL 질의처리가 필요한 다양한 곳에 폭넓게 적용될 수 있을 것으로 기대된다.
오늘날 메인 메모리 기반의 SQL 질의처리 시스템들은 산업 분야에서 비즈니스 데이터들을 분석처리하는 데 필수적으로 사용되고 있다.
그러나 사회가 고도화됨에 따라 데이터베이스의 구조도 점점 복잡해지면서 데이터 분석을 위해 사용되는 SQL 질의도 복잡한 형태가 많이 사용되면서 SQL 질의처리 속도가 곧 DB의 성능을 가르는 척도가 됐다.
그러나 기존 DBMS는 간단한 질의어의 형태인 PK-FK 관계로 결합한다는 가정하에 개발돼 FK-FK 결합 등의 복잡한 질의를 처리할 경우 매우 느리거나 심지어 처리하지 못하고 실패하는 문제가 있었다.
김 교수팀은 문제해결을 위해 여러 개의 작은 `왼쪽 깊은 이진 트리'를 `n항 조인 연산자'로 묶는 형태로 배치해 처리하는 기술을 개발했다.
이때 각각의 `작은 이진 트리' 안에는 FK-FK 결합관계가 발생하지 않도록 테이블들을 배치하는 것이 핵심이다.
각각의 `작은 이진 트리'의 처리 결과물을 `n항 조인 연산자'로 결합해 최종 결과물을 구하는 것도 난제로 꼽히는데 연구팀은 `최악-최적(worst-case optimal) 조인 알고리즘'이라는 방법으로 이 문제를 해결했다.
`최악-최적 조인 알고리즘'은 그래프 데이터를 처리할 때 이론적으로 가장 우수하다고 알려진 알고리즘이다. 김 교수 연구팀은 세계에서 가장 먼저 이 알고리즘을 SQL 질의처리에 적용해 난제를 해결하는 데 성공했다.
김 교수 연구팀은 새로 개발한 DBMS 기술을 GPU 기반의 DBMS 개발업체인 미국 옴니사이(OmniSci)사 제품에 적용한 결과 OmniSci DBMS보다 성능이 최대 88배나 향상된 결과를 얻었다.
또 TPC-DS 벤치마크에서도 세계 최고 수준의 성능을 가진 기존의 상용 DBMS보다 5~20배나 더 빠른 사실을 확인했다. TPC-DS는 DBMS의 성능을 측정하기 위한 산업표준의 최신 벤치마크이다.
교신저자로 참여한 김 교수는 "연구팀이 개발한 새로운 기술은 대부분의 DBMS에 적용할 수 있기 때문에 산업적 측면에서 파급효과가 매우 클 것으로 기대한다ˮ 라고 말했다.
미국 옴니사이(OmniSci)사에 재직 중인 남윤민 박사가 제1 저자로 김 교수가 교신저자로 참여한 이번 연구는 지난 18일 미국 오리건주 포틀랜드에서 열린 데이터베이스 분야 최고의 국제학술대회로 꼽히는 `시그모드(SIGMOD)'에서 발표됐다. (논문명 : SPRINTER: A Fast -ary Join Query Processing Method for Complex OLAP Queries).