3일 걸리던 일을 순식간에… 토종벤처 해냈다

빅데이터는 단순히 큰 데이터가 아니라 크고 많고 빠르고 복잡한 형태를 지닌 데이터를 말한다. 전에는 대부분 그냥 흘려보내거나 쌓아두기만 했다. 그러나 분석 기술의 발달로 정형이든 비정형이든 분석이 가능해졌고 서로 엮어 실시간으로 분석할 수 있는 플랫폼도 등장하고 있다.

빅데이터를 분석하기 시작하자 지금까지 발견하지 못했던 새로운 패턴이 드러나고 있다. 그 속에 다양한 의미가 내포돼 있다는 것을 알게 됐다. 데이터의 패턴 속에서 비즈니스에 필요한 인사이트를 얻을 뿐 아니라 데이터를 다루는 데 있어 보다 완벽한 보안체계를 구축할 수 있게 됐고 비용절감과 생산성 향상이 이뤄졌다.

이디엄(대표 양봉열)은 빅데이터 이슈와 함께 부상한 기업이다. 이디엄의 실시간 빅데이터 분석 시스템 `로그프레소'(LOGPRESSO)는 대용량 비정형 데이터를 실시간 수집ㆍ검색ㆍ분석ㆍ시각화해 기업의 의사결정을 돕는다.

이디엄은 지난 4월 쟁쟁한 외산을 물리치고 국내 L통신사가 발주한 실시간 서비스품질 모니터링 시스템의 빅데이터 분석 엔진 구축 사업자로 선정돼 업계를 놀라게 했다. 설립 1년밖에 안 된 신생벤처가 외산이 장악한 국내 빅데이터 검색솔루션 시장에, 그것도 통신3사 중 한 곳에 검색엔진을 제공함으로써 파장을 몰고 온 것이다.

이디엄은 최근 금융권 이상금융거래탐지시스템(FDS) 성능 업그레이드 BMT에서도 잇따라 수위를 차지했다. 금융권 FDS에서는 로그를 모두 모을 수 있어야 하고 실시간 행위를 들여다볼 수 있는 룰(rule) 엔진이 필요하다. 로그프레소는 이를 만족시킴으로써 현재 M, D 증권사와 도입 협상을 진행 중이다.

이디엄의 로그프레소가 승승장구하는 요인은 제품력이 뛰어나기 때문이다. 로그프레소는 데이터의 수집에서부터 유의미한 정보도출에 이르기까지 데이터의 전체 생명주기를 아우르는 모든 기능을 통합해 제공한다. 로그프레소를 도입하면 즉각 빅데이터 분석에 들어갈 수 있다. 기능이 통합돼 있고 기존 시스템과 뛰어난 호환성을 갖기 때문이다.

통신사에 엔진을 공급할 수 있었던 데는 외산 솔루션에 비해 5배 이상 빠른 데이터 분류 및 검색, 분석 능력이 작용했다. 로그프레소는 3일 이상 걸리던 분석시간을 초단위로 획기적으로 단축했다. 실시간 통신데이터 검색 및 분석이 가능해진 것이다.

빅데이터 분석을 위해서는 다양한 조건이 요구된다. 유닉스 윈도 등 상용서버 운영체제, 스위치 라우터 방화벽 IPS 등 네트워크, RDBS(관계형 데이터베이스) 등의 데이터와 웹 및 웹 앱 서버와 보안 및 응용프로그램의 로그 수집이 필요하다. 데이터 파싱(parsing) 및 정규화 등 다양한 포맷 처리도 능란해야 하고 수천만 건 이상의 방대한 대용량 로그를 고속으로 압축 전송하고 저장해야 한다. 여기에 개인정보 등 암호화와 데이터 위ㆍ변조 탐지, 실시간 풀 텍스트 검색과 데이터 분석 능력이 붙어야 한다.

이에 대한 해법으로서 이디엄의 로그프레소는 다수의 표준 프로토콜 및 에이전트를 지원하고 내장 파서(parser, 프로그램 구문 해석 알고리즘) 및 쿼리를 이용한 정규화를 채택했다. 국내외 대부분의 보안 솔루션과 장비의 로그 포맷에 대한 파서도 내장했다. 원본 대비 10% 크기의 에이전트 실시간 압축 전송을 지원하고 초당 80만 건의 고속 데이터를 저장할 수 있다. 임시 파일 생성 없이 실시간 암호화하고 무결성 검사도 지원한다. 실시간 풀텍스트 검색을 위해 다양한 인덱스 내장 방식을 취한다.

스트림 분석은 경쟁 제품이 따라오지 못하는 로그프레소만의 강점이다. 이벤트 컨텍스트 함수를 이용한 인 메모리 이벤트 연관 분석과 스트림 쿼리를 통한 실시간 스트리밍 데이터 분석은 폭증하는 미래 빅데이터 환경에 대비해 개발했다.

이러한 기술력과 스펙은 통합보안관제와 통합로그관리 솔루션 시장에서 로그프레소가 부상하는 배경이 됐다. 다양한 표준 프로토콜 지원은 물론, 예약된 쿼리를 통해 실시간 및 배치 ETL(데이터 추출 변환 적재)를 지원한다. 관계형 데이터베이스 데이터를 조합 분석하는 유연성도 뛰어나다. 운영관제에 필수적인 대시보드 구성을 손쉽게 하는 사용자 정의 대시보드 기능도 탁월하다. 하둡(HDFS)과 연동해 사용할 수 있으므로 하둡으로 수집한 데이터를 로그프레소를 이용해 추가적인 분석과 시각화를 수행한다. 로그프레소는 경찰청 도로교통공단 등 공공, 금융결제원 등 금융, L통신사 등 통신과 병원, 일반기업에 고른 레퍼런스를 확보하고 있다.

이규화선임기자 david@

http://www.dt.co.kr/contents.html?article_no=2014062402011375660001

둘러보기

더보기

“스플렁크 게 섯거라”…청년 벤처의 도전

어느 날 우연히 국내 벤처 업체 중 하나가 스플렁크에 대적할 솔루션을 개발했다는 이야기를 들었다. ‘이디엄’이라는 회사명과 ‘로그프레소’라는 제품명 모두 낯설었다. 전 세계 빅데이터 시장에서 각광을 받고 있는 스플렁크에 대적할 소프트웨어를 국내 벤처기업이 개발했다는 것은 궁금증을 자아내기에 충분했다. 수소문 해서 이디엄 양봉열 대표에게 연락을 취했다. 그런데 그는 이미 기자가 알고 있던 인물이었다. 4년 전 ‘벤처스토리’라는 기획 시리즈를 진행할 때 ‘엔초비’라는 보안관제 회사를 설립해 인터뷰를 했던 인물이었다. 그러나 20대 청년에게 보안 시장은 녹록치 않았나보다. 야심차게 시작했지만 많은 쓴 맛을 봐야 했다. 결국 보안관제 사업은 계획대로 성장하지 못했고, 퓨처시스템에 인수됐다. 양 대표는 그러다 올해 초 다시 독립했다. 보안관제를 위해 개발해 왔던 로그분석 기술을 발전시키면 빅데이터 시대에 괜찮은 솔루션을 개발할 수 있을 것이라는 생각 때문이었다. 로그를 다루는 기술은 엔초비 시절부터 개발해 온 것이었다. 보안 관제를 위해서는 보안로그를 분석해 위협을 파악해야 하기 때문이다. 하지만 당시에는 로그를 단순히 저장하고, 가져오는 기술만 보유하고 있었다. 여기에 인덱싱과 검색, 리포팅 등의 기능을 추가해 스플렁크와 같은 솔루션을 개발했다. 양 대표는 “처음에는 보안 장비에서 나오는 로그를 분석하기 위해 기술을 개발했는데, 빅데이터 시대가 도래하면서 센서네트워크를 비롯해 웹로그, 사용자행동로그 등 다양한 로그를 다 처리할 수 있도록 했다”고 설명했다. 양 대표는 ‘로그프레소’의 강점으로 보안성을 들었다. 처음에 보안업체로 시작했기 때문에 보안에 중점을 두고 개발했다는 설명이다. 그는 “스플렁크는 암호화를 내장해서 지원하지 않는다”면서 “로그프레소는 모든 데이터가 암화화 돼 저장되는 등 보안에 뛰어나다”고 강조했다. 또 하둡 등 외부 빅데이터 플랫폼과의 연동성도 뛰어나다고 설명했다. 양 대표는 “로그프레소는 자바로 개발된 플랫폼으로 하둡과 궁합이 잘 맞는다”면서 “실시간 분석은 로그프레스로, 배치 처리는 하둡으로 통합해 고도 분석을 할 수 있다”고 말했다. 하둡뿐 아니라 기존 관계형 DB의 데이터와도 연동할 수 있다고 그는 덧붙였다. 물론 그렇다고 당장 스플렁크보다 우수한 솔루션을 개발했다고 자신할 수는 없다. 현재로서는 분산처리가 지원되지 않고, 스플렁크의 가장 큰 장점으로 꼽히는 이용자 편의성도 부족한 편이다. 양 대표는 “당장 스플렁크를 대체할 수는 없다고 하더라도 스플렁크까지 도입할 필요가 없는 기업이나, 스플렁크가 지나치게 고가여서 도입하기 어려운 기업들도 많기 때문에 일단 이 시장을 공략할 예정”이라면서 “그러나 내년 초 현재 중비 중인 기능과 기술이 완성되면 정면대결도 가능할 것으로 보고 있다”고 말했다. [디지털데일리 심재석기자] [https://www.ddaily.co.kr/news/article/?no=111116](https://www.ddaily.co.kr/news/article/?no=111116)

2013-11-19

[FDS특집] 사기거래 방지에 나선 금융권, 앞 다퉈 FDS 도입

대형 카드사의 대규모 고객정보 유출. 피싱·파밍 등 금융정보를 노리는 각종 사이버 위협이 증가하고 불법적·악의적 정보 유출로 부정거래 발생 위험도 높아졌다. 금융감독 당국은 부정거래 등 사기거래를 방지하기 위해 금융사 이상거래탐지시스템(FDS) 구축 촉구에 나섰다. 카드사가 사기방지 위주로 적용했던 FDS가 전 금융권으로 확대된다. 금융·보안 솔루션 기업도 대거 국내 금융회사에 맞는 맞춤형 FDS 솔루션을 출시, 시장공략을 강화했다. ◇FDS 도입에 가장 적극적인 은행권 FDS 도입에 가장 분주한 곳은 은행권이다. 최근 금융감독원은 은행에게 해당 시스템에 적합한 FDS를 올해 말까지 구축하라고 요청했다. 금융위원회도 ‘금융회사 정보기술(IT)부문 보호업무 이행지침’에 FDS 구축을 포함시켰다. 그동안 FDS는 카드사가 불법적·악의적 카드 도용을 막기 위해 주로 도입했다. 그 외 금융회사는 FDS 도입에 적극적이지 않았다. 감독당국의 FDS 구축 요청으로 우리·하나·외환은행이 본격적으로 FDS 구축에 착수했다. 일부 FDS를 도입한 신한은행과 국민은행도 고도화를 진행한다. 하나은행과 외환은행은 이미 관련 솔루션 기업 대상으로 정보제공요청서(RFI)를 발송했다. 솔루션 업체로부터 정보제공을 받으면 이를 기반으로 제안요청서(RFP)를 작성, 배포할 계획이다. 하나·외환은행은 오는 9월까지 공동으로 FDS 구축을 완료한다는 목표를 세웠다. 외환은행 관계자는 “기존에 FDS 구축이 카드사 위주로 진행돼 은행 뱅킹 시스템에 적합한 프로그램을 찾는 게 쉽지 않다”며 “근본적인 대책 마련을 위해 방향성부터 고민해 준비하고 있다”고 전했다. 우리은행도 적극적이다. 개발업체 대상으로 의향서를 접수, 곧 RFP를 배포한다. 은행권에 독자적 FDS가 없어 뱅킹시스템 전반의 패턴 분석이 가능한 협력 기업을 선정할 예정이다. 우리은행 관계자는 “일부 은행이 FDS를 가동했지만 자체 모니터링을 하는 수준”이라며 “단계별 개발 일정을 확정하고 연말까지 모든 작업을 완료 하겠다”고 말했다. 차세대시스템을 구축 중인 기업은행은 FDS 고도화를 준비한다. 현재 운영 중인 이상징후탐지시스템의 정밀도를 패턴분석이 가능할 정도로 높이는 게 목표다. 앞서 FDS 솔루션 업체 대상으로 설명회도 개최했다. 기업은행 관계자는 “은행 서비스의 특성을 반영, 이상 징후를 분석할 수 있어야 한다”며 “이를 구현할 수 있는 프로그램을 확보하기 위해 고민 중”이라고 설명했다. 국민은행도 자체 로그분석 시스템에 FDS 기능을 보강하는 고도화 작업을 계획하고 있다. FDS가 주목받는 것은 전자금융결제 수문장 역할을 하던 공인인증서를 비롯해 개인방화벽, 보안카드, 일회용비밀번호(OTP) 등 인터넷뱅킹 보안 솔루션을 무력화하는 공격이 늘어났기 때문이다. 더 이상 고객 PC나 스마트폰 보안을 강화하는 솔루션을 적용하기 힘들다. 금융사는 내부 시스템에 FDS를 운영해 금융정보가 유출됐더라도 금융사기 피해를 최소화하는데 집중한다. FDS는 최근 발생한 앱카드 부정사용을 알아내며 효과를 입증했다. 성재모 금융보안연구원 본부장은 “최근 금융거래 사기는 그동안 신뢰했던 인증수단을 피해 나타났다”며 “금융사는 정보가 유출돼도 2차 피해를 최소화하는 모니터링을 강화할 수밖에 없는 상황”이라고 말했다. ◇금융권 맞춤형 FDS 솔루션 잇따라 출시 FDS 관련 솔루션 업체도 앞다퉈 금융권 맞춤형 제품을 출시, 적극적으로 시장 공략에 나섰다. 워치아이시스템은 금융권 요구에 맞는 솔루션을 제시했다. 빅데이터량이 폭발적으로 증가하는 금융사 IT자산 로그데이터를 실시간으로 수집·인덱싱·통합·분석하는 빅데이터 분석솔루션인 ‘로그인 사이트 V3.0’을 출시했다. 이 제품은 빅데이터 분석 엔진 기반으로 전사 시스템의 데이터를 실시간 분석할 수 있다. 다면적 차원에서 이상거래 징후 탐지가 가능하다. 엠오에스아시아도 빅데이터 플랫폼인 스플렁크를 전면에 내세우며 FDS 시장을 공략한다. 스플렁크 핵심은 데이터 수집과 분석이다. 웹사이트·애플리케이션·서버·네트워크 장치 등 각종 기기에서 생성된 데이터를 수집하고 인덱싱해 활용할 수 있도록 지원한다. 실시간 데이터 검색과 스플렁크만의 다양한 함수로 데이터를 분석한다. 한국CA는 ‘CA 리스크마인더’로 시장 공략을 강화했다. 이 제품은 계정 도난이나 온라인 사기에 대응하는 실시간 보호기능을 구현한다. 기업 온라인 서비스부터 소비자 온라인 자금이체, 전자상거래 트랜잭션까지 온라인 접속에서 발생할 수 있는 모든 잠재적 사기 상황을 분석한다. 모든 과정은 위험도가 낮은 합법적 사용자에게 영향을 미치지 않는 범위 내에서 진행된다. 큐핏은 자체 개발한 사기방지솔루션에 오라클 보험사기방지 솔루션을 더해 성능을 강화한 FDS 솔루션을 개발했다. 금융보안연구원이 발표한 FDS 기술 가이드라인에 있는 정보 수집 후 거래 내역 분석과 분석된 결과를 효율적으로 대응한다. 고객 거래에서 들어온 거래 정보 프로파일링을 평가해 이상금융거래를 적발한다. 데이터밸류는 이디엄과 금융권 이상거래 탐지 솔루션인 ‘로그세이(LogSay)’를 공동 개발했다. 로그세이는 100% 국내 기술로 개발된 실시간 빅데이터 분석 시스템 로그프레소를 기반으로 한 이상금융거래 탐지시스템이다. 금융위원회에서 발표한 이상거래시스템 운영지침과 금융권 내 실무자의 요구사항을 충족한다. 데이터스트림즈는 ‘테라스트림’으로 시장공략에 나섰다. 다양한 서버 환경에서 소스 데이터를 고속 가공 처리할 수 있는 데이터 통합 솔루션이다. 고속 데이터 추출 엔진인 팩트(FACT)를 탑재해 타 솔루션 대비 최고 30배 빠른 추출 성능을 보인다. 신혜권기자 hkshin@etnews.com [https://www.etnews.com/20140722000061](https://www.etnews.com/20140722000061)

2014-07-24

실시간 데이터 분석 솔루션 시장 ‘태동’

사물인터넷(IoT) 시대를 맞아 빅데이터 속에서 실시간으로 인사이트를 얻기 위해 다양한 방법이 강구되고 있다. 6일 본지 취재 결과 최근 관련업계에서는 서로 연결된 각종 기계로부터 쏟아지고 있는(machine-generated) 데이터에 대한 관심이 점차 늘어나고 있다. IDC는 오는 2018년까지 IoT에서 생성된 데이터의 40%가 보관되고 프로세스를 거쳐 분석될 것으로 예상하고 있다. 빅데이터가 IoT와 결합하면서 폭넓은 분야에서 데이터 분석과 활용이 보편화될 것으로 전망된다. 이에 따라 보다 빠르고 명확한 의사결정으로 경쟁에서 앞서기 위해 ‘실시간 분석’에 대한 니즈도 급증하고 있다. ‘온라인 분석’은 데이터의 생성 시점과 분석 시점의 구분이 없는 반면, ‘실시간 분석’은 데이터가 생성되는 시점에 최대한 가깝게 분석이 함께 이뤄진다. 수많은 센서나 소셜미디어에서 생성되는 시계열(time series) 데이터를 그 대상으로 하며, 특히 각종 기계로부터 생성되는 로그데이터가 주재료가 되고 있다. 소프트웨어(SW) 벤더들은 ‘빅데이터’와 ‘실시간’이라는 두 축을 모두 지원하기 위해 다양한 형태의 솔루션을 선보이며 이 새로운 시장을 공략하고 있다. 공통적으로 빠른 색인(indexing)을 지원하며, 크게 컬럼형 데이터베이스관리시스템(DBMS)에서 파생된 유형과 로그처리시스템에서 발전된 유형으로 구분할 수 있다. 컬럼형DBMS에서 파생된 유형의 경우 DML(데이터조작언어) 가운데 수정(update)과 삭제(delete)를 지원하지 않는 대신 입력(insert)과 검색(select)을 위한 성능을 극대화시키는 등의 방식을 취한다. 로그처리시스템에서 발전된 유형의 경우 NoSQL DB처럼 스키마(schema)를 고정하지 않고 로(raw)데이터 자체를 실시간 인덱싱하고 향후 분석 대상을 재정의하는 스키마리스(schema-less) 형태로 저장한다. 컬럼형DBMS에서 파생된 솔루션으로는 ▲파스트림 ▲아이리스DB ▲인피니플럭스 등을 들 수 있고, 로그처리시스템에서 발전된 솔루션으로는 ▲스플렁크 ▲테라스트림 바스 ▲로그프레소 ▲D2 등을 꼽을 수 있다. <이하 상세 내용 컴퓨터월드 9월호 참조> [http://www.itdaily.kr/news/articleView.html?idxno=68478](http://www.itdaily.kr/news/articleView.html?idxno=68478)

2015-09-06