[그림2] 오픈 소스 화두의 현실적 접근

2014년 5월에도 작년에 이어 컴퓨터월드(Computerworld)가 주최한 오픈 비즈니스 컨퍼런스(Open Business Conference; 이하 OBC)가 미국 샌프란시스코에서 열렸음. 올해 행사는 2013년에 비해 규모 면에서 축소되었지만, 전년에는 오픈 소스의 이상적인 면이 부각되었다면 올해는 좀 더 현실적인 고민들을 확인할 수 있는 행사였음.
1. OBC 2013의 화두는 ICT 산업 변화를 야기시키고 있는 3가지 오픈 소스
2013년에는 모바일, 클라우드, 빅데이터 3가지 화두가 ICT 산업의 새로운 변화를 이끌 화두로 논의되었음. 이러한 3가지 ICT의 화두에는 오픈 소스가 기반이 되어 왔음. 예를 들어 모바일의 중심인 안드로이드 스마트폰에는 리눅스(Linux), 클라우드에는 오픈스택(OpenStack), 빅데이터에는 하둡(Hadoop) 등과 같은 오픈 소스가 있어 왔음. 작년 OBC 2013에서는 오픈 소스가 ICT 산업에 야기시키는 혁신에 대한 논의가 많았었음.
[그림1] ICT 산업을 변화시키는 오픈 소스

2 OBC 2014의 화두는 Hybrid와 Data
OBC 2014에서는 이미 시장 표준이 결정되어 사업기회가 적은 리눅스와 관련된 논의는 적었음. 대신 클라우드와 빅데이터에 대한 관심이 많았으며, 이들을 현실에 접목시킬 때 기존(Legacy) 시스템을 어떻게 수용할 것인지에 대한 논의가 있었음.동시에 클라우드와 그 위의 애플리케이션 성격이 강한 빅데이터를 하나로 묶을 수 있는 본질인 “데이터”에 대한 관심이 많았음. 이러한 데이터에 대한 논의는 최근 화두가 되고 있는 사물 인터넷(Internet of Things)와 같은 연결성(Connectivity)과 연계되어 논의되었음.
3 오픈 소스 및 새로운 혁신을 도입하더라도 당분간은 Hybrid식의 접근이 필요
ICT 산업의 새로운 혁신으로 논의된 모바일, 클라우드, 빅데이터 분야에서 오픈 소스가 만병 통치약일 수는 없음. 그리고 오픈 소스가 야기시키는 새로운 혁신이 기존(Legacy) 시스템 모두를 단숨에 대체할 수도 없음. 그러므로 그 변화로의 과정 속에서 기술적인 완성도 및 장점과 단점을 감안한 현실적인 접근과 실행이 필요할 수 밖에 없음.가) 오픈 소스를 도입하더라도 역량에 따른 도입 수준에 대한 고민 필요
오픈 소스가 기존의 소스 코드 대비 갖는 장점은 명확함. 첫째 외부에서 최신 기술(New Technology)및 안정화(Debugging)를 지원하므로 TCO(Total Cost of Ownership; 소유 총비용)이 저렴할 수 밖에 없음. 또 개발자들의 다양한 참여가 기반이 되어 개발되므로 호환성과 유연성이 담보될 수 밖에 없음. 둘째 참여자들이 자율적으로 새로운 기술 트렌드를 접목시키기 때문에 새로운 기술의 도입 비용이 낮음. 그 이유는 자체 소스코드(Proprietary Source Code)를 사용하려면 새로운 기술 및 트렌드를 공부하고 시행 착오를 통해 적용해야 하지만, 오픈 소스는 관심 있는 개발자가 먼저 공부하고 적용시켜 줌으로써 시간 및 실제 적용 비용이 낮을 수 밖에 없기 때문임. 그 외에도 외부의 다양한 전문가들이 지속적으로 참여하기 때문에 상대적이기는 하지만 안정성(Reliability & Stability) 확보가 용의할 수 있음.오픈 소스에 대한 시각도 처음부터 오픈 소스를 다뤘던 개발자와 중간에 갈아탄 개발자들 사이에는 차이가 있을 수 있음. OTT(Over The Top) 서비스 사업자인 네플릭스(Netflix)에서 엔지니어링 툴을 담당하고 있는 다이안 마쉬(Dianne Marsh)는 오픈 소스를 빠르고 안정적으로 활용할 수 있다고 함. 그리고 그녀의 팀은 자신이 직접 쓴 소스코드를 공개하고 피드백을 받음으로써 빠른 혁신(Rapid Innovation), 빠른 검토(Rapid Detection), 빠른 반응(Rapid Response)의 이점을 향유하고 있다고 함. 그래서 자유와 책임의식을 갖고 오픈 소스를 활용하면 충분히 잘 활용할 수 있다고 강조함.
그러나 대형 금융기업에서 IT 관리를 하면서 자체 소스코드를 사용하다가 스타트업에 오면서 오픈 소스를 활용하게 된 모바일 증권 서비스 사업자인 트레이드몬스터의 CTO 산집 사후(Sanjib Sahoo)는 오픈 소스에 대해 자원 및 시간 측면에서 비용 우위를 언급함. 그는 공개된 소프트웨어 구조(Architecture)를 활용하고 최신 기술을 저비용 구조로 개발 관리 할 수 있다는 점에서 분명 강점이 있다고 함.
하지만 그는 신속한 버그 지원과 보안 등에서 문제 발생 가능성이 있다는 점을 강조했음. 그리고 그는 안정적이고 자율성을 높이기 위해서는 코어(Core) 부분은 자체 소스코드로 구성하고 주변부를 오픈 소스로 분리해서 구성해야 한다는 점을 강조했음. 그리고 최신 버전 업데이트는 호환성과 보안(Security) 측면에서 문제 발생 가능성이 있으며, 보안 및 라이선스 관점에서 오픈 소스는 읽기 전용(Read Only) 수준이면 그 가치가 충분하다고 했음.
이러한 오픈 소스에 대한 차이는 1%의 오차도 허용하지 않는 금융업과 그렇지 않은 분야의 차이에서도 올 수 있고, 또 오픈 소스에 대한 친숙성과 기여도에 따라 달라질 수 있음. 하지만 네플릭스처럼 ICT 서비스 중에서도 가장 높은 안정성과 성능을 요구하는 분야에서도 충분히 적용가능하기 때문에 일반적인 ICT 서비스에 적용은 검토할 가치가 있다고 보임.
그리고 오픈 소스의 활용가치는 얼마나 오픈 소스를 잘 알고 또 자유롭게 책임의식을 갖고 개발하고 기여하는지가 중요할 것으로 판단됨. 그러므로 기업 내에서 오픈 소스를 활용 전략은 산업의 특징, 기업 내 소프트웨어 전략, 역량 등을 감안하여 오픈 소스 활용 수준을 결정하는 것이 가장 중요한 의사결정 사항 중 하나일 것임.
나) 클라우드는 하이브리드 구성에 대한 고민 필요
기업들은 이미 업무용으로 구축 비용이 상대적으로 높지만 보안 및 안정성이 보장되는 프라이빗 클라우드(Private Cloud)를 이미 활용하고 있음. 하지만 추가 클라우드 투자나 처음으로 클라우드 서비스를 활용하는 기업들은 점차 비용절감 효과가 커지고 있는 동시에 보안과 안정성이 좋아지고 있는 퍼블릭 클라우드에 대한 관심과 선호가 높을 수 밖에 있음. 하지만 기존에 프라이빗 클라우드 서비스의 장점과 새로운 퍼블릭 클라우드와의 연계에 있어 안정성과 호환성 문제가 발생할 가능성이 있음.
[표1] 프라이빗 클라우드와 퍼블릭 클라우드 비교

Source : ‘Cloud’s Hybird Future’ by Simone Brunozzi, VP and Chief Technologist, Hybrid Cloud Service VMWARE
기업 내 클라우드의 현실에 대해서 HP의 Bill Hilf(SVP Product, HP Cloud)는 이상가들이 꿈꾸는 클라우드는 [그림3]처럼 깔끔하고 명확한 이미지와 같지만, 현실은 [그림4]와 같이 복잡한 구조 그 자체라는 점을 강조함.
[그림3]이상가들이 꿈꾸는 클라우드

[그림4]처럼 현실은 아주 복잡한 구조로 다양한 서비스와 시스템이 엮여 있음. 향후 새로운 서비스 및 하드웨어 제품들이 연결되어야 하므로 그 구조는 앞으로 더 복잡해 질 수 밖에 없음. 그러므로 향후의 새로운 변화들을 도입하기 위해서 이를 감안한 시스템 아키텍쳐(Architecture)를 고민하고 반영할 수 밖에 없음. 그러므로 향후 새로운 서비스를 접목시키고 또 퍼블릭 클라우드와 연계시키려면 개방형 구조로 갈 수 밖에 없음.
[그림4] 현실 속 기존 시스템과 연계가 필요한 퍼블릭 클라우드

그러므로 HP는 기존 프라이빗 클라우드를 여전히 활용하면서도 퍼블릭 클라우드의 장점을 흡수하는 하이브리드 클라우드가 대안이라고 제안하고 있음. 그 배경에는 기존 시스템과의 연계뿐만 아니라 프라이빗 클라우드가 갖는 장점, 산업 특성 및 기업 전략에 따라 그 중요도가 달라질 수 있기 때문임. 그러므로 HP는 5년 뒤에 현재는 퍼블릭 클라우드가 더 많지만 결국 하이브리드 클라우드 시대가 올 것이라고 전망하고 있음.
물론 HP의 예상이 맞을 수도 있겠지만, 퍼블릭 클라우드는 가격측면에서 압도적인 우위와 안정성과 보안성이 점점 더 강화될 것이라는 점을 감안되어야 함. 그렇다면 기존의 프라이빗 클라우드만 하이브리드로 전환되는 [그림5]와 같은 전망도 가능함.
[그림5] 프라이빗/하이브리드/퍼블릭 클라우드 전망

다) 빅데이터도 기존 RBDM과 하둡과의 공존에 대한 고민 필요
2012년과 2013년 ICT 산업에서 가장 Hot한 키워드로 빅데이터가 논의된 데 반해 최근 들어 상대적으로 그 열기가 식은 듯 보임. 그 배경에는 빅데이터의 기술적 완성도 및 성능이 검증되지 않은 상태에서 당장 세상을 바꿀 것처럼 회자가 되었다는 점과 데이터와 관련되는 모든 용어에 빅데이터를 사용하는 등 너무 남용되었다는 점이 있음.빅데이터라고 하면 당연스레 오픈 소스인 하둡(Hadoop) 기반의 솔루션을 만들어야 한다는 이야기가 많이 논의되었었음. 하지만 빅데이터의 솔루션도 기존 시스템과의 연계성 및 사용성을 감안되어 선택되어야 하지만, 현실적인 부분이 반영되지 않았던 것이 현실이었음.
빅데이터의 빅(Big)이라는 단어는 적어도 페타바이트(Petabyte; 1015) 수준의 데이터를 다룰 수 있는 수준을 의미함. 페타바이트는 1기가바이트의 1000배인 1테라바이트의 1000배를 의미함. 실제로 2014년 초 기준 페이스북(Facebook)은 하루에 600테라바이트를 다루고, 전체적으로는 300페타바이트 수준의 데이터웨어하우스를 운영하고 있음. 그리고 국내에서도 통신사업자인 SKT가 하루 수십 테라바이트(2013년 기준)를 처리하고 있는 등 빅데이터 기반이 되는 사업과 기업들도 존재함.
빅데이터가 ICT 산업에서 화두가 되면서 빅데이터는 하둡이라는 등식이 성립되는 것처럼 여겨졌음. 하지만 모든 병에 맞는 만병통치약은 없듯이 하둡도 현재 상태로 적합한 분야와 그렇지 않은 분야로 나눌 수 있음. OSBC 2014에 참여한 독일 개발자인 마커스 로스(Marcus Ross)와 피터 딕텐(Peter Dickten)는 하둡이 현재 상태에서 제공하지 않는 5가지 기능을 소개했음. 첫째 SQL의 대체품(No Drop-in replacement for SQL)이 아님. 둘째 차트/리포트 생성기(No Chart/Report Generator)가 아님. 셋째 엑셀 애드인이 안됨(No an Excel Add-in). 넷째 플러그 앤 플레이하면 비즈니스 인텔리전스를 제공하는 패키지가 아님(No Plug’n’Play BI-Suite). 마지막으로 SAP 데이터 웨어하우스가 아님(No SAP Data Warehouse). 즉 정리하면 기존에 사용하는 시스템 및 사용환경과 완전히 호환되지 않을 수 있다고 정리할 수 있음. 그러므로 이들은 기존의 RDBMS(Relational Database Management System)와 하둡은 공존할 것이라고 강조했음.
4 최근 화두가 되는 Connectivity 및 클라우드와 빅데이터와 함께 그 본질은 데이터
앞서 살펴본 클라우드와 빅데이터의 핵심은 단연 데이터(Data)임. 즉 모바일이 생성한 데이터를 클라우드에서 저장하고 빅데이터 솔루션을 통해 분산, 처리하는 등 단계가 바뀌어도 그 대상이 되는 것은 “데이터”임. 모바일 및 클라우드 환경이 구축되면서 점점 더 많은 사물들이 연결되는 등 연결성이 2014년 새로운 화두로 부각되고 있음. 이러한 연결 환경에서도 결국 송수신되고 처리되고 분석되는 대상(Target)은 데이터임.가) 좋은 데이터와 나쁜 데이터 그리고 그 속성
데이터도 그 연결 대상 및 패턴에 따라 좋은 데이터와 나쁜 데이터로 나눌 수 있음. 좋은 데이터(Good data)는 같은 패턴의 좋은 데이터들끼리 연결된 것임. 즉 저장 및 분석의 용이성이 높은 데이터라고 볼 수 있음. 하지만 나쁜 데이터(Bad Data)는 무작위로 연결되어 있어 저장 및 분석의 용이성이 낮으며 별도의 추가작업이 필요한 데이터라고 할 수 있음. 그리고 별도 추가작업이 들어간다는 것 자체가 나쁜 데이터의 왜곡 위험성을 의미할 수 있음. 시장 조사 기관인 가트너(Gartner)의 애널리스트에 따르면 너무 좋아 보이는 데이터는 조작의 위험성이 있다고 강조했음.또 데이터는 그 데이터를 가이드라인에 따라 생성 저장시키는 사용성과 규모에 따라 가치가 결정될 수 있음.
[그림6] 데이터 분류와 속성

Source : ‘The Internet of Data” by Svetlana Sicular, Gartner
그리고 데이터도 그 가치의 스펙트럼이 어디에 있는지? 누가 접근할 수 있는지? 등에 따라 [그림7]처럼 다를 수 있음. 데이터에 대한 접근성이 낮을수록, 더 많은 데이터가 모일수록 데이터의 가치는 높아지고 유료로 거래될 수도 있음.
[그림7] 데이터의 가치

나) 가치 높은 데이터가 되기 위해서는 개방과 분석 추가 필요
데이터는 더 많은 데이터가 연결되면서 더 많은 가치를 만들어 냄. 그러므로 데이터가 그 가치를 배가하기 위해서는 개방될 수 밖에 없음. 개방되면 데이터는 지금과 다른 특징을 가져야 하므로 새로운 관점에서 접근해야 함. 그러므로 [그림8]처럼 기존의 데이터가 특정 서비스 환경에 종속적이고, 단편적이고 핵심자산이 아닌 부산물로 여겨졌다면 개방된 환경에서는 다양한 서비스에 활용될 수 있도록 독립적이고, 다목적성을 가지며 핵심자산으로의 성격을 가질 것임.
[그림8] 개방화되면서 변화되는 데이터의 속성 변화

[그림9] 데이터를 가치를 높여주는 분석

또 분석을 위해서 좋은 데이터들이 연결되어 수집되어야 하고, 그 과정에서 정보 품질 향상에 대한 노력이 진행되어야 함. 그리고 분석 과정을 통해서 관리 관점에서 개선이 일어나면서 더 좋은 데이터와 이를 통한 높은 분석 결과를 통해서 새로운 가치들이 만들어질 수 있어야 함.
☞ 동형 생각
오픈 소스가 ICT 산업을 변화시키는 기반이 되어 새로운 혁신들을 가능케 하고 있음. 그런 의미에서 오픈 소스를 통해서 새로운 변화를 예측하고 사업화를 준비하는 것은 의미 있는 활동이라 생각됨. 올해 OBC 2014에서는 얻어낸 ICT Insight는 “하이브리드”와 “데이터”임.새로운 혁신도 기존 혁신의 부족한 점을 채워주지만 그 역시 부족한 점이 있을 수 밖에 없음. 그리고 기존 시스템을 버리고 완전히 새로운 혁신으로 갈아타기란 현실적으로 어려울 수 밖에 없음. 그 경우 단기적으로는 하이브리드라는 선택을 통해서 최적화할 수 밖에 없으며, 그 하이브리드 라는 선택도 장기적인 방향성이 반영되어야 할 것임. 예를 들어 점점 더 개방화될 것이므로 이를 받아들이는 측면에서 로드맵을 갖고 하이브리드 단계 및 새로운 혁신으로 전환 단계를 거쳐야 할 것임.
클라우드와 빅데이터는 결국 ‘데이터’라는 본질을 다루는 것임. 지금까지는 디지털화된 데이터만 다뤘다면 향후 클라우드와 빅데이터가 기반이 된 사물 인터넷(IoT) 시대에는 아날로그를 디지털화된 데이터로 다룰 수 있어야 함. 그와 관련된 다양한 시도들이 일어날 것이며, 그 결과 ‘좋은 데이터’를 만들어내는 생태계가 승리할 것이라 전망해 봄.
- 이상 -