[웹2.0] 데이터는 차세대의「인텔 인사이드」

News/Web Develop 2006. 7. 27. 10:44

share this post

중요한 인터넷 애플리케이션에는 반드시 그것을 지지하는 전문 데이터베이스가 있다. 구글의 웹 크롤, 야후의 디렉토리, 아마존의 제품 데이터베이스, 이베이의 제품 데이터베이스, 맵퀘스트(MapQuest)의 지도 데이터베이스, 냅스터의 분산형 악곡 데이터베이스 등이 그것이다.

지난해 할 베리안은 "SQL이야말로, 차기 HTML이다"라고 말했다. 데이터베이스 관리는 웹 2.0의 핵심 능력이기도 하다. 때문에 이런 애플리케이션은 단지 소프트웨어가 아니고, '인포메이션 웨어(infoware)'라고 불리기도 한다. 이 사실은 중요한 물음, 즉 "그 데이터를 소유하고 있는 것은 누구인가"라는 물음을 던진다.

인터넷 시대에는 데이터베이스를 컨트롤하여 시장을 지배해, 막대한 수익을 올린 기업이 적지 않다. 초기에 정부의 위탁을 받고 네트워크 솔루션(Network Solutions, 후에 베리사인이 인수)이 독점한 도메인명 등록 사업은 인터넷에 있어서의 최초의 달러 박스 사업이 됐다.

인터넷 시대에는 비즈니스 우위를 확보하는 것은 훨씬 어려워진다고 했지만, 소프트웨어 API를 지배하는 것으로 중요한 데이터 소스를 지배한다면 우위를 확보하는 것은 그렇게 어렵지 않다. 그 데이터 소스가 작성에 막대한 자금을 필요로 하는 것이거나, 네트워크 효과에 의해 수익을 확대할 수 있는 경우는 더욱 그렇다.

예를 들어, 맵퀘스트, 맵스야후닷컴(maps.yahoo.com), maps.msn.com, maps.google.com등이 생성하는 지도에는 반드시 "지도의 저작권은 NavTeq, TeleAtlas에 귀속됩니다"라고 하는 문장이 덧붙여져 있다.

최근 등장한 위성 화상 서비스의 경우는 "화상의 저작권은 디지털 글로브(Digital Globe)에 귀속됩니다"라고 쓰여져 있다. 이런 기업은 막대한 자금을 투자하고 독자적인 데이터베이스를 구축했다. 내브텍(NavTeq)은 7억 5000만 달러를 들여 주소/경로 정보 데이터베이스를 구축했고, 디지털 글로브는 공공 기관으로부터 공급되는 화상을 보완하기 위해 5억 달러를 들여 위성을 쏘아 올렸다.

내브텍은 친숙한 인텔 인사이드 로고를 모방해, 카 내비게이션 시스템을 탑재한 차에 ‘NavTeq Onboard(내브텍 탑재차)’라는 마크를 붙이고 있다. 실제 이런 애플리케이션에 있어서, 데이터는 인텔 인사이드라고 불릴 만큼 중요성을 가지고 있다. 소프트웨어 인프라의 거의 모든 것을 오픈 소스 소프트웨어나 상품화한 소프트웨어로 조달하고 있는 시스템에 있어서, 데이터는 유일한 소스 컴포넌트이기 때문이다.

현재 격렬한 경쟁이 전개되고 있는 웹 매핑 시장은 애플리케이션의 핵이 되는 데이터를 소유하는 것이 경쟁력을 유지하는데 있어서 얼마나 중요한가를 나타내고 있다. 웹 매핑이라고 하는 카테고리는 1995년에 맵퀘스트가 만들어 낸 것이다. 맵퀘스트는 선구자였지만, 야후, MS, 그리고 최근에는 구글과 같은 신규 참가자가 부각되도록 했다. 이런 기업은 맵퀘스트와 같은 데이터의 사용 허락을 받아 경쟁되는 애플리케이션을 거뜬히 구축할 수 있었다.

그것과 대조적인 것이 아마존이다. 반스앤노블즈닷컴(Barnesandnoble.com) 등의 경쟁 기업과 같이 아마존의 데이터베이스도 원래초는 R.R. 바우커(Bowker)가 제공하는 ISBN(국제표준도서 번호)을 기초로 한 것이었다. 그러나 맵퀘스트와 달리 아마존은 바우커의 데이터에 출판사로부터 제공되는 표지 화상이나 목차, 색인, 샘플 등의 데이터를 추가하는 것으로, 데이터베이스를 철저하게 확장해 갔다.

더 중요한 것은 이런 데이터에 유저가 코멘트를 달 수 있다는 것이다. 10년 지난 지금은 바우커는 아니고 아마존이 서지 정보의 주요한 정보원이 되고 있다. 소비자뿐만 아니라, 학자나 사서도 아마존의 데이터를 참조하고 있다. 또 아마존은 ASIN이라고 불리는 독자적인 식별 번호도 도입했다. ASIN는 서적의 ISBN에 상당하는 것으로, 아마존이 취급하는 서적 이외의 상품을 식별하기 위해 이용되고 있다. 사실 아마존은 유저의 공급하는 데이터를 적극적으로 수중에 넣어, 독자적으로 확장했던 것이다.

이것과 같은 것을 맵퀘스트가 했다면 어떻게 됐을까. 유저가 지도와 경로 정보로 코멘트를 더해 겹겹이 부가가치를 더할 수 있다면 같은 기초 데이터를 손에 넣는 것만으로, 타사가 이 시장에 참가할 수 없었을 것이다.

최근 등장한 구글 맵스는 애플리케이션 벤더와 데이터 공급자의 경쟁을 실시간으로 관찰할 수 있는 장소가 되고 있다. 구글의 경량 프로그래밍 모델을 이용하고, 서드파티가 다양한 부가가치 서비스를 낳고 있지만, 이런 서비스는 구글 맵스와 인터넷의 다양한 데이터 소스를 조합한 매쉬업의 형태를 취하고 있다.

폴 래이드마처의 하우징맵스닷컴(housingmaps.com)은 구글 맵스와 크래이그리스트의 임대 아파트/판매처 정보를 조합한 인터랙티브인 주택 검색 툴이다. 이것은 구글 맵스를 이용한 매쉬업의 걸출한 예라고 할 수 있다.

현재 이런 매쉬업의 대부분은 기업가들의 눈길을 받고 있다. 적어도 일부의 개발자의 사이에서 구글은 벌써 데이터 소스의 자리를 내브텍으로부터 빼앗아 가장 인기가 있는 중개 서비스가 되고 있다. 향후 몇 년간은 데이터 공급자와 애플리케이션 벤더 사이에서는 경쟁이 전개될 것이다. 웹 2.0 애플리케이션을 개발하기 위해서는 특정 데이터가 극히 중요한 역할을 완수하는 것을 양방이 이해하게 되기 때문이다.

코어 데이터를 둘러싼 싸움은 벌써 시작됐다. 이런 데이터의 예로는 위치 정보, 아이덴티티(개인 식별) 정보, 공공 행사의 일정, 제품의 식별 번호, 이름 공간 등이 있다. 작성에 고액의 자금이 필요한 데이터를 소유하고 있는 기업은 그 데이터의 유일한 공급원으로서 인텔 인사이드형의 비즈니스를 실시할 수 있을 것이다. 그렇지 않은 경우는 최초로 주요한 대중의 유저를 확보해, 그 데이터를 시스템 서비스로 전환할 수 있던 기업이 시장을 억제한다.

아이덴티티 정보의 분야에서는 페이팔(PayPal), 아마존의 원클릭(1-click), 많은 유저를 가지는 커뮤니케이션 시스템 등이 네트워크 규모의 ID 데이터베이스를 구축할 때의 라이벌이 될 것이다. 구글은 휴대 전화 번호를 지메일의 어카운트 인증에 이용하는 시도를 시작했다. 이것은 전화 시스템을 적극적으로 채용해, 독자적으로 확장하는 첫 걸음이 될지도 모른다.

한편, Sxip와 같은 신생 기업은 ‘제휴 아이덴티티(federated identity)’의 가능성을 모색하고 있다. Sxip가 목표로 하고 있는 것은 ‘분산형 원클릭’과 같은 구조를 만들어, 웹 2.0형의 아이덴티티 하부조직을 구축하는 것이다. 캘린더의 분야에서는 EVDB가 위키형의 아키텍처를 사용하고, 세계 최대의 정보 공유 캘린더를 구축하려고 하고 있다.

결정적인 성공을 거둔 신생 기업이나 실체는 아직 없지만, 이런 분야의 표준과 솔루션은 특정의 데이터를 인터넷 운영체제의 신뢰할 수 있는 하부조직으로 바꿔 차세대 애플리케이션의 등장을 가능하게 할 것이다.

데이터에 관해서는 프라이버시와 저작권 문제도 언급해 두지 않으면 안 된다. 초기의 웹 애플리케이션은 저작권을 너무 엄밀하게는 행사해 오지 않았다. 예를 들어, 아마존은 사이트에 투고되는 리뷰의 권리가 자사에 귀속한다고 주장하고 있지만, 그 권리를 실제로 행사하지 않고 있다. 그러나 기업은 데이터 관리가 경쟁 우위의 원천이 되는 것을 인식하고 있으므로, 향후는 데이터 관리가 지금보다 어렵게 행해지게 될지도 모른다.

소프트웨어의 융성이 무료 소프트웨어 운동을 가져온 것처럼, 데이터베이스의 융성에 의해서 향후 10년 이내에 프리 데이터 운동이 일어나게 될 것이다. 반동의 조짐은 벌써 나타나고 있다. 위키피디어나 크리에이티브 커먼(Creative Commons) 등의 오픈 데이터 프로젝트, 사이트 표시를 사용자가 할 수 있는 Greasemonkey 등의 소프트웨어 프로젝트가 그 일례다.

♣ 자료출처 : O'Reilly Network

WRITTEN BY

: 손가락귀신
정신 못차리면, 벌 받는다.

[웹2.0] 데이터는 차세대의「인텔 인사이드」

티스토리툴바