신도용 팀장, 다음 소프트 더마이닝컴퍼니 전략기획팀, doyong@daumsoft.com
검색엔진 구글(Google)이라는 이름은 10의 100제곱을 의미하는 구골(Googol)1)이라는 단어에서 유래되었다고 한다. ‘백럽’이라고 불리던 기존의 검색 서비스의 새로운 이름을 고민하던 도중 동료 중에 한 명이 10의 100제곱을 뜻하는 의미의 Googol을 제안한다는 것이 이름을 잘못 알고 Google로 제안을 하게 됐는데 이게 굳혀져서 Google이 되었다는 설도 있고 Googol이 이미 도메인이 등록이 되어 있어서 비슷한 단어인 Google로 정한 것이라는 설도 있다. 무엇이 사실이든 간에 구골이라는 큰 숫자를 사명으로 정하게 된 것은 세계의 모든 정보를 연결시키고했던 구글의 철학이 반영된 것이라 할 수 있겠다. 그러고 보면 구글은 설립 당시에 이미 빅데이터의 개념을 이름에 품고 탄생한 것이다. 빅데이터라는 단어는 최근에 새로 생겨난 키워드이지만 디지털 환경에서 생성되는 데이터는 이미빅데이터로 존재하고 있던 것이다
빅데이터는 ‘기존의 관리 및 분석 체계로는 감당할 수 없는 거대한 데이터의 집합’으로 정의되고 빅데이터의 특징은 3V(Volume 크기, Variety 다양성, Velocity 속도)로 설명된다. 하지만, 빅데이터의 이러한 해석은 하둡, 병렬처리 등과 같은키워드로 설명되어지는 IT 기술 분야에서의 아젠다이고 마케터에게 이는 크게 중요하지 않다. 마케터에게 빅데이터란 과연 어떠한 마케팅 인사이트와 비즈니스적인 활용 가치를 가져다 줄 수있느냐가 핵심이다. 마케터가 빅데이터의 BIG이아닌 인사이트에 집중해야 하는 이유이다. 그래서 마케터에게 빅데이터의 의미는 기존에 쌓여져 있던 수많은 데이터들을 이제 적은 비용으로 쉽게 처리하고 분석할 수 있는 기술적인 환경이 갖춰짐에 따라 의미없이 쌓여만 가던 데이터에서 마케팅적인 의미를 찾아보는 시도로 해석하는 것이 타당할 듯 하다.
마케터에게 빅데이터란?
엑셀2003 버전까지는 한 시트에 65,536행과 256열이 존재했다. 한 셀에 한 사람씩 이름을 적는다고 하면 한 시트에 빼곡히 들어가는 사람의이름 수는 16,777,216개가 된다. 이는 한국 사람의 이름을 다 넣기도 부족한 개수다. 엑셀 시트의 마지막 행인 65,536행은 PageDown 버튼을 2,185번을 눌러야 닿을 수 있는 위치이다. 엑셀을 열어서 한 셀에 한국 사람 이름이 들어가 있다고 생각하고 PageDown 버튼을 눌러보면 얼마나 많은 사람들이 한국 땅에 살고 있는지 실감이 갈 것이다. 실로 많은 수의 사람들이다. 이렇게 많은 수의 사람들이 사람들이 디지털기기를 사용하면서 수많은 데이터를 생성해내고 있다.스마트폰으로 사진을 찍고 SNS를 사용하고 검색을 하고, 자동차에서는 쉴새 없이 블랙박스가 디지털 동영상을 만들어내고 있다. 이렇게 만들어지는 전세계 디지털 데이터의 양은 2020년까지 전세계 해변의 모래알의 수인 70억 50만조의57배에 달하는 40ZB(4,000,500,000,000,000,000,000byte)2)가 될 것이라고 하니 빅데이터는 그크기를 상상조차 하기 힘들다.
그렇다면 이렇게 무지막지한 빅데이터로 무엇을 할 수 있을까? 빅데이터는 그동안 우리가 보지못해서 알지 못했던 많은 것들을 보게 해주고 알게 해주고 이해하게 해주는 도구가 될 수 있다. 영화 매트릭스에서 주인공인 네오가 초인이 되어 비오듯 흘러내리는 암호코드를 완벽히 이해하게 되는 순간 매트릭스 시스템을 완전히 지배하게 된다. 영화에서처럼 세상을 완전하게 이해하고 지배할 수는 없겠지만 빅데이터를 활용한다는 것은 세상과 사람을 이해하는데 일말의 도움을 줄 수 있다는 데 그 의미와 가치가 있다. 특히, 소비자가 무슨 생각을 하는지, 무엇을 선호
하는지, 무엇을 싫어하는지, 왜 좋아하고 싫어하는지를 알고 싶어하는 마케터라면 옆에 있는 연인의 마음 속을 읽지는 못하더라도 소비자의 마음 속을 읽어낼 수 있는 빅데이터를 주목할 필요가 있다. 빅데이터는 한 사람이 아닌 여러 사람이 걸어가면서 만들어낸 길처럼 패턴과 흐름이 있기 때문이다.
마케터에게 의미를 가지는 빅데이터를 크게 나눠보면 Inside data와 Outside data로 구분 지을수 있다. Inside data는 기업 내부에서 생성하고 관리하는 데이터이며 과거 고객 매출 데이터, 로그데이터, 트래픽 데이터 등 과거 CRM 차원에서 생성/관리되던 데이터이다. Outside data는 소셜미디어 데이터, 포털 검색 데이터, 외부 사이트트래픽 데이터 등 기업 바깥에서 생성되는 소비자 데이터로 구분되어진다. Inside data는 기존에도 계속적으로 활용해오던 영역이기 때문에 본지에서는 Outside data인 검색 데이터와 소셜 빅데이터의 마케팅적 의미와 활용에 대해 이야기 하겠다.
소비자 관심의 흔적 - 검색 데이터
Inside data가 우리 홈페이지에 방문한 우리의고객들을 이해한 거라면 Outside data는 우물 안쪽이 아닌 우물 바깥 쪽의 소비자를 이해하는 훌륭한 데이터가 된다. 검색데이터는 Outside data중에 가장 쉽고 편하게 접근하면서도 많은 인사이트를 얻을 수 있는 데이터이다. 검색 통계 데이터는 네이버, 다음, 구글과 같은 포털에서 제공하고 있다.
‘해외여행’과 ‘국내여행’에 대한 관심은 어떻게변해왔을까? 검색 통계를 분석해보면 2011년을 기점으로 국내여행보다 해외여행에 대한 관심이 더 증가한것을 알 수 있다[그림1]. ‘태국여행’과 ‘대만여행’을 비교해보면 ‘대만 여행’이 최근 들어 급증세를 보이고 있는데 바로 ‘꽃보다 할배’ 프로그램이 대만 여행에 대한 관심을 3배 끌어올렸다는것을 알 수 있다[그림2]. 대만관광청이나 여행사에서는 이러한 관심의 변화를 모니터링하면서여행상품의 구성이나 마케팅의 시기 등을 수립하는 데 활용할 수 있을 것이다.
다음의 트렌드차트 서비스는 다음의 가입된 회원정보를 토대로 검색된 결과의 인구통계 정보를 함께 제공한다. 다음에서 '도봉산 vs 북한산'을검색해보면 도봉산의 여성 검색 비중이 50%로북한산(24%)보다 26%나 높은 것을 알 수 있다. 또한, 50대가 특별히 많이 찾는 북한산에 비해도봉산은 전 연령대에 고르게 분포되어 있으며 의외로 인천 지역에서 북한산을 많이 찾는 것을 알 수 있다.
검색 빅데이터의 활용 사례로 단연 꼽히는 것은 구글의 독감 트렌드 서비스(http://www.google.org/flutrends/)를 들 수 있다. 독감이 걸린 사람은 구글에서 독감과 관련한 키워드로 검색을 하게 되고 이렇게 검색된 데이터에서 패턴을 읽어전 세계 여러 국가 및 지역의 독감 유행 수준을파악하여 경보해주는 서비스이다. 미국의 질병통제 센터보다 2주 정도 빠르게 독감 유행을 예측하여 네이쳐(Nature) 지에 게재되기도 하면서 빅데이터의 대표적인 성공 사례로 꼽힌다. 하지만 최근 1월의 미국 전체 인구의 11%가 독감 환 자라고 예측한 구글의 공식이 잘못되었다고 네이쳐지가 발표하고 미국 질병 통제센터에서 구글의 추정치의 절반(6%)만이 독감환자였다는 사실을 공개하면서 구글의 독감 트렌드 서비스가 머쓱해지는 상황이 발생하였다. 왜냐하면 올해와 같은 경우 특히 심한 독감이 발생하였기 때문에 설사 독감이 걸리지 않은 사람이더라도 독감을 검색할 확률이 높아졌기 때문일 수도 있고 소셜미디어에서 독감에 대한 이슈가 확산되면서 독감의 검색량이 급증했을 수도 있다. 이렇듯 상황적인 맥락을 이해하지 않고 데이터에만 의존한 빅데이터 분석은 현실을 호도하는 결과를 낳을 수 있다. 데이터가 거짓말을 하지는 않지만 의도치 않은 거짓 해석이 될 수 있다는 것이다.
맥락의 이해는 검색 데이터 외에 소셜미디어와같은 소비자들의 자연발생적인 문서 내에서 행간에 담겨진 의미 분석을 통해 보완될 수 있다.소비자들의 다양한 생각과 정황, 감정 정보가 담겨진 소셜 빅데이터는 텍스트 행간에 담겨진 의미에서 맥락적 이해를 통해 소비자를 다양한 시각에서 이해할 수 있는 좋은 도구가 될 수 있다.
소셜 빅데이터, 소비자를 읽는 독심술
인류 최고의 발명이라고 할 수 있는 ‘언어’는 인간이 향유하고 있는 고도의 지적 활동이다. 이러한 언어는 디지털 기기를 통해 다양한 형태로 텍스트화되어 기록되고 저장되고 검색된다. 특히모바일의 확대와 소셜미디어의 확산은 소비자들이 자신들의 생각과 의견을 적극적으로 이야기하게 하는 촉매 역할을 하게 되면서, 소비자들의 의견과 생각의 기록들을 ‘빅데이터화’하는데 일조하고 있다.
또한 데이터가 ‘Big’이 될 수 있는 이유는 한 사람이 생성하는 데이터가 아니라 수많은 사람이 생성해내는 데이터이기 때문이다. 한 사람이 지나간 흔적은 발자국이 되지만 여러 사람이 지나간 흔적은 길이 된다. 그리고 그 길을 볼 수 있다면 사람들이 어디를 향해 가는 것인지, 왜 그 방향으로 가는지를 이해를 할 수 있고 예측을 할 수 있게 된다. 그래서 소비자를 읽는 도구로서의 빅데이터는 마케터에게는더할 나위 없는 선물인 셈이다
한달에 생성되는 블로그는 약 30만건, 트위터에서 생성되는 데이터는 약 500만~1천만 건으로 ‘빅데이터’의 대표적인 유형으로 분류되는데, 이렇게 쏟아지고 있는 사람들의 생각의 기록은 그양이 워낙 방대해서 사람이 읽고 해석할 수 있는범위를 초과한다. 하지만 텍스트 마이닝 기술을 통해 자연어 처리 과정을 거치게 되면 수억 건의빅데이터를 분석할 수 있고 그 안에 담겨진 인간의 희로애락과 잠재된 욕망과 사회 트렌드와 같은 다양한 면을 읽을 수 있게 된다. 의도나 목적에 따라 ‘빅브라더’의 사회 통제 수단으로 활용될 수도 있지만, 사람을 보다 잘 이해해서 보다 나은 세상을 만들어가는 데에 초점을 맞추면 ‘빅 데이터’는 우리에게 다양한 효용을 가져다 줄 수있다.
2013년 한국사람들의 욕망을 들여다보다
소비자를 읽는 독심술을 하게 된다는 것은 곧 마케터가 그토록 원하던 사람들의 욕망을 들여다 볼 수 있다는 것을 의미한다. 수많은 사람들의일상의 기록으로부터 표현되는 욕구와 행위를 살펴보자.
2013년 사람들이 가장 먹고 싶어한 음식은 무엇이었을까? 2013년 약 9억 건의 문서에서 ‘먹고싶다’고 이야기한 대상을 분석한 결과 1위는 ‘치킨’이었다[그림4]. 치킨의 연관 키워드를 보면 맥주가 항상 따라다닌다[그림5].
치킨은 2012년 이후 먹고 싶은 음식으로 언급되어오다가 올해 4월부터 급격한 성장세를 보이고 있는 먹고 싶은 음식이 되어가고 있다
요일에 따른 일상을 분석한 결과에서는 술을 마시는 요일은 금요일이지만 술 생각이 나는 요일은 목요일이다. 목요일을 치맥 먹는 날로 지정해서 치킨을 미끼로 술을 유혹한다면 유혹에 넘어올 확률은 급격히 증가할 것이다.
빅데이터, 마케팅을 바꾸다
이와 같이 빅데이터는 우리가 그 동안 생각지도못했던 새로운 관점을 제시해 줄 수 있다. 새로운 관점으로 접근해서 한 제품의 포지셔닝과 마케팅 전략을 변화시킨 유유제약의 베노플러스겔의 사례를 살펴보자.
베노플러스는 ‘부은데, 멍든데, 타박상, 벌레물린데’ 바르는 연고로 주로 어린이를 대상으로 마케팅을 해왔지만 지난 10년간 매출은 제자리를 맴돌고 있었다. 제품력은 자신이 있었지만 시장에서 존재감이 약하고 시장 상황 또한 약가 인하로인해 전반적 제약업 경기가 나빠지면서 새로운변화가 필요했다. 이러한 상황에서 유유제약은빅데이터를 활용하여 제품의 효능을 어떻게 소구해야 하는지를 고민하기 시작했다.
그 결과 ‘부은데’는 미용 전문 클리닉과 강하게연결되어 있고 ‘타박상’은 OTC 제품과는 어울리지 않는 병원 키워드로 인식되며 ‘벌레물린데’는 버물리라는 강력한 브랜드가 선점을 하고 있었다. ‘멍’을 살펴보니 ‘멍 연고’에 대한 니즈는 있었지만 실제 ‘멍’ 대해서는 확실히 각인된 약이나 연고가 없었다. 유럽에서는 멍 연고가 상처연고와 함께 상비약으로 자리매김되어 있기 때문에 시장의 잠재력에는 확신이 있었고 잠재된 시장을 끌어내기 위한 커뮤니케이션을 어떻게하느냐가 성공의 핵심 관건이었다. 그렇게 해서‘멍’을 베노플러스겔의 핵심 효능으로 규정하고 ‘멍’에 대해 사람들이 언급하는 대처 방법을 살펴보니 뜻밖의 결과가 나왔다.
이 연고, 버츠비와 같은 제품을 생각했는데 실제로 사람들은 계란, 소고기, 찜질 등의 민간요법을 더 많이 언급하고 있었던 것이다. 베노플러스겔에게는 맨소래담과 안티푸라민이 아닌 계란과 소고기를 이기는 것이 시급했다. 따라서 다른 연고 제품이 아닌 계란과 소고기를 최우선 경쟁 대상으로 규정하고 커뮤니케이션을 하게 되었다. 베노플러스의 실질적인 경쟁으로 급부상한 계란과 소고기의 Pain Point를 분석해본 결과 계란은 팔이 아프고, 멍을 빼는데 쓴 계란을 먹어도 되는 것인지에 대한 의문이 존재했고, 소고기는 비 싸고 비위생적이라는 점이 약점으로 나타났다.
이러한 점을 공략하여 ‘계란은 드세요, 멍은 베노플러스겔이 뺄께요’와 같이 일상의 ‘멍’ 해결법을 베노플러스겔이 대체한다는 커뮤니케이션 메시지로 접근하였다.
또한 멍에 대한 수요 타겟을 분석한 결과, 기존에 어린이 시장보다 여성 시장이 특히 큰 것을 파악하게 되었다. ‘멍’에 대한 연관어에 행위를 포함시켜보니 ‘가리다’가 계란 다음으로 많은 수치를 나타내고 있었다. 멍을 가리는 상황과 대상을 추적하다 보니 여성이 멍을 가리는 상황이 특히 많은 것을 알게 되었고 ‘멍’을 이야기할 때의연관 대상이 어린이보다 여성의 언급량이 4배나 많은 것을 확인하게 되었다. 특히 여름과 겨울 시즌에 ‘멍’과 ‘붓기’에 대한 언급이 증가하였는데 이는 여성의 노출이 많은 여름 시즌에 멍을 빼는 방법에 대한 수요가 증가하였고 겨울에는 여성들의 성형수술이 증가하면서 붓기를 빼는 수요가 증가했던 이유였다.
메인 타겟을 어린이 시장에서 여성 시장으로 전환하면서 제품의 포장 디자인도 변경했다. 여성들이 파우치에 제품을 넣고 다녀도 촌스럽지 않도록 약의 이미지를 빼고 세련된 이미지로 포장 디자인을 변경하였고 여성 잡지를 중심으로 광고를 집행하였다. 비키니 페스티벌에서 프로모션을 통해 비키니 여성들에게 멍 연고 베노플러스를 알리고 모델 협회와 MOU를 체결하여 직업상 멍이 많이 들고 노출이 필요한 여성 모델에게 적극적으로 다가가며 홍보를 진행하였다. 이렇게 타겟을 확장하고 경쟁 대상을 재규정하여 새롭게 마케팅을 수행한 결과 전년 대비 매출이 62% 증가하는 기염을 토하고 빅데이터 경진대회에서 은상을 타는 획기적인 성과를 낳게 되었다.
후일담이지만 베노플러스의 경쟁이 계란과 소고기라고 보고했을 때 회사의 임원들의 첫 반응은말도 안된다는 반응이었다. 하지만 실제 데이터 분석 결과를 제시하고 소비자들이 자발적으로 언급한 원문을 제시하면서 자연스럽게 설득이되어 내부적으로 적극적인 지원을 얻을 수 있었다. 이러한 베노플러스겔 사례는 빅데이터의 효용이 자발성에서 비롯된다는 교훈을 보여준다
지금까지 빅데이터가 마케팅적인 관점에서 가지는 의미와 가치를 활용사례와 함께 살펴보았다. 최근 빅데이터에 대한 관심이 급증하면서 많은 기업들이 빅데이터라는 큰 파도 속에서 소위 ‘빅데이터를 해야 한다’는 강박을 가지고 있는 것은 아닌가 싶다. 그럴수록 빅데이터의 초점이 ‘효용’이 아닌 ‘Big’에 맞추어질 수 있다는 점을 경계해야 한다. 빅데이터가 원하는 것을 뚝딱 꺼내오는 요술램프라고 여기고 빅데이터가 만들어낼 미래에 대해 너무나도 성급하게 새로운 세상이 펼쳐질 것처럼 예단하는 것 또한 경계해야 한다. 분명한 것은 ‘Big’이든 ‘Small’이든 소비자들이 은연 중에 남기게 되는 흔적 데이터에서 의미를 찾고 가치를 발견하려는 시도가 확산된다는 점은 사람을 이해하고 보다 나은 세상을 만들어가는 디딤돌이 될 것이라는 점이다.
1) 구골(Googol)은 10의 100제곱을 가리키는 숫자이다. 즉, 1 뒤에 0이 백 개 달린 수이다. 이 수의 이름은 1938년 미국의 수학자 에드워스 카스너(Edward Kasner)의 9살짜리 조카 밀턴 시로타(Milton Sirotta)에 의해 지어졌다. 카스너는 이 개념을 저서 수학과 상상(Mathematics and the Imagination)에 수록했다. 이 수의 학문적인 중요성은 그리 크지 않고, 다만 주로 수학 수업에서거론될 뿐이다. 카스너는 이 수를 매우 큰 수와 무한대의 차이를보이기 위해 고안했다. 이것은, "무한대와 구골의 차이는 무한대와 1의 차이와 같다"라는 칼 세이건의 말에서도 잘 드러난다. 구골은 우주의 모든 원자의 수보다 많은 상당히 큰 수이다.
2) EMC 디지털 유니버스 보고서: '빅데이터, 더욱 길어진 디지털 그림자, 이머징 마켓의 놀라운 성장' 연구 결과 보고서