[ 빅데이터, AI 데이터 ] 총성없는 전쟁 데이터확보 경쟁
대한상의 브리프
총성없는 전쟁 데이터확보 경쟁
대한상공회의소가 회원님께 드리는 최신 경제정보 2017년 10월 23일
데이터가 AI 개발과 산업혁신의 핵심 재료가 되면서 데이터를 수집·확보하려는 경쟁이 치열합니다.
이번 호1)에서는 주요 기업들이 데이터 확보를 위해 어떠한 노력을 기울이고 있는지 살펴보겠습니다.
총성 없는 전쟁... 데이터 확보 경쟁
- 글로벌 기업의 데이터 수집 전략과 시사점 -
영국의 경제지 이코노미스트는 “데이터가 과거 원유처럼 성장과 변화의 원천이 됐다"라고 평가했다.
산업화 시대에 원유를 정제해 석유와 아스팔트부터화학·의약품까지 다양한 제품을 만들었듯, 앞으로
기업들은 데이터를 활용해 새로운 사업을 무궁무진하게 내놓을 수 있다는 의미.
신용분석업체인 제스트파이낸스(ZestFinance)는 대출자의 통화기록 및 소비성향, 소셜네트워크 상에서의 활동 등 다방면의 데이터를 분석하여 보다 정교한 신용평가 모델을 개발했다.금융회사들은 이 모델을 활용해 상환의지가 강한 데도 신용도가 약해 제도권에서 자금을 빌리지 못하는고객을 확보함은 물론 대출 연체율은 낮추고 수익은 20% 이상 올렸다. 데이터 활용 마케팅의 최전선에는 아마존(Amazon)이 있다. 기존 주문과 검색 내역, 구매 희망 목록, 마우스 커서 움직임 등을 기반으로 주문 가능성이 높은 제품을 해당 고객 근처의 물류창고로 미리 발송해 놓아 운송시간을 최대한 줄이는 ‘예측 배송'서비스를 내놓을 예정이다.
1) 조선일보 ‘4차 산업혁명, 이미 현실이 된 미래’, ‘금융 빅데이터 전쟁’ 기사 등을 참조해 작성
디지털 환경에서 생성되는 데이터는 측정이 불가능 할 정도로 방대하다.온라인 쇼핑 결제 기록, 소셜네트워크 글, 인터넷 기사 댓글,
검색 기록, 사이트 가입 때 기입한 정보 등 모든 자취가 데이터로 쌓이고 데이터에 기반을 둔 혁신과 가치 창출은 더욱 확장될 전망이다. 미국 BSA의 연구 결과에 따르면 데이터 활용률을 1%만 높여도 미국 GDP 정도(15조 달러, 2011년 기준)의 부가가치가 새로 생겨날 것으로 예상됐다.
데이터가 지나가는 길목을 선점하다
정보기술(IT) 기업들은 데이터 수집을 위해 하늘에 드론과 열기구까지 띄우고 있다. 소셜네트워크를 장악한 페이스북은 ‘아퀼라’라는 태양광 드론을, 검색시장의 절대강자인 구글은 ‘룬’이라는 열기구를 띄워 밀림, 사막 같은 오지에서 인터넷을 서비스하는 계획을 추진 중이다. 인터넷 서비스를 제공하는 대신 망을 장악해 이용 데이터를 통째로 끌어모으겠다는 것이다.
마이크로소프트(MS)는 세계 최초의 해저 데이터 센터 구축을 추진하고 있다. MS 측은 “해저 데이터 센터는 별도의 냉각시스템이 필요 없다"라며 “세계 인구의 50%가 해안가에 거주하는 만큼 주요 해안도시마다 해저 데이터 센터를 설치하면 방대한 데이터를 가장 빠르게 모을 수 있다"라고 말했다.
정보를 찾아 경계를 넘나들다
온라인을 기반으로 성장한 아마존은 지난 6월 미국최대 유기농 식품 판매 체인 홀푸드(Whole Foods)를 137억$에 인수했다.
아마존의 홀푸드 인수에는 식료품 분야 진출 이상의의도가 담겨있다. 홀푸드가 미국, 캐나다, 영국에 걸쳐 보유한 440개매장을 단숨에 확보해 오프라인에 머물고 있는 판매자와 고객들을 온라인으로 끌어들이고 온라인으로는 알 수 없는 오프라인 소비자의 동선, 취향, 구매패턴 등을 관찰해 온·오프 시너지를 높이겠다는 것이다.
[ 출처 : 블로터뉴스 ]
최근애플이 작년에 중국 최대의 차량 공유 서비스인 ‘디디추싱(滴滴出行)’에 투자한 것도 데이터 확보와 관련이 있다. 중국판 우버로 불리는 디디추싱은 사용자가 3억명에 달한다. 애플은 디디추싱에서 확보한데이터를 자율주행차 개발에 활용할 가능성이 높다. 자율주행차는 각종 첨단 장비가 탑재되고 통신 네트워크와 연결돼 다양한 정보와 콘텐츠를 제공하는‘달리는 스마트폰’으로 기능할 전망이다.
마음속의 생각을 읽어내다
정보를 끌어모으는 단계를 넘어 사용자가 자발적으로 정보를 제공하게 하는 움직임도 나타나고 있다. 전 세계 여행자들이 사용하는 트립어드바이저(TripAdvisor)는 여행안내서를 대체했다. 사용자들은 스마트폰으로 여행지 주변의 명소와 맛집들을 검색하고, 실시간으로 방문자 후기를 참고하며 여행을 즐긴다. 특히 기존 여행안내서처럼 관련 정보를 일방적으로 찾아서 전달하는 방식이 아니라 참가자들이 스스로 사진과 경험담을 올리는 방식을 채택해 단기간에4억여명의 가입자를 확보하여 방대하면서도 정확한 정보를 축적할 수 있었다.
최근 네이버, 카카오를 비롯한 인터넷 기업들이 ‘음성인식 스피커’라는 하드웨어 시장에 뛰어드는 것도 정보 수집과 관련이 있다. 음성인식 스피커는 이용자가 말로 날씨, 금융, 교통등의 정보를 물어보거나 상품을 주문하면 이를 인식해 답을 알려주거나 필요한 작업을 진행해 주는 기기이다.
음성인식 스피커가 갈수록 많은 가전이나 냉난방 등홈 기기와 연결되면 소비자들이 집에서 어떻게 생활하고 어떤 서비스를 원하는지에 대한 정보가 스피커를 통해 쌓이게 된다. 음성 정보는 복잡한 절차나 글쓰는 부담 없이 말만하면 되므로 제공자의 거부감이 낮고 가공되지 않은 진솔한 정보를 얻을 수 있다.
이런 데이터를 모으는 관문을 확보하기 위해 기업들이 음성인식 스피커에 매달리고 있는 것이다. 애플이 작년에 중국 최대의 차량 공유 서비스인 ‘디디추싱(滴滴出行)’에 투자한 것도 데이터 확보와 관련이 있다. 중국판 우버로 불리는 디디추싱은 사용자가 3억명에 달한다. 애플은 디디추싱에서 확보한 데이터를 자율주행차 개발에 활용할 가능성이 높다. 자율주행차는 각종 첨단 장비가 탑재되고 통신 네트워크와 연결돼 다양한 정보와 콘텐츠를 제공하는 '달리는 스마트폰’으로 기능할 전망이다.
뒤처진 한국 ...
관련 규제완화가 절실하다
구글 및 아마존 등 유수의 IT기업이 아닌 대부분의기업들이 실시간으로 쏟아지는 데이터를 수집하기란 애초부터 쉽지 않다. 데이터 수집 및 분석이 의사결정의 질을 높이거나 실제 경영 성과와 정확히 비례하는 것도 아니다.하지만 이전에는 인지하지 못했던 새로운 메가트렌드를 발견하거나 혹은 간과하기 쉬운 미세한 변화를 경쟁기업 보다 빠르게 탐색하기 위해서는 데이터를 수집하고 활용하는 것이 큰 역할을 할 수 있다.
우리나라는 세계에서 가장 많은 데이터가 만들어지는 나라 중 하나이다. IT 환경이 우수하면서 신용카드 사용액 비중 세계 1위이며 보건·의료 부문, 지방정부를 비롯한 공공부문 등 광범위한 분야에서 매일 수많은 데이터가 쌓이고 있다. 그런데 활용도는 매우 낮다. 시장조사기관 테크프로에 따르면 글로벌 기업의 29%가 데이터를 경영에 활용하는 반면 우리 기업은 5%에 그치는 것으로 나타났다.여기에는 기업들의 인식 부족도 있지만 정보 수집및 활용 단계마다 사전동의를 요하는 지나친 규제가 작용한다.
미국 등 선진국은 악용에 대해서는 배상 등으로 엄격히 책임을 물리는 대신 정보 수집과 활용을 폭넓게 허용한다. 우리도 개인정보에 대해 수동적 보호 중심 에서 능동적 활용 중심으로 전환할 필요가 있다. 기업들도 무작정 정보를 축적하기보다는 자사의 수익창출과 경쟁력을 강화할 수 있는 데이터가 무엇인지 고민하고 목적에 맞는 데이터 수집 및 시스템 구축에 집중하는 것이 바람직하다 하겠다.
*출처 : 블로터뉴스
"헬스케어 빅데이터 활용하면 신약개발 속도 빨라져"
조선비즈 ㅣ 입력 : 2018.02.18
“생명과학과 의학은 그동안 엄청난 양의 헬스케어 빅데이터를 생산해왔지요. 4차산업혁명 시대, 헬스케어 분야에서 빅데이터는 엄청난 기회입니다. 또 동시에 매우 중대한 기로에 서있습니다.”
병원에서 수백만명, 수천만명의 임상 데이터가 쌓여가고 있다. 유전자 분석 기술이 발전하면서 전세계에서 수백만명의 유전체 데이터가 생산되고 있다. 스마트기기를 통해 ‘하루동안 내가 얼마나 걸었는지’, ‘얼마나 칼로리를 소모했는지’, ‘지난 밤 수면의 양과 질은 어떠했는지’ 등 각종 개인의 건강정보가 수집되고 있다. 이 모든 것이 헬스케어 빅데이터다.
많은 사람들이 ‘4차 산업혁명 시대의 막이 올랐다’고 말한다. 사물인터넷 기술을 바탕으로 시공간을 초월해 모든 사람과 사물이 연결되는 ‘초연결 사회’가 다가오고 있으며, 고도화된 인공지능 기술이 우리 생활 곳곳에 침투하게 될 미래가 머지 않았다는 것이다. 헬스케어 빅데이터 전문가 한현욱(사진) 아주대 의과대학 의료정보학교실 교수는 “새로운 혁신을 일으킬 미래 기술의 열쇠가 ‘헬스케어 빅데이터 활용’에 있다”고 강조했다.
헬스케어 빅데이터의 현재와 미래를 다룬 저서 ‘이것이 헬스케어 빅데이터이다(클라우드나인 출판)’가 출간됐다. 저자 한현욱 교수는 ‘공돌이’ 의사다. 한양대 컴퓨터공학과를 졸업하고 서울대학교 대학원에서 공학 석사 학위를 취득했다. 이후 차의과대학교 의학전문대학원에서 의사 면허와 함께 의료정보학 박사 학위를 받았다. 환자를 진료하는 보통의 의사와 달리 헬스케어 빅데이터를 어떻게 다루고 분석해 응용할지를 연구해왔다.
한 교수는 ‘헬스케어 빅데이터’를 “헬스케어 분야에서 빅데이터 분석 기술을 활용해 의료적 가치를 창출하는 지식정보 산업군”이라고 정의했다. 또 그는 “헬스케어 빅데이터를 충분히 활용할 합리적인 전략이 필요하다”고 역설했다.
‘네트워크 의학’이라는 개념에 대해서도 설명했다. 이는 생명체를 네트워크의 관점에서 보고 헬스케어 빅데이터를 이용해 네트워크 연구를 하는 것으로, 헬스케어 빅데이터를 이용한 새로운 패러다임으로 대두됐다. 한 교수는 “네트워크 의학은 의학적인 관점에서 질병의 원인이 되는 유전체와 단백질을 발굴하고 질병과 약물과의 상호 작용 등을 다루며, 유전체로 촉발되는 질병 간의 연관관계를 분석해 질병의 발생 메커니즘과 원인을 파악하는 데도 응용되고 있다”고 설명했다. 또 그는 “네트워크 의학이 인공지능과 어깨를 나란히 하며 빅데이터를 이용한 헬스케어 이노베이션의 최선봉에 있다”고 말했다.
헬스케어 빅데이터는 어떻게 활용될 수 있을까. 대표적인 예가 치료제 개발이다. 미국 브로드인스티튜에서 개발한 커넥티비티맵(CMAP)은 유전자 시그니처를 기반으로 새로운 약물의 가능성을 찾아주는 데이터베이스다. 5개의 세포주를 사용했으며 1309개에 달하는 약물에 대해 6100개의 유전자 발현 정보를 담고 있다. 특정 질병에 대한 유전자 발현 데이터를 입력하면 이와 발현 패턴이 반대되거나 유사한 약물을 찾아준다.
보통 새로운 약이 세상에 출시되기까지 약 10~15년 정도의 시간이 필요하다. 신약 후보물질 수가 얼마 안 남아있을 뿐 아니라 신약 제조까지 까다로운 규제도 넘어야 하기 떄문이다. 신약 하나를 개발하기까지 평균 1억달러(약 1200억원)~6억달러(약 7200억원)가 들지만, 일단 성공만 하면 연간 매출액은 투자액의 10배를 넘는다. 헬스케어 빅데이터가 전세계 연구자들과 글로벌 기업의 목표인 ‘신약 개발’의 시간과 비용을 당길 것이라는 기대가 커지고 있다.
한 교수는 “최근에는 유전체 데이터를 이용하지 않고 임상 데이터나 청구 데이터를 이용해 질병 간의 관계를 만들고 치료 효과가 있을 것으로 예상되는 약물을 찾기도 한다”며 “또 두 개 이상 약물의 조합을 통해 조합제를 개발하는 데도 도움이 될 수 있다”고 설명했다.
빅데이터를 분석해 A질병과 B질병의 연관성을 찾고, A질병과 B질병 환자가 상당히 많을 경우 A질병에 사용하는 약물과 B질병에서 사용하는 약물을 조합할 수 있다는 것이다. 환자는 복용 약을 두 알에서 한 알로 줄일 수 있고, 알지 못했던 새로운 적응증을 탐구하는 데도 도움이 될 수 있다.
한 교수는 “미래 헬스케어 산업을 이끌어가기 위해서는 합리적인 전략을 세우고 하루빨리 실천해야한다”고 강조했다.
첫번째 전략은 생산되는 헬스케어 데이터 자체를 제대로 발굴, 수집, 관리하는 것이다. 한 교수는 “헬스케어 데이터는 다루는 영역도 다양하고 그 속성이 복잡하다”며 “표준화 작업이 쉽지 않은 과제”라고 지적했다. 그는 “임상 영역에서 데이터의 연구와 교환을 동시에 만족하는 모델이 없고, 보험 청구를 위한 임상에서 사용하는 용어와 연구를 위한 용어가 다르며 입력된 데이터의 질도 믿을만하지 못하며, 유전체 데이터 역시 표준화된 분석 파이프라인과 지식 베이스에 관한 국내 거버넌스가 아직 없다”며 “각 헬스케어 데이터 상호 간의 특성을 면밀히 검토해 최적의 데이터 표준 모델을 설정해야 한다”고 주장했다.
두번째는 ‘헬스케어 빅데이터 전문 인력 양성’이다. 한 교수는 “헬스케어 데이터를 실제로 다루면서 이에 관한 세부 학문적, 기술적, 법적 문제점을 파악할 수 있는 전문가 양성이 시급하다”고 말했다. 세번째 전략은 ‘헬스케어 데이터의 공유와 법적 문제 해결’이다. 헬스케어 데이터는 가장 민감한 개인 정보를 담고 있어 공유와 활용이 쉽지 않다. 한 교수는 “현재 병원 간 데이터를 연계해 분석할 수 있는 법적 근거가 없다”며 “유전체 데이터, 임상데이터, 청구데이터를 통합해 분석할 방법이 없는 실정”이라고 밝혔다. 그는 “향후에는 개인건강기록과 블록체인기술을 바탕으로 헬스케어 데이터를 자유롭게 유통할 수 있는 헬스케어 생태계를 만들 필요가 있다”고 말했다.
청진기, MRI와 X-Ray, 수술용 로봇 시스템, 진단용 인공지능(AI), 신약 개발 등 의학은 전자공학, 기계공학, 물리학, 생물학, 수학 등 타 분야들과 융합하면서 질병에 관한 연구와 치료, 생명연장에서 발전과 혁신을 이뤄왔다.
한 교수는 “우리나라는 정보통신 분야에서 이미 상당 수준의 지적, 물적 인프라를 갖추고 있으므로, 이를 잘 활용해 미래 헬스케어 산업을 지식정보산업으로 육성할 필요가 있다”며 “그 중심에 헬스케어 빅데이터가 있다”고 강조했다.