열려있는 정책플랫폼 |
국가미래연구원은 폭 넓은 주제를 깊은 통찰력으로 다룹니다

※ 여기에 실린 글은 필자 개인의 의견이며 국가미래연구원(IFS)의 공식입장과는 차이가 있을 수 있습니다.

서비스산업 데이터 활용 현황과 시사점 1) 본문듣기

작성시간

  • 기사입력 2023년10월15일 17시04분
  • 최종수정 2023년10월15일 13시09분

작성자

  • 구진경
  • 산업연구원(KIET) 서비스미래전략실 연구위원

메타정보

  • 2

본문

 

 <요약>

► 서비스산업에서 데이터의 중요성이 증가함에 따라 데이터 활용 활성화를 위한 제도 기반 마련의 중요성 또한 증가하였다. 본고는 국내 서비스산업 기업들의 데이터 활용 현황을 살펴보고 데이터 활용 활성화 방안을 제안하였다. 

►국내 서비스산업 기업들의 데이터 활용은 과거에 비해 빠르게 증가하고 있다. 특히 규모가 크거나 업력이 낮은 기업일수록 데이터 활용 비중이 높았다. 다만 타산업과 비교해 기업 규모에 따른 데이터 활용 격차는 상대적으로 작게 나타났다. 아울러 서비스산업 내 업종 간 이질성으로 인해 정보통신업, 금융업, 유통물류업 등에 데이터 활용기업이 편중되어 있었다. 

►서비스산업 내 주요 기업들의 데이터 활용 현황조사 결과, 서비스산업 기업들은 제품과 서비스의 개발과 개선, 마케팅을 위해 데이터를 수집·활용하는 것으로 나타났다. 특히 서비스산업에서는 고객 개인정보를 가장 많이 활용하는 것으로 나타났다. 이 때문에 개인정보 보호와 같은 법적 분쟁 발생 가능성이 데이터 수집의 가장 큰 장애요인으로 나타났다. 현재 데이터를 활용하고 있는 서비스산업 기업들과 비활용기업 모두 전문인력의 양적·질적 부족을 데이터 활용의 가장 큰 장애요인으로 뽑았다. 

►따라서 서비스산업의 데이터 활용 활성화를 위해서는 전문인력 양성이 선결과제이다. 이미 정부 주도로 데이터 전문인력 양성 제도들이 시행되고 있지만 교육 기간의 부족 등으로 전문인력 양성의 한계가 있다. 따라서 기존의 데이터 전문인력 양성 과정 간 연계를 통해 교육 기간을 늘리고, 전문대학원의 박사과정 도입을 통해 전문성을 향상해 나갈 필요가 있다. 

►아울러 기업들의 수요가 높은 서비스산업 내 이종 데이터 간 활용성을 높이기 위한 이종 데이터 표준화 가이드라인 마련이 필요하다. 또한 데이터 거래로 인한 기업들의 법적 부담 완화를 위한 데이터 거래 거버넌스 구축이 업종별로 이루어질 필요가 있다. 

 

1. 서론 

 

산업 전반에서 디지털 전환이 가속화되고 있다. 디지털 전환을 이끄는 주요한 디지털 기술 중에서도 AI와 빅데이터는 가장 광범위하게 활용되고 있는 핵심기술이다. AI와 빅데이터의 활용은 시장에 존재하는 다양한 데이터를 수집하고 가공하여 활용할 수 있도록 하는 데이터 생태계를 기반으로 하고 있다. 특히, 데이터를 수집하고 가공할 수 있는 기술이 발전하면서 양질의 대용량 데이터 축적이 가능해졌다. 이로 인해 데이터를 산업에 활용할 수 있는 영역은 더욱 다양해지고 확대되었다. 

특히 제조업과 비교해 서비스산업에서의 데이터는 더 다양한 방식으로 활용되고 있다. 제조업에서 데이터의 활용이 제품의 개발과 공정개선에 초점을 맞추고 있다면, 서비스산업에서의 데이터는 서비스의 개발과 전달체계의 개선뿐만 아니라 새로운 비즈니스 모델을 창출하고 시장을 확대하는 데 활용되고 있다. 따라서 서비스산업에서의 데이터의 활용은 더 다양한 활용 범위와 발전가능성을 내포하고 있다. 

 

때문에 서비스산업에서의 데이터 생태계를 이해하고 생태계 내 원활한 순환을 도울 수 있는 제도적 기반 마련이 더욱 중요해지고 있다. 서비스산업 데이터 활용생태계의 각 주체들이 원활하게 역할을 수행해 데이터 활용의 선순환 구조를 창출할 수 있도록 데이터 활용의 장애요인 제거 및 제도 기반 마련이 필요하다. 이를 위해 본고에서는 국내 서비스산업에서의 데이터 활용 현황을 살펴보고 서비스산업의 데이터 활용을 활성화하기 위한 방안을 제안하였다. 

 

2. 산업에서의 데이터 활용 생태계 

 

산업에서 활용되는 데이터는 데이터의 형태, 수집 주체, 수집되는 개인정보의 식 별가능성 등 다양한 기준으로 분류된다. 데이터의 형태에 따라 정형 데이터, 반정형 데이터, 비정형 데이터로 분류할 수 있으며, 식별가능성에 따라서 식별데이터, 비식별데이터, 가명 정보로 구분하고 있다. 이외에도 데이터의 권리 주체에 따라 개인정보와 개인정보 이외의 정보로 구분하기도 한다.2) 데이터의 산업적 활용과 정책 수립 측면에서 공공데이터와 민간데이터로, 민간데이터는 개인데이터와 기업이 생성하는 산업데이터로 구분할 수 있다. 

d294d2c650755c2f55f8b21608b1f103_1697172 

2011년 ‘데이터 경제(data economy)’를 처음 언급한 것으로 알려진 가트너 (Gartner)보고서3)에 따르면 데이터 경제란 “데이터를 활용해 산업 가치를 창출하는 경제”를 의미한다. 2014년 유럽집행위원회가 ‘데이터 주도 경제(data-driven economy)’, ‘데이터 경제(data economy)’를 언급하면서 데이터의 경제적 가치에 대한 인식이 확산되었다. EU는 데이터 경제를 “데이터에 접근하고 활용할 수 있도록 협업하는 과정에서 데이터 생산, 인프라 제공, 연구조사, 데이터 소비 등 서로 다른 역할을 담당하는 구성원으로 이루어진 생태계4)”로 정의했다. 가트너 보고서(2011)에서는 데이터 경제가 이해관계자 간의 신뢰, 상호작용 형태, 정보의 공유 정도를 기반으로 진화해 나간다고 언급하였다. 

 

산업에서의 데이터 생태계는 데이터의 ‘수집 및 저장’, ‘가공 및 유통’, ‘분석 및 활용’의 가치 창출 흐름을 통해 형성된다. 일반적으로 수집과 저장은 개별 기업(민간데이터)이나 개별 기관(공공데이터)에서 독립적으로 이루어진다. 이후 개별 주체들에 의해 수집된 데이터가 유통된다. 데이터가 원활하게 순환되어야 지속적으로 가치를 창출할 수 있는 생태계가 만들어지기 때문에 데이터 유통은 데이터의 가치 창출과 데이터 경제의 진전을 위해 매우 중요한 부분이라 할 수 있다. 

d294d2c650755c2f55f8b21608b1f103_1697172 

데이터 생태계의 가치사슬 흐름이 위와 같다면 데이터 생태계를 구성하는 주체 또한 데이터 생태계 가치사슬의 흐름에 따라 구분될 수 있다. 전승수의 연구(2012)에서는 데이터 생태계의 흐름에 따라 데이터 생태계 구성 주체를 구분하였다. 해당 연구에서는 데이터 생산자, 데이터 유통자, 데이터 소비자와 솔루션 제공자로 나누어 제시하고 있다. 조지연 등의 연구(2012)에서는 데이터 생태계 구성 주체를 데이터를 이용하는 행위자와 데이터를 이용할 수 있도록 기술 등의 인프라를 제공하는 가치생산자로 나누고, 행위자는 다시 데이터 생산자와 데이터 서비스 이용자로 구분하고 있다. 일반적으로 데이터산업에 대한 현황 통계는 데이터 생태계에서 데이터 가치생산자에 해당하는 주체들의 경제활동을 집계하고 있다. 

한국의 데이터 산업은 미국이나 유럽과 비교해 작은 규모이지만 빠르게 성장하고 있다. 한국데이터산업진흥원의 2021 데이터산업 현황조사에 따르면 국내 데이터 산업은 2019~2021년 사이 연평균 17.1% 성장해 2021년에는 전년 대비 15.5% 성장 한 23조 972억 원으로 추정되어 매우 빠르게 성장하고 있음을 알 수 있다. 

 

3. 서비스산업의 데이터 활용 현황 

 

통계청은 기업활동조사를 통해 기업의 다양한 경영활동을 조사하고 있다. 이 중에는 기업의 디지털 기술 활용 여부에 대한 항목이 포함되어 있다. 본고에서는 기업이 활용하고 있는 디지털 기술 중 빅데이터 활용 여부 결과 분석을 통해 서비스산업 기업의 데이터 활용 현황을 분석하였다. 

d294d2c650755c2f55f8b21608b1f103_1697172
산업 전반의 데이터의 활용이 빠르게 증가하면서 서비스산업 기업의 데이터 활용비율 또한 빠르게 증가하는 추세이다. 2019년 서비스산업 내 데이터를 활용하는 기업 수는 438개로 2017년 227개와 비교해 약 두 배 증가하였다. 이는 산업 전 반의 데이터 활용이 증가하는 비율과 비슷한 증가 수준이다. 특히 규모가 크거나 업력이 낮은 기업일수록 빅데이터 활용 비율이 높았다. 서비스산업에서 종사자 수 300인 이상 기업의 빅데이터 활용 비율은 11.1%인 데 반해 300인 미만 기업의 빅데이터 활용은 4.4%로 나타났다. 서비스업을 제외한 전체 산업에서 300인 이상 기업의 빅데이터 활용기업의 비중이 9.7%인 데 반해 300인 미만 기업의 빅데이터 활 용 비중은 2.8%로 나타났다. 기업 규모별 빅데이터 활용 격차는 서비스산업에서 상대적으로 작게 나타났다. 업력에 따른 빅데이터 활용 비율의 차이는 5년 이하 기업에서 빅데이터 활용기업 비중이 9.9%로 5년 초과기업(5.5%)의 두 배에 근접한 수준으로 나타났다. 

 

뿐만아니라 서비스산업 내 업종 간 이질성으로 인해 서비스산업이라하더라도 세부 업종별로 빅데이터 활용 수준도 큰 차이를 보였다. 컴퓨터 프로그래밍, 시스템 통합 및 관리업(KSIC 62)에서 빅데이터 활용률이 23.2%로 가장 높은 수준을 보였다. 다음으로 보험 및 연금업(KSIC 65), 정보서비스업(KSIC 63), 보건업(KSIC 86), 출판업(KSIC 58), 우편통신업(KSIC 61) 등이 각각 22.8%, 21.3%, 17.6%, 17.4%, 16.8%의 빅데이터 활용 수준을 보이는 것으로 나타났다. 반면 해당 기간 기업 수 기준, 서비스업에서 가장 높은 비중(3,294개)을 차지하는 도매 및 상품 중개업(KSIC 46)의 경우 2.9%의 빅데이터 활용을, 세 번째로 많은 기업(1,433개)이 포함된 육상 운송 및 파이프라인 운송업(KSIC 49)은 1%로 낮은 수준을 보였다. 


4. 서비스산업의 데이터 활용 실태 

 

기업활동조사 데이터 분석결과 서비스산업 내 데이터를 활용하는 기업은 일부 업종에 편중되어 있다. 특히 서비스산업 내에서는 정보통신업, 금융업, 유통·물류, 의료 분야에서 데이터의 활용이 활발하게 일어나고 있다. 이들 업종이 구체적으로 어떻게 데이터를 수집·활용하는지를 실태조사를 통해 파악하였다.5)

d294d2c650755c2f55f8b21608b1f103_1697172 

 비스산업에서는 고객 특성정보, 거래정보와 같은 개인정보(응답기업의 54.6%, 복수응답)를 가장 많이 활용하는 것으로 나타났다.5)이외에는 유통·물류데이터 (59.5%), 금융·신용데이터 (54.1%) 순으로 많이 활용하는 것으로 조사되었다. 기업들이 활용하는 데이터는 민간데이터(64.9%)의 비중이 가장 높았으며, 국가 중 점데이터(48.0%)의 활용이 가장 낮은 것으로 조사되었다. 데이터의 식별 가능성을 기준으로 개인정보, 신용정보, 위치정보 등 식별이 가능한 민감정보의 활용보다는 익명처리정보, 빅데이터 등 식별이 불가능한 정보를 활용하는 비중이 높은 것으로 나타났다. 

 

서비스산업 기업들은 ‘제품 및 서비스의 개발 및 개선(70.9%)’, ‘시장 및 고객 동향 파악(56.8%)’, ‘마케팅 및 판매(47.3%)’를 목적으로 데이터를 수집하는 것으로 나타났다. 서비스산업 데이터 활용기업들은 데이터의 수집 및 활용을 위한 전문인력을 보유하고 있는 것으로 나타났다. 즉 서비스산업 기업들은 거래를 통해 데이 터를 외부에서 획득하기보다는 내부에서 수집한 데이터를 활용하는 것을 알 수 있다. 데이터 수집과 획득에서 장애요인을 조사한 결과 ‘개인정보 보호법 등과 같은 법 제도적 제약(22.3%)’이나 ‘기업이 활용할 만한 적절한 데이터를 제공하는 업체의 부재(18.2%)’ 등이 데이터 획득 시 가장 큰 장애요인으로 작용하고 있는 것으로 조사되었다. 이는 서비스산업에서 활용하는 데이터가 소비자 개인정보인 경우가 많아 타산업에 비해 개인정보 보호와 같은 법제도적 문제들이 데이터 활용의 장애요인인 것을 알 수 있다. 

d294d2c650755c2f55f8b21608b1f103_1697172 

데이터를 구입할 의향을 묻는 질문에 전체 응답 기업의 45.3%가 구입 의향이 있는 것으로 나타나 실제 데이터 구입에 대한 니즈가 존재하는 것을 확인할 수 있다. 그러나 ‘업종에 특화된 데이터가 없거나(21.0%)’, ‘품질 대비 높은 가격(18.5%)’과 같은 시장요인에 의한 장애요인이 있는 것으로 나타났다. 또한 기업들은 영업 비밀이 유출될 가능성이 있다는 우려 때문에 기업이 가지고 있는 데이터를 무상 또는 유상으로 판매하는 것에 부담을 느끼는 것으로 나타났다. 

서비스산업 기업들은 ‘제품 및 서비스의 개발과 개선(73.0%)’, ‘시장 분석 및 예측 (68.2%)’, ‘상품 및 서비스의 판매(64.9%)’ 등을 위해 데이터를 활용하고자 하였으며, 데이터를 활용했을 때 ‘고객 관리(60.9%)’ 분야의 효과가 가장 크다는 의견이 많았으나 기업들의 경영성과에는 큰 변화가 없는 것으로 응답했다.서비스산업 기업들의 향후 데이터 활용계획을 조사한 결과 응답기업의 33.8%가 데이터 활용 분야를 확대할 계획이 있다고 답했으며, 데이터 관련 인력 확충(38.5%)과 예산 증액 계획(39.9%)이 있는 것으로 응답했다. 서비스산업 기업의 데이터 활용의 가장 큰 장애요인으로 데이터 관련 인력의 전문성 부족을 응답하였으며 다음으로 전문인력의 양적 부족을 응답하였다. 

 

데이터 미활용 기업의 도입 상황 및 활용계획을 조사한 결과 전체의 60.2%에 해당하는 기업이 도입의 필요성이 없기 때문에 데이터를 활용하지 않는 것으로 나타났다. 그러나 시장 분석과 예측, 고객행동 분석, 서비스 가격결정 분야에서는 활용할 의향이 상대적으로 높은 것으로 나타났다. 데이터 활용의 장애요인으로 업종별로 특화된 데이터 부족과 전문인력 부족을 가장 큰 장애요인으로 응답했다.

 

5. 서비스산업 데이터 활용 활성화를 위한 정책 제언 


(1) 데이터 전문인력 양성 

 

서비스산업 기업들의 데이터 활용의 가장 큰 장애요인으로 전문인력 부족을 꼽고 있다. 신기술이 도입되어 활용되기 위해서는 해당 기술을 활용할 수 있는 인력 공급이 반드시 수반되어야 한다. 데이터 분야의 경우도 전문인력 양성이 원활히 이루어질 수 있도록 해야 한다. 

이를 위해 국비교육 과정과 전문대학원 과정의 결합 및 빅데이터 인력 양성의 고급화를 위한 박사과정 도입이 필요하다. 현재 양성되고 있는 빅데이터 분석전문가 혹은 전문가는 일반 기업들이 요구하는 수준을 달성하기에는 역부족으로 이는 과정별 특성과 목표치에 따른 교육 시간 부족 때문이다. 이를 해소하기 위해 국비과정과 대학원 교육을 연계하여 충분한 기초 교육, 실습을 통한 숙련도 향상을 도모하여 일반적 인식 수준에서의 전문인력으로 교육하는 것이 필요하다. 국비과정은 비전공자들에 대한 컴퓨팅 능력 활용·향상에 목표를 맞춰 진행하고 데이터 획득부터 시각화를 통해 일련의 데이터 분석 과정을 학습한다. 그리고 이러한 기본 실력이 갖춰진 인력에 대해 전문대학원들이 수행하는 컴퓨팅 기초 등을 대체하여 좀 더 빠르게 머신 러닝과 AI, 빅데이터 활용에 대한 이론 교육을 늘린다. 이 과정에서 실무 프로젝트 를 병행하여 실천적 이론을 통해서 어려운 문제를 직접 해결할 수 있는 능력을 배양 할 필요가 있다. 

 

다음으로 국비과정이나 석사 수준에서의 연계가 이루어져 전문인력을 양성한다고 해도 궁극에 가서 서비스산업 자체를 견인할 수 있는 데이터 활용 인재는 박사급인 고급 데이터 전문가로부터 파생된다. 때문에 서비스산업의 활성화를 도모할 수 있는 고급 인력의 시장 진입을 확대하기 위해 각 전문대학원에 박사과정 설립을 지원하고 이것이 원활히 작동할 수 있도록 인적·물적 지원이 필요하다.


(2) 데이터 표준화를 통한 활용성 증대 

 

서비스산업은 소비자와 접점에 있기 때문에 다양한 소비자 정보 수집이 가능하다. 특히 서비스산업에서는 업종별로 다양한 데이터가 발생하기 때문에 데이터의 다양성이 더욱 높다. 데이터의 다양성은 다양한 정보를 얻을 수 있는 이점은 있지만 데이터가 표준화가 되어 있지 않아 빅데이터로 가공하고 활용하는 데 어려움이 있다. 때 문에 우리 정부는 데이터 활용성을 높이기 위한 방안으로 꾸준히 데이터 표준화를 위한 노력을 기울이고 있다. 정부에서는 데이터 결합 전문기관을 통해 데이터를 결합하도록 하고 있으며, 데이터 결합에 대한 가이드라인을 발표했다. 결합 전문기관은 통계 작성, 과학 연구, 공익적 기록 보존 등을 위한 서로 다른 개인정보 처리자 간 가명정보의 결합을 수행하는 전문기관으로 개인정보보호위원회 또는 관계 중앙행정 기관이 지정한다.6) 


결합 전문기관은 가명정보를 안전하게 결합하고 반출하는 업무를 수행하는 기관으로 근거법에 따라 데이터 전문기관과 결합 전문기관으로 구분할 수 있다. 데이터 전문기관은 신용정보법에 근거한 금융위원회 지정 데이터 결합 전문기관으로 2021년 말 기준으로 총 4개가 지정되어 있다. 개인정보 보호법에 근거한 결합 전문기관은 개인 정보보호위원회, 보건복지부, 과학기술정보통신부, 국토교통부, 교육부, 산업통상자원부, 행정안전부가 지정한 기관으로 총 22개가 지정되어 있다. 

뿐만아니라 의료 등의 많은 분야에서 동일 업계 내 데이터 간 결합에 대한 가이드라인은 있으나 이종 데이터 간 결합을 위한 가이드라인은 명확하지 않다. 금융 등 일 부 분야에서만 제한적으로 이종 데이터 결합을 위한 가이드라인 제정 노력을 기울이고 있다. 따라서 이종 데이터 간 결합을 위한 가이드라인 마련이 필요하다. 

d294d2c650755c2f55f8b21608b1f103_1697172
(3) 데이터 유통을 위한 거버넌스 구축 

 

지식과 정보 생태계의 지속가능한 발전을 위해서는 가치 창출의 원천인 지식과 정보가 원활하게 순환해야 한다. 데이터 생태계 또한 마찬가지이다. 데이터가 활발히 유통되어야 데이터 생태계의 순환 또한 활발해진다. 따라서 데이터 거래를 활성화하기 위해서는 법적 지위가 보장된 거버넌스의 구축이 필요하다. 국내에도 데이터 거래소가 운영되고 있지만 데이터 거래로 인한 법적 분쟁에 대응하거나 데이터별 특수성을 고려한 데이터의 선별과 제공의 기능을 수행하지 못하고 있다. 미국의 경우 분야별 데이터의 이질성을 고려하여 대통령실 예산관리국의 총괄 아래 연방정부 내각 부처가 분야별로 데이터를 관리하고 있다. 한국도 금융분야에서만 금융위원회가 거버넌스가 되어 금융데이터의 관리, 감독, 활용의 촉진에 기여하고 있다. 따라서 데이터의 원활한 거래를 위해서는 서비스산업 업종별로 데이터를 관리·감독하고 활용할 수 있는 지위를 가진 거너번스가 구축되어야 한다. <KIET>

---------------------------------------------------------------------------

1) 구진경 외(2022), 「서비스산업의 데이터 활용 생태계 활성화 전략」의 일부 내용을 발췌하여 정리함. 

2) 김명아(2021), 「빅데이터의 활용 및 정보보호에 관한 법제 연구」, 한국법제연구원. 

3) Davids Newman(2011), “How to Plan, Participate and Prosper in the Data Economy”, Gartner Research. 

4) European Commission, 2017; 심연숙, 2020 재인용.  

5) 조사기간: 2022.9.8~10.19, 조사표본 수 데이터 활용기업 325개, 데이터 미활용기업 150개, 온라인조사 방식.  

6) 국가법령정보센터, 개인정보 보호법 제28조의3.  ​ 


< ifsPOST>

이 글은 산업연구원(KIET)이 발간한 [월간 KIET 산업경제] 9월호 특집에 실린 것으로 연구원의 동의를 얻어 게재합니다.<편집자>


2
  • 기사입력 2023년10월15일 17시04분
  • 최종수정 2023년10월15일 13시09분

댓글목록

등록된 댓글이 없습니다.