열려있는 정책플랫폼 |
국가미래연구원은 폭 넓은 주제를 깊은 통찰력으로 다룹니다

※ 여기에 실린 글은 필자 개인의 의견이며 국가미래연구원(IFS)의 공식입장과는 차이가 있을 수 있습니다.

AI 시대, 비정형 데이터를 활용한 스마트인프라 구현 본문듣기

작성시간

  • 기사입력 2025년05월01일 13시40분
  • 최종수정 2025년05월01일 12시00분

작성자

  • 남영준
  • 중앙대학교 문헌정보학과 교수,대한민국 열린정부위원회 민간위원장

메타정보

  • 1

본문

국가가 발전하기 위해서는 SOC(사회간접자본) 개발사업을 통해 국민의 기본적인 거주 및 산업, 문화적 삶을 지원해야 하며, 이를 위해서는 교통과 물류, 에너지, 수자원, 통신, 폐기물 등에 대한 물리적 기반 시설을 갖추어야 한다. 기본적으로 이런 기반시설을 구축하기 위해서는 천문학적인 예산과 인력이 투입된다. 또한 그 시설을 완성한 이후에도 그 시설이 갖고 있는 효용성을 유지하기 위해서 추가적으로 많은 재원이 투입된다. 그렇지만 그 기반시설의 개발 과정에서 설계가 잘못되거나 혹은 사전에 미처 고려하지 못한 요소로 인해 뒤늦게 이를 바로잡으려 할 때, 오히려 새롭게 건설하는 것 이상의 추가 재원을 소모하게 되는 경우도 있다. 이런 상황을 사전에 예측하고 방지하기 위해서는 스마트인프라(Smart Infrastructure)를 구현하는 것이 가장 확실한 방안이다.

특히 AI와 함께하는 스마트인프라는 교통과 전력, 교육, 의료, 환경 등의 정보를 데이터화하고 이를 상호 연결해 실시간으로 현상을 예측해 대응함으로써 개발 이전에 발생할 수 있는 오류를 방지한다. 스마트인프라가 현대사회에 절대적 가치를 갖는 이유이다.

스마트인프라와 비정형 데이터

스마트인프라는 물리적 인프라(Physical Infrastructure)와 디지털 인프라(Digital Infrastructure)를 유기적으로 결합하여 시민을 위한 최적의 도시공간을 건설하고 삶의질을 지속적으로 유지할 수 있도록 하는 것을 말한다. 
이 가운데 물리적 인프라는 통신망과 교통망, 의료망 등과 같이 시민들이 살아가는 공간에 존재하는 사회기반시설이다. 이에 비해 디지털 인프라는 IoT를 비롯하여, 네트 AI 시대, 비정형 데이터를 활용한 스마트인프라 구현워크, 빌딩정보모델링(BIM: Building Information Modeling)과 지리정보시스템(GIS:Geographic Information System) 등과 같이 시민들이 확인하기 상대적으로 어려운 시스템이다.

이 두 개의 인프라를 통해 모인 데이터는 정형 데이터와 비정형 데이터로 구분한다. 정형 데이터는 컴퓨터와 기계가 용이하게 분석할 수 있도록 구조화되어 있다. 정형 데이터는 해당 데이터가 어떤 의미를 갖고 있는지를 메타데이터 스키마와 메타데이터 정의서로 설명하고 있다. 정형 데이터는 관리자들이 그 데이터를 어떻게 표현하고 어떻게 활용할 지에 대해서 대부분 시스템 설계 전에 정의하고 있다.

이에 비해 비정형 데이터는 그 쓰임이 사전에 정해져 있지 않고 축적되는 데이터로서 IoT를 통해 들어오는 센싱 데이터와 이메일 본문, 텍스트 파일, 사진이나 도면의 일부가 이에 해당한다. 또한 건설 관련 최종보고서 혹은 지역주민의 간담회 자료, 설문지 등도 대표적인 비정형 데이터이다.

스마트인프라 기반의 스마트 시티 건설은 AI의 도움 없이는 구현이 어려운 시대가 되었다. 이런 AI에게 필요한 것이 비정형 데이터이다. 정형 데이터는 기계가 상황을 이해하는 데이터로 주로 사용되고, 비정형 데이터는 그 기준에 의해 판단을 결정하는 데이터로 활용되기 때문이다. 따라서 비정형 데이터와 정형 데이터, AI의 결합으로 시민이 정주하고 있는 공간을 더욱 스마트하게 발전시켜 시민 삶의 질을 책임지는 스마트인프라를 구현할 수 있다.

특히 비정형 데이터를 활용하기 위해서는 필연적으로 비정형 데이터의 디지털화와 전처리 작업이 이루어져야 한다. 예를 들면 종이나 사진에 내재된 지식을 해석하고 이를 디지털화하여 기계가 읽고 이해할 형태로 변환하여야 한다. 또한 비정형 데이터는 기본적으로 구조화 혹은 정형화되어 있지 않아 그 자체로는 데이터가 갖고 있는 의미를 이해하기 어렵다. 따라서 비정형 데이터를 기계가 정확하게 이해하기 위해서는 최소한의 전처리작업(언어처리 등)과 주석(annotation)이 비정형 데이터와 함께 제공되어야 한다. 왜냐하면 이와 같은 전처리 작업을 통해 그 주요한 판단근거를 AI에게 학습시킬 수 있기 때문이다.

이러한 DX(Digital Transformation)과 AX(AI Transformation) 작업을 통해 기계에게 인간의 변덕스런 생각과 미묘한 감정을 온전하게 전달할 수 있다. 이것이 현대 AI 시대의 핵심이다. 맵고 뜨거운 국물을 마시면서 ‘시원하다’라고 표현하는 인간의 마음을 AI가 이해하기란 쉽지 않다. 그렇지만 인간의 감정과 생각을 AI에게 전달하기 위해서 비정형 데이터를 활용하기 위한 다양한 기술들이 AI산업 현장에서 활발하게 활용되고 있다.

비정형 데이터의 스마트인프라 활용

우리가 살고 있는 도시는 ‘진화’하고 있다. 이 진화는 현재 삶의 질이 점점 좋아지는 것을 의미한다.

<가상장면 1> 100층의 아파트를 금강 옆에 신축한다. 설계와 감리는 해외 회사에서 맡았으며 시공은 국내 시공사가 수행한다. 이 아파트가 금강과 얼마나 잘 어울리는지 또한 금강 범람 시에 아파트의 침수를 예측하여 이를 고려한 프로젝트를 비정형 데이터와 BIM데이터, 클라우딩 컴퓨팅을 이용하여 관련사들이 국내와 해외에서 실시간으로 협업하며수행하고 있다. 또한 시민의 다양한 의견을 메일과 건의함을 통해 수집하고 분석하여 관련사와 주민이 모두 참여하는 최고의 아파트가 만들어지고 있다.

<가상장면 2> 세종시에 지하철을 건설한다. 어디에 지하철역을 건립하는 것이 가장 좋은 지를 센서와 IoT를 이용한 유동인구조사표와 행정중심복합도시건설청에서 보관 중인 세종청사 마스터플랜 보고서와 건설공사정보, 민원철 등 관련 도면과 자료를 AI로 분석하여 지하터널 굴착에 따른 소음, 분진 민원을 최소화할 수 있는 곳을 결정하고 있다.

이상과 같은 가상의 도시 진화 장면은 실제적으로 비정형 데이터를 스마트인프라에 활용하는 것으로, 현재에도 각종 국토개발에 적용하고 있는 기술이다. 스마트인프라를 활용한 건설로 생산성은 향상되며 건설 및 유지관리 비용도 줄고, 궁극적으로 시민의 사회적 편익이 극대화된다. 국토 분야의 스마트인프라는 하나의 유행으로 지나가는 것이 아니라 우리나라 도시 경쟁력을 제고할 수 있는 지금 이 순간의 핵심 전략인 것이다. 이 스마트인프라를 살아있고 의미있게 만드는 것이 데이터이며, 그중에서도 특히 거대한 비정형 데이터이다.

끝으로 AI와 스마트인프라를 이용한 국토개발을 위해서는 공공이 보유하고 있는 비정형 데이터를 충분히 활용하는 것은 물론이고, 나아가 민간의 품질 좋은 비정형 데이터와의 결합과 공유가 절실하다. 이를 위해서 국토연구원 차원에서 국토 관련 정형 데이터와 비정형 데이터 국가 데이터댐 건설을 사족으로 제안해 본다. <KRIHS>


▣ 국토연 특집​ ‘비정형 데이터의 융·복합적 활용’ 보고서 상세보기

https://www.ifs.or.kr/bbs/board.php?bo_table=research&wr_id=11056

 

<ifsPOST> 

 이 글은 국토연구원이 발간한 월간 국토 4월호 특집에 실린 것으로 연구원의 동의를 얻어 게재합니다. <편집자>

 

 

1
  • 기사입력 2025년05월01일 13시40분
  • 최종수정 2025년05월01일 12시00분

댓글목록

등록된 댓글이 없습니다.