열려있는 정책플랫폼 |
국가미래연구원은 폭 넓은 주제를 깊은 통찰력으로 다룹니다

※ 여기에 실린 글은 필자 개인의 의견이며 국가미래연구원(IFS)의 공식입장과는 차이가 있을 수 있습니다.

통계 조작일까? 통계작성 무능일까? 본문듣기

작성시간

  • 기사입력 2023년09월17일 17시13분
  • 최종수정 2023년09월18일 12시14분

작성자

  • 김상봉
  • 한성대학교 경제학과 교수,

메타정보

  • 4

본문

통계 조작 이슈가 언론에 나오고 있다. 통계학의 정의를 보면, 효율적인 의사결정을 하기 위해 자료를 수집, 요약, 분석하고 그 분석 결과를 해석하는 과정 및 기법을 연구하는 학문이라고 통계학 첫 번째 시간에 가르친다. 즉, 자료수집, 요약, 분석, 해석과정, 해석기법을 토대로 의사결정을 위한 학문이고, 최종목적은 의사결정을 하는 것이다. 실제로 대학원 학생들에게 가르칠 때, 가장 글을 쓰기 쉬운 것은 경제학적인 이론을 토대로 그림이나 수식을 푸는 것이고, 그 다음으로 통계자료나 모형을 토대로 결과를 해석하는 것이고, 제일 어려운 부분이 아무 것도 없는 내용에서 결론을 도출하는 무(無)에서 유(有)를 창조하는 것이다. 

 

이러한 무에서 유를 창조하는 것에 이르면 논문 마지막에 정책 파트가 나오고, 혼자 논문을 쓸 수 있는 학위과정생이 탄생하게 된다. 그러나 많은 연구자들은 한국의 통계를 신뢰하지 못한 지 꽤 오래되었다. 예전부터 사회주의 국가였던 중국의 경제성장률부터 대부분의 통계를 온전히 신뢰하지 못하지만, 한국의 통계를 신뢰하지 못한지는 중국보다 최근에 발생했다. 예를 들어, 중국의 경제성장률은 목표치가 있고, 각 세부 분야로 할당하듯이 내려온다. 일반적으로는 중국과는 역의 순으로 각 산업의 기여도를 계산하거나 지출항목별로 산출하여 경제성장률을 구한다. 때문에 경제전문가들은 중국 정부의 영향을 받지않는 IB나 다른 기관의 예측치를 더 믿기도 한다.

 

한국의 통계는 어떤 문제를 가지고 있을까? 일단 일부 변수가 정부 목표에 맞지 않다고 지수 등의 항목에서 빠지거나 이동하는 경우가 많다. 

 

예를 들어, 물가상승률의 경우를 보자. 물가상승률을 계산할 때 기본적으로 소비자물가지수 등을 활용한다. 그런데 가장 중요한 부동산 가격인 자가 주거비가 거의 반영되지 못한다. 자가 주거비는 2017년부터 2020년까지 1차 상승, 2021년부터 2022년 초반까지 2차 상승이 있었다. 그런데 통계 당국은 자가 주거비의 변화가 농산물이나 석유류와 같이 변동성이 크고, 가중치가 커지기 때문에 통계에 넣지 못한다고 했다. 

 

미국이나 일본은 그렇지 않다. 일본의 물가상승률과 금리는 매우 낮은데 그 이유가 다양하지만 자가 주거비가 하락하여 일정하기 때문이다. 미국의 경우에도 우리나라와 비슷하게 자가 주거비가 상승했고 이를 그대로 반영하고 있다. 예전에도 기자들이나 정책당국자들이 경제성장률이나 물가상승에 관해서 나에게 질문을 하면 나는 5%든 6%든 아무 의미가 없다고 이야기하곤 했다. 

 

  예컨대 2017년부터 2021년까지의 4년간 주요 도시의 평균 주택가격이 100% 뛰었다고 하면 단순 계산으로 연간 25%, 월별로 2.1%가 상승한 것이다. 따라서 소비자물가 산정에서 월별로 약 2% 정도가 반영되어야 한다. 비단 이러한 문제는 소비자물가지수만의 문제가 아니다. 다른 대표적인 예로 몇 년 전에 물가가 오르고 있을 때, 금이 소비자물가에서 생산자물가지수의 구성요인으로 바뀐 적도 있다. 

 

경제성장률과 세수 예측도 마찬가지이다. 대부분 경제전망을 하면서 정부 산하 기관들은 모형에 맞지 않더라도 경제성장률을 맞추고, 민간 기관들은 자신들의 주된 업종에 초점을 두고 경제성장률을 계산하고, 다음 해의 예산 등을 짜기 마련이다. 따라서 경제전망과 실제치는 점점 격차가 커진다. 그리고 그 전망치의 최소한을 맞추기 위해 연말에 밀어내기 건설 사업 발주 등을 통해 경제성장률을 올리기도 한다. 실제로 경제는 그만큼 발전하지 못했는데도 말이다. 이러한 수치도 파급력이 상당히 크다. 경상성장률에 따라 세금을 걷어야 하는데, 물가도 틀리고 경제성장률도 틀리니 매해 세수 예측도 제대로 맞을 수가 없다.

 

우리나라의 경기종합지수(Composite Index of Business Indicators)는 2018년 이후에 실제 현실과 맞지 않아, 연구자들이 이 자료를 쓰지 않고, GDP에서 각종 필터나 계절 조정 방법을 이용하여 계량경제학적 방법론으로 따로 뽑아쓰고 있다. 그 중에서도 선행종합지수 순환변동치는 더욱 가관(可觀)이다. 

 

선행종합지수는 미래 경기 흐름을 6개월가량 앞서 내다볼 수 있도록 고안된 지표로 재고순환지표, 소비자기대지수, 기계류 내수출하지수, 건설수주액, 수출입 물가비율, 구인 구직비율, 코스피지수, 장단기금리차 등 현재 경기를 선행하는 특성을 가지는 8개 하위 지수로 구성되어 있다. 우리 경제가 L자형 저성장에 머물고 있었기 때문에 통계의 신뢰성을 제고하기위해 2019년에 지수를 개편했다고 본다. 그런데 지수 개편 전에도 몇 개월 동안 계속해서 자료가 바뀌고, 이전 월과 자료가 연결되지 않고, 변화가 있었다. 그러나 개편 후에도 신뢰성은 제고되지 못했다.

 

요즘 신뢰성 이슈가 제기되고 있는 가계 동향 조사는 경제학적 데이터 관점에서의 무지, 표본추출의 문제, 그리고 기간의 문제를 안고 있다.

 

2016년부터 조사방식과 표본 선정 및 관리에 지속적인 변화를 주고 있었고, 그런 과정에서 2018년 1/4분기에 저소득층의 소득이 현저하게 떨어진 것으로 나오는 나왔다. 2017년과 2018년은 표본 가구 구성이 크게 달라 2018년 1분기 조사는 시계열 조사로서의 큰 문제가 있었다. 

 

통계청은 2016년에 가계소득에 관한 주요 조사를 가계금융복지조사에서 진행하고 기존 가계동향조사는 소득이 아닌 지출에 특화해 분기별 발표가 아닌 연간 조사로 변화시키기로 바꾸었다. 이에 따라 소득조사와 지출조사를 분리해 이중 소득조사는 2017년까지만 진행하기로 하고 표본 가구의 규모를 축소하고 있었다. 그 이전에는 가계동향조사의 표본 가구는 8,700가구였다. 그런데 2016년부터 표본 수를 줄이기 시작해 2017년에는 4,145명까지 줄어들어 있었다. 

 

그러나 학계와 전문가들이 소득과 지출이 통합된 조사와 분기 소득통계가 필요하다고 지속적으로 요구해 2017년에 조사를 종료하는 방침을 변경해 2018년부터 다시 조사를 확대하기로 하고 표본 가구수를 6,610가구로 급격하게 늘렸다. 즉 기존 표본의 절반이 넘는 약 2500가구가 새 표본으로 추가됐다. 이런 표본 수의 변화는 시계열 분석을 무의미하게 만든다.

 

부동산 가격 이슈는 표본 문제에 더하여 임의 기입 문제도 있다. 2020년 7월에 당시 국토부 장관은 국회 대정부질문에서 부동산 가격 상승과 관련해 “감정원(한국부동산원) 통계로 11% 정도 올랐다고 알고 있다”고 답했다. 

 

이 수치는 실제 시장과 동떨어진 수치였다. 당시 경제정의실천시민연합이 KB국민은행 통계를 인용한 부동산 가격 현황에 따르면 2017년 이후 3년간 서울 전체 주택가격은 34% 올랐다. 경실련은 아파트값 상승률이 52%에 달했고 2021년 5월까지 4년간 서울 아파트 평균 시세가 93% 뛰었다고 발표한 반면, 정부는 문 대통령 취임 후부터 2020년 말까지 17% 상승했다고 밝혔다. 

 

이후인 2021년 8월부터 한국부동산원은 주간 조사의 경우 기존에는 아파트 9400가구를 표본으로 활용했는데 이를 3만 2000가구로 확대하고, 월간 조사의 경우에도 아파트 표본을 1만 7190가구에서 3만 5000가구로 높이고 종합 조사 표본도 2만 8360가구에서 4만 6170가구로 확대했다. 표본의 확대 결과 주택가격은 더 크게 상승했다. 

 

2021년 8월17일 표본을 2만 8360가구에서 4만 6170가구로 확대한 첫 월간 조사 결과 그해 7월 서울 아파트 평균 매매가격은 한 달 사이 19.5% 상승한 것으로 나타났다. 표본 수의 증가만으로도 평균가격이 한 달 만에 20% 가까이 상승했다는 사실은 그간 정부 통계에 심각한 오류가 있음을 명확히 보여준다. KB시세도 믿지 못하는데 한국부동산원은 이를 토대로 보정까지 한다. 같은 동네에서 몇 개의 공인중개사가 입력하는 가격이기 때문에 심각한 표본추출 오류를 일으킬 수도 있고, 만약 그가 해당 지역의 주택을 보유했다면 심각한 편의(Bias)까지 발생하게 된다. 가격이 하락하는 경우도 마찬가지다.

 

고용 통계도 정부의 의지를 반영하는 경우가 많다. 공공기관의 비정규직 제로를 목표로 내세우며 정규직 축소에 나섰지만, 2019년 통계에선 비정규직이 전년 대비 87만 명이 늘어난 것으로 나타났다. 당시 기존 조사에서 포착되지 않았던 기간제 근로자 등이 추가로 포착되면서 35만~50만 명이 증가했다. 많은 부분이 청년과 노인에게 지급되었던 직접 재정지원 일자리 사업의 결과였다.

 

직접 일자리 예산이 2018년에 3.5조 원에 83만 5000명으로 1인당 약 35만 원, 2019년 3.8조원에 96.3만명으로 1인당 약 33만원이 지출되었다. 건강을 위하고 청년을 위해 예산을 늘리는 것은 좋지만, 이 결과 증가한 비정규직들을 고용통계로 잡으면  경제활동인구, 1인당 소득, 연금지급액 등의 다른 통계에도 영향을 미치게 된다.

 

통계를 기반으로 정책을 결정해야 하는데, 표본선정이나 표본 수의 문제, 시차의 문제, 정부 성과에 대한 의지가 담긴 문제, 변수를 빠뜨린 문제, 시계열 보정의 문제 등에 의해 통계의 신뢰성 수준이 영향을 받는다. 이런 관점에서 한국의 통계가 신뢰성의 위기에 처해 있다.

 

이제라도 단기간 정치에 의해 좌우되는 통계가 아니라 제대로 된 통계를 내고, 우리나라를 명확하게 비추어줄 수 있는 통계들이 일관성 있게 발표되어야 하고, 구 통계도 일정 기간 계속해서 신통계와 함께 보여주어야 한다.

 

그렇다면 이렇게 정부차원의 목표에서 광범위하게 이루어진  표본 수의 변화, 구성 인자들과 가중치의 변화들을 통계 조작이라고 보아야 할까? 아니면 통계 담당 실무자들의 꾸준한 통계 신뢰성 제고 노력이라고 보아야 할까?

 

만약 정책 결정자들의 의지를 반영하여 통계지수를 개편했다면 조작이라 볼 수 있겠지만, 실무자들이 통계지수의 신뢰도를 높이기 위하여 노력하는 과정에서 이런 결과가 나타났다면 이들의 무능력으로 볼 수밖에 없다.

 

어쨌거나 지금 한국 통계에 대한 신뢰는 위기상황이다. 신뢰회복이 급선무다.

<ifsPOST>

​ 

4
  • 기사입력 2023년09월17일 17시13분
  • 최종수정 2023년09월18일 12시14분

댓글목록

등록된 댓글이 없습니다.