김광두의 1년 후

<대담> 대선 결과를 분석하면 지방선거가 보인다 - AI 빅데이터 분석을 통한 심층진단 본문듣기

작성시간

  • 기사입력 2022년03월14일 01시52분
  • 최종수정 2022년03월14일 01시52분

메타정보

  • 5

본문

누가 언제 어디서 : ▲황희만 전 MBC부사장 ▲김상봉 한성대학교 교수, 2022.3.10.오후 3시, 국가미래연구원 스튜디오

 한성대학교 김상봉 교수는 빅데이터 여론조사회사인 (주)위너아이와 함께 AI 빅데이터 분석을 통해 대선 진행과정에서 나타난 각종 이슈의 파장과 민심의 향배를 꾸준히 추적해왔다. 오늘의 대담은 이러한 AI빅데이터 분석을 토대로 황희만 전 MBC부사장의 진행으로 대선 진행 과정과 결과를 심층 분석하고, 아울러 오는 6월1일 치러지는 지방선거의 향배를 짚어보기 위해 마련된 것이다. <편집자>​



6월 1일 지방선거 경기지역은 국민의힘 힘든 선거 될 듯 
윤석열·안철수 후보 단일화 “효과 있었다”

▲ 황희만(이하 황) : 안녕하십니까. 오늘은 20대 대통령 선거 결과를 놓고 민심의 추이가 어떻게 변해왔고, 또 오는 6월 1일 실시되는 지방선거에 어떤 영향을 미칠지를 한성대학교 김상봉 교수와 함께 대담을 나눠보도록 하겠습니다. 먼저, 20대 대선 결과를 한 번 설명해주시겠습니까?

▲ 김상봉(이하 김) : 네. 먼저 대선 투표율을 먼저 보셔야 할 것 같습니다. 사실은 후보자들이 굉장히 관심이 많았던 부분이라고 볼 수가 있죠. 전체 투표율은 77.1%인데 시간대별로 투표율 증가를 보면 처음에 굉장히 빠르게 증가했다가 오후 4시가 지나면서 속도가 상당히 줄기 시작합니다. 사실 사전투표율이 약 37% 정도 됐기 때문에 이전 대선보다 투표율이 많이 높을 것이라고 예상을 했었거든요. 그래서 80%를 넘을 것으로 예상을 했었는데, 오후 늦게부터 투표율이 상당히 많이 떨어져 결과적으로는 77.1%라는 수치가 나왔죠. 사전투표가 왜 이렇게 높았는지는 대부분 코로나19로 인해 본 투표일의 번잡을 피하기 위해 미리투표권을 행사했다는 분석이 지배적입니다.

▲ 황 : 그런 면도 있지만 어떻게 보면 안철수 후보하고, 윤석열 후보가 단일화를 하니까 오히려 저쪽 반대 진영에서 결집을 해서 사전투표율이 높았다는 얘기도 있지요.

▲ 김 : 맞습니다. 보통 사전투표는 민주당 지지층이 일반적으로 많았거든요. 그래서 사전투표율이 높아서 영향을 미치게 되는데. 이번 같은 경우 37%는 지난 대선이나 총선에 비해서도 상당히 높은 수치입니다. 
하단에 있는 표는 이번 대선의 누적 투표율입니다. 여기는 변화율이고요. 누적 투표율을 이렇게 봤을 때도, 누적투표율이 68%까지 빠르게 늘다가 오후 4~5시부터 쭉 낮아졌고요. 
투표율을 전체적으로 봤을 때도 이 빨간 부분이 평균보다 높은 부분입니다. 예를 들어서 서울, 광주, 전남, 전북은 높았고요. 그다음에 세종이라든지 대구, 경북 이쪽도 높았고, 울산도 높았는데, 부산하고, 경남, 그리고 강원, 제주, 그리고 대전 쪽, 충북 쪽, 충남 쪽 같은 경우에는 평균보다 낮았다고 볼 수가 있겠습니다.

▲ 황 : 부산이 왜 이렇게, 투표를 많이 안 한 것 같아요? 뭐 특별한 이유가 있나요?

▲ 김 : 부산하고, 인천 같은 경우 그런데요. 대표적으로 부산 같은 경우에는 당일 확진자 수가 많이 있었습니다. 많이 있었기 때문에 투표를 많이 안 했을 수가 있거든요. 그래서 상대적으로 투표율이 낮았다고 생각이 됩니다. 
밑에 있는 건 시간대별 특징들이고요. 그래서 4시부터 점진적으로 하락했고, 5시부터 2.5%. 그래서 나중에는 말씀하신 대로 부산이라든지 경남, 그리고 이런 지역들에서 투표율이 상대적으로 저조했다라고 보실 수 있겠습니다.

▲ 황 : 그러니까 보면 사전투표에서는 여당에서 결집을 해서 많이 나왔기 때문에 이쪽 보수 진영에서는 당일 날 많이 갈 거라는 희망을 했었는데 오후에 가서 이게 안 됐거든요? 그 이유는 확진자가 많이 늘었다는 것, 이걸로 볼 수 있습니까?

▲ 김 : 확진자하고, 자가 격리투표자 정도로 보시면 될 것 같습니다. 확진자 투표가 5시 반부터 대기할 수 있다고 했기 때문에 투표는 그 이전에 다 끝나야 한다 해서…. 
▲ 황 :  그런가요.
▲ 김 : 이제 두 번째는 개표 결과인데요. 개표 결과 이것을 먼저 간단히 보시겠습니다. 사실 홈페이지 같은데 더 정리가 잘 돼 있는데요. 비교를 위해서 제가 개표 결과를 갖고 왔습니다. 
20대 대선 개표 결과를 보시면 서울이 투표율도 상대적으로 높았고. 그다음에 윤석열 후보가 절반 이상을 얻었습니다. 전체 약 4,400만 유권자 중에서 투표자 수는 3,400만 정도 되는데 0.8% 정도 차이밖에 안 났거든요. 
 여기에 이제 시간대별로 정리는 안 돼 있지만 제일 처음에 사전투표를 먼저 투표함을 열었고, 그다음에 본투표 열고, 관외 사전투표 열고, 마지막에 이제 확진자 또는 자가격리자 투표를 열었을 것으로 생각이 됩니다. 그래서 초반에 투표율이 낮았다가 시간이 가면서 투표율이 굉장히 높아지는 상황에서는 계속 두 후보가 붙는 상황이 계속 왔었죠.
그래서 보시면 서울은 윤석열 후보가 절반을 넘겼고요. 그다음에 충남, 대전, 부산, 경남, 울산, 대구. 이 빨간색으로 칠해져 있는 이 부분들은 대부분 높았습니다. 
그러면 예전에는 어땠느냐? 19대 대통령 선거하고는 비교하기는 좀 어려울 것 같아요. 왜냐하면 그때 당시에 야당이 나눠져 있었거든요. 나눠져 있었기 때문에 비교는 어려울 것 같고요. 다만 이제 18대 대선하고 비교를 해보면 그림이 약간 차이가 납니다. 전북하고 전남 쪽 같은 경우엔 비슷합니다. 서울은 이번에 윤석열 후보가 앞섰고, 당시에는 문재인 후보가 앞섰습니다. 그림을 보시면 지금 박근혜 후보가 우세인 지역하고 그다음에 윤석열 후보가 우세인 지역이 약간 다를 수가 있습니다. 지금 특히 경기 쪽이 그런 상황인데요. 인구로 따졌을 때 서울보다 경기가 훨씬 많습니다. 
그래서 6월 1일 지방선거가 있는데 그때 이 경기 쪽은 국민의힘 쪽에서 굉장히 힘든 선거를 하지 않을까 이런 예상이 됩니다. 

▲ 황 : 그렇죠.

▲ 김 : 그리고 이제, 나머지 지역들 보면 대구, 경북, 경남 같은 경우에는 윤석열 후보가 앞섰고요. 강원도 마찬가지입니다. 충북 그 다음에 충남도 마찬가지. 근데 세종 같은 경우에는 지금 이재명 후보가 앞선 것으로 보입니다. 

▲ 황 : 대체로 동서로 갈리는 것 같아요. 근데 수도권을 이제 어느 편에서 가져가느냐. 이게 이제 승패를 좌우하겠죠.

▲ 김 : 표 차이가 상당히 많이 있었는데요. 이것은 선관위에 있는 숫자들입니다. 지역별로 빨간색으로 되어있는 부분들이 윤석열 후보가 높았던 부분이고요. 서울 같은 경우에는 이번에 보궐선거가 일부 있었어요.

▲ 황 : 네, 서초, 종로 두 곳이었지요.

▲ 김 : 종로 같은 경우에 보궐선거 투표율, 득표율하고 보시면 대선과 거의 비슷한데 서초는 조금 더, 보궐선거에 나오신 분이 70%가 넘었기 때문에 좀 더 높았고, 종로 같은 경우 거의 비슷한 숫자가 나왔다라고 보실 수 있겠습니다.
초반에는 이 두 개. 세 개 구 정도가 굉장히 대선 개표가 늦었어요. 늦어서 나중에 상당히 늦게 개표가 돼서 표 차이가 많이 줄었는데요. 마포 같은 경우에도, 또는 종로 같은 경우에도 초반에는 이재명 후보가 상당히 앞서 있었습니다. 그래서 그림이 그때 당시에 한강을 중심으로 해서 위아래로 이렇게 나눠져 있었거든요. 근데 시간이 흐르면서 이게 더 안쪽으로. 강북 쪽으로도 윤석열 후보의 득표율이 점점 더 높아지는 것을 확인할 수 있었습니다.

▲ 황 : 6월로 유추해 보면, 6월 지방선거에서 각 구청장 선거에서 약간 붉은색 계통은 국민의힘이 좀 더 차지할 확률이 있고, 파란색 부분은 민주당이 차지할 확률이 더 높다 이렇게 미리 예측해도 되겠네요?

▲ 김 : 네. 구청장 선거에서는 그럴 수 있죠.
근데 다만 이게 표 차이가 그렇게 많이 안 납니다. 보면 49.3%, 49.5% 이렇기 때문에 구청장 후보 같은 경우에는 굉장히 긴장을 많이 하셔야 될 수도 있을 것 같습니다. 용산이나 서초, 강남 같은, 또는 송파 이런 지역들은 여당이 된 국민의힘이 조금 더 상대적으로 쉽게 선거를 할 수 있는 반면에 나머지 지역은 거의 50%에서 왔다 갔다 하고 있기 때문에 상당히 어려울 것으로 예측이 됩니다.

▲ 황 : 그래도 어쨌든 지금은 민주당이 한 곳인가 두 곳 빼고 다 갖고 있는데 다음 6월 선거에서는 그렇게 되지는 않겠죠. 어느 정도 잃겠죠. 

▲ 김 : 그럴 것 같습니다. 구청장 선거에서는 상당히 많이 이번에 바뀔 수 있을 것 같다는 예상이 되고 있습니다. 사실은 여기에 좀 더 설명이 잘 돼 있는 부분들이 이런 부분들입니다. 이건 구 표시가 따로 없습니다만 전체적으로 보시면 비슷하죠. 아까 서울에 이런 그림들이 나와 있는데요. 그래서 강남 쪽은 특히 이 빨간, 아주 진한 색 빨간색 이쪽은 윤석열 후보가 상당히 높았고, 득표수도 많았다고 할 수 있겠습니다. 

▲ 황 : 다음으로 어떤 것을 눈여겨보아야 하지요?

▲ 김 : 앞서 투표율을 보셨고요, 또 개표 결과를 보셨는데요. 이제 세 번째로 어떤 이슈가 있었는지에 대해서 또 한 번 보실 필요가 있으실 것 같아요. 시간에 따라서 굉장히 많은 이슈가 있었습니다. 사실 여기에 저희가 정리를 못 했는데요. 이재명 후보의 경우 대장동 이슈는 이미 이전에 있었기 때문에 저희가 정리를 따로 하지는 않았습니다. 그래서 2021년 10월 10일에 민주당 후보가 선출이 됐고, 그 다음에 경제성과 발언된 부분들이 12월 달에 있었고, 12월 16일에는 아들 불법 도박하고 관련된 부분들이 있었고, 그다음에 현직 언론인 영입한 부분들이 있었고요. 1월 28일에는 이제 후보의 배우자였죠. 배우자가 공무원을 불법으로, 또 위법으로 심부름시킨 내용이 터졌지요.

▲ 황 : 법인 카드 사용문제였지요.

▲ 김 : 법인 카드 사용한 것부터 이슈가 됐었고. 20일에 TV토론이 있었습니다. 24일 우크라이나 전쟁 발언이 있었고, 25일 날 TV토론 정치 부분이 있었고요. 3월 1일 날 단일화가 있었습니다. 그리고 3월 2일 날 토론이 있었고, 마지막 토론이 있었죠. 토론이 총 세 번 정도 있었고요. 

▲ 황 : 법정은 세 번이었지만, 언론협회하고 방송사 주최가 더 있어서 다섯 번 정도 했지요.

▲ 김 : 네. 두 번 정도 더 있었는데 사람들이 많이 본 토론이 이 세 개 정도가 시청률이 상당히 높았죠. 이걸 설명 드리는 이유는 나중에 여론조사 추이 같은 것들을 볼 때 이런 부분들이 있었다는 것을 보기 위해서 지금 설명을 드리고 있습니다.
윤석율 후보 같은 경우에는 후보 경선 결과가 조금 늦었어요. 한 2개월 정도 더 늦었거든요. 11월 달에 후보가 됐고요. 그다음에 11월 29일부터 12월 3일까지 이준석 대표가 당무를 거부한 일이 있었고요. 그다음에 12월 21일 이준석 상임선대위원장이 사퇴를 했고, 올해 들어와서 김종인 당시 선대위원장이 사의를 표명을 했고. 올해 1월 11일 날 북한 선제타격 논란이 있었고. 1월 12일에 녹취록 파문이 있었죠. 사실 이게 상당히 컸었거든요. 그다음에 사드 배치하고 관련된 부분. 그 다음부터는 이슈가 별로 없었어요. 한 달 정도.

▲ 황 : 이슈라기보다도 이번 선거 보면 거대 담론이 없고 네거티브만 이슈로 나왔지. 진짜 제대로 된 대선전이었나. 이게 상당이 회의할 정도로 좋지 않은 선례가 됐어요.

▲ 김 : 맞습니다. 유권자들의 대부분이 비슷한 생각이신 것 같아요. 그러니까 비호감 선거,  이쪽도 싫고, 저쪽도 싫지만 그나마 덜 싫은 쪽을 뽑는. 이런 선거가 돼서 거의 반반의 투표가 나왔다고 볼 수 있을 것 같습니다.
마지막에 3월 3일 윤석열 후보와 안철수 후보의 단일화가 상당히 컸다고 저희는 보고 있습니다. 단일화 하지 않았으면 굉장히 선거가 위험했을 것 같아요, 국민의힘 입장에서는.

▲ 황 : 역으로 민주당에도 결집하는 효과를 주지 않았을까요?

▲ 김 : 일부 데이터가 이동하는 현상이 보입니다. 보이는데 그건 조금 이따가 다시 한 번 보여드리겠습니다. 
지금 이 자료가 ‘위너아이’라는 회사에서 매주 빅데이터하고 AI를 활용해서 데이터를 내고 있는데요. 빅데이터가 왜 필요하냐 그러면 다 아시다시피 여론조사 응답률이 높지가 않습니다. 그다음에 변화나 예측도 쉽지가 않습니다. 그리고 하루나 이틀 정도 걸리기 때문에 그 전 주 데이터를 보고 있는 것이거든요. 그런데 많은 분들이 구글이나 네이버 트렌드를 많이 보시죠. 많이 보시는 부분들도 있는데 그게 꼭 맞지는 않습니다. 왜냐면 조금 이따 나오겠지만 상대방의 이름을 검색할 수도 있기 때문에 그렇습니다. 
중앙선관위에 등록된 여론조사 회사는 80개가 넘습니다. 그중에서 실제로 움직이는 회사가 그렇게 많지가 않고요. 
그래서 실제로 여기 이게 3월 5일대까지의 통계인데요. 검색을 보시면 왼쪽이 네이버 검색이고요, 오른쪽이 이제 구글 검색입니다. 그래서 보시면 안철수 후보가 중간에 단일화 때거든요. 단일화 때 굉장히 올랐다가 이후에 다시 떨어지는 걸 볼 수가 있고요. 3월 5일은 데이터가 이때 당시에 없었어요. 여기까지 보시는 게 맞습니다. 이재명 후보가 구글에서는 마지막에 더 높았었죠. 그래서 페이스북이나 이쪽에서는 이재명 후보가 많은 득표를 할 것이다는 얘기가 상당히 많았어요. 그런데 네이버를 보면 지금 윤석열 후보가 더 높거든요.

지금 이제 핵심어 분석인데요. 많은 언론 매체에서 이 핵심어 분석을 굉장히 많이 합니다. 많이 하는데 이때 당시에 지금 윤석열 후보의 핵심어인데요. 대통령이라는 부분. 후보라는 부분. 민주당이라는 부분. 이 부분이 굉장히 크게 나타나죠. 그 다음에 단일화가 있었기 때문에 안철수 후보의 비중도 꽤 나타납니다. 그런데 지금은 이제 2월 28일부터 3월 6일 밤. 자정까지이기 때문에 그 이전에는 예를 들어서 후보 부인하고 관련된 일이나 이런 일들이 중간에 계속 이름들이 들어옵니다. 
토픽 분석인데요. 토픽 분석도 밑에 보시면 안철수 후보가 예를 들어서 빈도수가, 윤석열 후보를 찾으면 안철수 후보의 빈도수도 굉장히 많은 빈도를 차지하게 됩니다. 

이게 아까 비호감이라고 말씀을 드렸는데 여기서 보면 대부분 알 수가 있습니다. 이게 긍정이 빨리 늘어나지는 않고, 줄어들지도 않아요. 뒤에 다른 후보들도 보시겠지만 대부분 부정이 더 높습니다. 그러면 이게 긍정이 높았던 적이 있냐고 물어보실 수 있겠지만, 지난해 4.7총선 같은 경우에는 일부 후보들이 긍정이 70%까지 갔었거든요. 그래서 감성어를 추출한 걸 보면 보통 이제 이런 것들은 후보들이 이런 단어를 많이 사용해라 라는 겁니다. 예를 들어서 혁신한다든지, 승리한다든지. 대신에 매우 부정인 부분들은 쓰지 말라는 것이거든요. 범죄라는 단어를 쓰지 말고, 걱정이라는 단어를 쓰지 말고, 장애라는 단어를 쓰지 말고. 이런 단어는 써서 실패할 확률이 높은 단어들입니다. 

이제 여론조사인데요. 전체 여론조사를 저희가 조사를 한 것은 아니고요. 아까 말한 80개가 넘는 여론조사회사 중에서 반복적으로 조사하는 회사가 몇 개 있습니다. 그 회사를 가지고 저희가 조사를 했는데. 1월 달부터 쭉 봤을 때 최근에, 도표에서 위로 올라올수록 최근이거든요 조사기간이. 3월 2일 이후에는 깜깜이 기간이었기 때문에 그 이후에는 데이터가 지금 없습니다. 
보시면 윤석열 후보가 어떤 조사에서는 낮았다가 어떤 조사에서는 높은 게 보이더라도 최근으로 올수록 점점 더 높아지는 게 보일 겁니다. 37%, 39%, 45%, 43%. 보이고. 평균적으로 봤을 때도 1월달 평균이 36.9%. 2월이 41%. 3월이 거의 43%까지 나왔거든요. 이재명 후보는 3월 달에 한 40%가 조금 안 됐습니다. 이 얘기는 2.7%p 정도 격차가 있다는 것입니다. 이 격차 차이도 점점 더 커졌다는 것이죠. 그래서 여론조사 회사들의 대부분이 예측조사 마지막에 할 때 약 3%부터 7% 정도까지 우세로 보았던 것 같아요. 

▲ 황 : 윤석열 후보 얘기지요.

▲ 김 : 앞선다는 얘기들이 굉장히 많이 있었습니다. 그래서 이준석 대표도 6~8% 앞선다 이런 얘기를 했죠. 이게 시간이 가면 점점 벌어지기 때문에 그랬던 것 같습니다. 
연령대별입니다. 연령대별, 성별, 지역별인데. 사실 이번 선거 결과하고 거의 비슷하죠. 연령대하고 성별 데이터는 없지만, 지역별로 보면 서울 앞서고 있었고요. 강원. 경기, 인천은 약간 지고 있었어요. 이번에 결과도 비슷하지만. 그다음에 대구, 경북에서 앞서고 있었고요. 그래서 윤석열 후보 같은 경우에는 20대, 그리고 60대 이상에서 인기가 상당히 많았습니다. 안철수 같은 경우에는 10대하고 20대에서 상당히 인기가 많았어요. 
그래서 3월 초에 단일화를 하면서 사실은 이 효과가 일부 있었다고 보여지는 데 나중에 뒤에 계산한 부분들이 나옵니다. 
이건 이제 빅데이터 결과인데요. 여론조사 기간에 뉴스가 나오면 그 뉴스에 나와 있는 모든 글들을 다 모읍니다. 밑에 댓글들을 다 모아서 했을 때도 당시에 한 6% 정도 윤석열 후보가 앞서고 있었다라는 것이고요. 
아까 ‘긍정적인 후보가 없다’고 말씀을 드렸는데. 이 조사를 작년 11월부터 했는데 계속 부정적인 게 50%가 다 넘어가 있는 상황이거든요. 그래서 최선의 선택을 하지 않은 지금 상황이 된 거죠. 이 부분은 이제 여론조사 했던 회사들이 이제 댓글들을 보고 두 명으로 나눠서 보기도 하고, 양자 대결, 삼자 대결, 다자대결도 이렇게 볼 수 있는 부분인데 대부분 윤석열 후보가 다 높았다고 보여집니다.

여기 있는 부분들은 마지막에 두 개로 나눴습니다. 저희가 계산할 때. 물론 이게 다 빅데이터입니다. AI하고 빅데이터가 섞여 있고요. 무당층을 포함하는 경우. 예를 들어서 이 사람의 글이나 생각을 보고 여당인지 야당인지 또는 이재명 후보 지지자인지, 윤석열 후보 지지자인지, 안철수 후보 지지자인지 모르는 케이스들이 있습니다. 그걸 제외했을 때 3월 첫 주에 지지율이 이재명 후보가 한 25.4%. 굉장히 낮죠. 이게 무당층이 있어서 그렇습니다. 그다음에 윤석열 후보가 28.9%인데 언제 역전이 됐냐면 2월 마지막 주부터 역전이 됐습니다.

 계속 엎치락뒤치락하고 있다가 2월 마지막 주에 역전이 됐고, 아까 말씀드린 대로 윤석열 후보는 이때부터 거의 이슈가 없었어요. 이슈라는 게 이제 네거티브 할 만한 게 거의 없이 왔고, 이재명 후보는 이 사이에 계속 일들이 있었거든요. 그래서 3월 첫 주 같은 경우에는 생각보다 그 전 주 하고 비슷했는데 많이 올랐어요. 이 많이 오른 게 단일화 효과가 일부 있었을 것이다. 실제로 그래서 안철수 후보를 뺐죠. 빼고 보면 한 6% 가까이 차이가 나는 것을 보실 수가 있을 겁니다.
 그래서 이때 당시에 3월 첫 주에는 후보 단일화 효과가 윤석열 후보한테 3 정도 가고 이재명 후보한테 1정도 이동하는 것. 그래서 100표가 흩어지면 3/4은 윤석열 후보로 가고, 1/4은 이재명 후보로 가는 이런 효과가 있었습니다. 아까 말씀드린 대로 단일화 효과가 얼마냐 그랬을 때는 약 3:1의 효과가 있을 수 있었다 이렇게 봅니다.

그다음에 무당층이 없이 계산했을 때입니다. 없이 계산했을 때 보시면, 여기 지금 안철수 후보가 단일화하기 전과 후를 비교하기 위해서 지금 있는 것이고요. 2월에 보시면 무당층이 없을 때는 계속 지금 1월 5주 이후로 계속 윤석열 후보가 높았습니다. 

그러니까 투표하실만한 분들만 대상으로 한 거죠. 그랬을 때도 약 4.7% 정도 많이 벌어졌습니다. 3월 초에. 그다음에 보시면 없습니다. 안철수 후보가 없는데요. 안철수 후보가 없을 때는 약 7:6의 비율로 이동하는 걸 보실 수 있습니다. 약 6% 정도면 어떻게 보면 이미 오차범위를 벗어나고 있는 것이거든요. 
당의 조기경보시스템인데 30분마다 한 번씩 업데이트됩니다. 국민의힘은 이 노란 선 안에서 위로 가는 건 상관이 없습니다. 거의 안정적으로 가고 있었고, 더불어민주당은 3월 6일 이후에 조금씩 떨어지고 있는 게 눈에 보이죠. 이건 이제 예측 부분이고요.

▲ 황 : 이게 그니까 빅데이터 분석이다 이거죠?
▲ 김 : 네. 빅데이터 분석이었고. 국민의힘 대표는 6~8% 또는 10% 정도 차이가 난다고 얘기하고, 야당 같은 경우에는 약간 지고 있다는 얘기가 이런 데서 나오는 것이죠. 특히 이 여론조사하고, 빅데이터 AI 쪽에서 나오게 되는 겁니다. 

▲ 황 : 그런데 결과는 굉장히 박빙이었어요. 
▲ 김 : 예, 맞습니다. 예상외로 사실은 출구조사를 봤을 때는 어느 정도 파악이 돼야 하거든요. 그런데 출구조사조차도 달랐습니다. 방송 3사가 봤던 출구조사의 경우에는 국민의힘이 앞서고 있었고, 그다음에 JTBC가 봤을 때는 민주당이 앞서고 있었거든요. 이유가 한쪽은 그날 투표만 본 것이고, 한쪽은 사전투표를 위주로 본 데 있을 것 같습니다. 그래서 예상보다 민주당이 선전을 했다는 얘기가 나오지요.

▲ 황 : 엄청 선전한 거죠. 이번 대통령 선거 결과를 놓고 볼 때 그런 투표 현황이 다음 6월 지방선거까지 이어진다고 가정을 한다면 상당히 이번 분석 자료가 도움이 되겠네요?
▲ 김 : 네. 도움이 상당히 될 것 같고요. 여론조사도 중요하지만, AI 빅데이터를 활용한 것도 상당히 중요할 것 같고, 특히 경합 지역들. 경합 지역들에 중요한 역할들을 할 수 있는 부분들이 생길 것 같습니다.

▲ 황 : 네, 이 자료를 잘 활용하면 다음 선거 준비하는 사람들이 도움이 되겠네요. 여러 가지 말씀 감사합니다.
<ifsPOST>​
5
  • 기사입력 2022년03월14일 01시52분
  • 최종수정 2022년03월14일 11시21분

댓글목록

등록된 댓글이 없습니다.