제158호
권 소 영
(연세대학교 통일연구원 전문연구원)
북한 연구 방법론과 인공지능을 통한 지식의 체계화
그동안 북한 연구는 인식론적 제약과 자료수집의 어려움에도 불구하고 꾸준히 이어져 왔다. 북한 연구 방법도 전체주의 접근법이나 내재적 접근법을 넘어 다양한 방법론을 도입하면서 점차 전문화·세분화되어가고 있다. 글로벌 시대가 도래하면서 북한의 특수성을 인정하는 내재적 접근보다 인류 보편가치에 기반한 외재적 접근 또는 지역학적 연구가 부각되기도 하였고, 최근에는 과학적이고 체계적이며 일관성 있는 연구를 추구하는 분석기법 등이 활용되고 있다. 이러한 노력에도 불구하고 북한 사회와 체제에 대한 이해는 여전히 부족한 상황이다. 통일 준비가 국가적 화두로 부상하면서 북한의 현 상황을 파악할 수 있는 객관적인 지표 및 자료에 대한 수요도 증가하고 있지만 북한 관련 연구는 주관적이고 규범적인 연구들이 대부분 차지해 왔다. 북한 체제의 폐쇄성으로 인한 정보 접근에 제약이 있고, 북한 매체의 성격상 객관적인 자료로 이를 이용하는 데 한계가 있기 때문이다. 계량적 연구도 북한에서 공식적으로 발표되는 신문, 방송 등 1차 자료에 대한 연구자의 해석에 의존해 왔으며 2000년대 들어 북한의 현실을 이해하기 위해 북한이탈주민 인터뷰 또는 설문조사 등의 기법이 활용되고 있으나 표본의 대표성 문제와 검증 수단 부족으로 한계가 분명하다. 북한 사회와 체제에 대한 이해 부족은 국내 언론 보도 등에서도 적나라하게 드러나고 있다. 고위 관료에 대한 추측성 보도가 난무하다 오보인 것으로 드러나는 경우도 종종 있어 한국 언론 보도의 신뢰성도 떨어지고 있다. 실제로 숙청당한 후 한국 언론 보도의 신뢰성을 떨어뜨리기 위해 복귀시킨 것인지 오보인지조차 확인할 길이 없으나 좀 더 객관적이고 계량적인 근거가 있다면 종합적인 판단을 내릴 수 있었을 것이다.
북한에 대한 체계적 지식의 부재는 이해 당사국들이 최대한‘합리적’인 정책 결정을 내리는 데 큰 걸림돌이 되고 있다. 또 국내 정치적으로도 체계적이고 객관적 정보가 부족하다 보니 북한 관련 사안은 진영논리에 갇혀 남남갈등이 증폭되고 있다. 따라서 북한 관련 지식의 체계화와 객관적 분석을 통해 정책적 함의를 도출하는 계량적 연구방법론의 도입이 필요하다. 그중 하나가 인공지능과 데이터 사이언스 기법을 접목한 ‘디지털 북한학’이다. 북한 사회와 체제에 대한 이해를 확대하는 목적으로 인공지능 및 데이터 사이언스 기술을 활용하여 북한의 신문과 방송의 보도를 분석하고 북한 사회에 대한 객관적 지표를 만들어 내는 한편, 이를 기반으로 검색할 수 있는 엔진을 구축하여 다른 북한 관련 데이터와의 연계 분석을 시도하고 궁극적으로 북한 데이터 생태계 구축을 하는 것을 목표로 하고 있다. 객관적 데이터가 부족한 북한 관련 연구에서 북한의 언론보도는 데이터로서 중요한 가치를 가진다. 특히 최근 사회과학 분야에서 빅데이터와 데이터 사이언스의 활용이 폭발적으로 증가하면서 언론보도와 같은 비정형 데이터의 활용 가치가 높아졌다. 북한 언론보도는 북한의 현실을 보여주는‘거울'이라기보다는 북한 정권이 세계를 향해 보내는 메시지로 간주할 수 있다. 따라서 이를 북한의 상황적 요인들과 연계하여 분석함으로써 북한의 내부 상황에 대한 이해를 높일 수 있을 것이며 이런 맥락에서 북한 언론의 보도를 다른 하드 데이터와 상호보완적으로 활용함으로써 북한의 현실을 가늠하는 중요한 데이터적 가치를 창출하는 방법을 추구하는 것이 바람직하다.
전반적으로 열악한 상황에도 불구하고 최근 실증적 데이터에 기반한 북한 관련 지식의 확대에 매진해 온 해외 정책연구 기관들이 많은 가시적 성과를 내고 있다. 가장 대표적인 사례 중 하나가 미국의 스팀슨 센터(Stimson Center)의 『38노스(38 North)』라 할 수 있다. 『38노스』는 상업 위성의 이미지를 분석하여 북한의 핵 개발 상황에 대한 변화를 유추해 냄으로써 세계 언론의 주목을 받고 있다. 지난 2012년 『38노스』가 위성 사진 분석을 시작한 이래 뉴욕 타임스와 워싱턴 포스터에서 각각 88회와 333회 인용 보도된 것으로 나타났다. 국내 언론에서도 네이버 뉴스 검색 결과 15,490회 언론에서 인용 보도된 것으로 나타났다. 이러한 현상은 데이터를 기반으로 한 분석을 하고 있는 해외 기관들이 제공하는 정보에 대한 수요를 잘 보여준다. 반면 정작 통일의 당사자인 한국은 북한 사회와 체제에 대한 정보 제공 차원에서 해외 기관들에 뒤처지고 있다는 것을 시사한다. 이런 맥락에서 체계적인 북한 관련 지식의 축적을 위해 계량 연구의 확대가 필수적이다. 북한 관련 연구의 영역이 의학, 공학, 도시계획, 경제 등 다양한 분야로 확대되고 있으며 빅데이터 기술의 발달로 기존 북한 연구의 한계를 뛰어넘을 수 있는 환경이 조성된 점도 새로운 기회를 제공한다. 새로운 분석 방법의 도입을 통해 ‘디지털 북한학’과 같이 학제 간 연구의 장과 세계적 연구 교류의 장을 넓혀 나가야 한다.
국내에서도 서울대학교 평화통일연구원 프로젝트로 언론정보학과 한규섭 교수와 필자가 함께 파일럿 연구를 진행한 바 있으며 미국 조지메이슨대학교와 38노스팀과 함께 후속 작업을 위한 협의를 한 적 있다. 미국에서 전문가들과 씽크탱크와의 미팅을 통해 한국이 주도하는 데이터 기반 북한 연구의 필요성에 대해 깊이 생각해 볼 수 있었다. 첫째, 정책 수립을 위한 객관적인 자료를 생산해 냄으로써 한국의 대북정책뿐만 아니라 이해 당사국들과 국제기구의 북한 관련 정책 결정에 한국의 북한 연구들이 영향을 줄 수 있다는 점이다. 이를 통해 한국의 입장이 관련국들의 정책 수립에 충분히 반영될 수 있다. 따라서 이는 개별 연구자의 연구역량에만 맡겨 둘 일이 아니라 국가적인 차원에서 장려되어야 할 사항이다. 한국에서 북한 연구의 강점은 언어적 유사성과 문화 가치적 이해, 그리고 IT 기술력이라 할 수 있다. 한국에는 북한과 같은 언어를 사용하는 수많은 양질의 연구인력이 존재하며 세계적인 IT 강국이기에 이 두 가지 강점을 기반으로 한 ‘디지털 북한학’ 분야를 개척하는 것이 한국이 북한 연구의 세계화를 선도하고 북한 관련 정책연구를 주도할 수 있는 가장 좋은 방법이다. 반면 미국 정부의 정책에 영향을 미치는 북한 관련 담론을 이끌어 나가는 오피니언 리더격의 해외 정책 연구기관들은 이 두 가지 측면에서 취약하다. 미국의 손꼽히는 씽크탱크들에서 주도적으로 활약하는 한국인들의 숫자가 제한적이며 학습데이터 생성 등을 위한 한국어 구사 인력을 확보하기도 어렵다. 또 대게 정책학 또는 국제정치학 전공자들로 구성되어 있어 간단한 통계분석을 넘어서는 첨단 데이터 과학적 분석이나 대용량 데이터 수집 능력이 부재한 경우가 많다. 실제로 『38노스』도 아직은 정성적인 방식으로 위성 사진을 분석하고 있으며 ‘이미지 인식’ 등의 공학적 기술을 접목하지는 못하고 있다. 이러한 언어적 유사성과 IT 기술을 접목하여 정책적 함의와 희소성을 갖춘 데이터를 생성함으로써 해외 씽크탱크들과 차별화된 우리만의 북한 연구 영역을 창출해 낼 수 있을 것으로 기대한다. 북한 관련 사안들에 있어 핵심 이해 당사국인 미국의 대학과 정책연구기관의 교류 확대가 필수적이다. 실제로 북한이 관심을 가지는 대화 대상은 미국 정부의 정책에 영향을 미칠 수 있는 워싱턴의 씽크탱크들이다. 이러한 네트워크를 통해 한국 정부가 북한과의 대화에서 주도적인 역할을 하는 데 도움을 줄 수 있을 것이다.
둘째로는 세계 북한 연구자 및 언론 매체를 위한 데이터 제공이 가능하다는 것이다. 장기적으로는 북한 연구자들에게 유용한 정량적 데이터를 제공하여 사용자의 필요에 따라서 활용할 수 있도록 전 세계 대학 도서관들에 초기 버전의 데이터베이스를 제공을 추진하고 추가적인 연구 개발을 통해 데이터베이스를 확대해 나가 궁극적으로는 실시간 텍스트 및 영상 검색이 가능한 북한 미디어 분석 엔진으로 발전시켜 나갈 수 있다. 이를 통해 북한 연구자들이 자신의 필요에 맞게 데이터를 활용하고 다른 데이터와 결합하여 분석함으로써 체계적인 북한 관련 지식 축적에 이바지할 수 있을 것이다. 이를 통해 한국적 북한 연구의 우수성을 널리 알리고 전 세계 북한 관련 연구를 선도하는 리더로서의 발돋움할 수 있다. 현재 많은 언론이 북한에 대한 객관적 자료 부족으로 추측성 보도가 난무하고 있는데, 전 세계 저널리스트들에게 정기적으로 객관적인 데이터 분석에 기반한 연구 결과로 전 세계 언론사들을 위한 정보 사이트를 구축하고 제공한다면 이를 통해 북한과 관련하여 전 세계 언론들이 과학적 분석에 기반한 객관적 보도를 유도하는 데 이바지할 수 있고 궁극적으로는 독자들의 북한에 대한 이해의 폭을 넓히는데도 이바지할 것으로 기대된다. 그러나 이러한 작업은 공학적인 전문성이 필요하므로 AI 연구소나 공학 대학과의 학제적 연계 또는 산학협력이 없이는 불가능하다.
북한 연구에 있어 방법론적 예외주의와 이론적 고립주의 그리고 이데올로기적 인식론 논쟁을 넘어서기 위해서는 다양한 방법론을 도입해서 북한의 실체를 정확히 이해하는 노력이 필요하다. 한국 학계가 비교우위를 점할 수 있는 북한학 연구 영역을 발굴해 해외 북한 연구를 선도하게 되면 한국 연구자들의 정책적, 학술적 목소리를 키울 수 있고 한국 학자들의 경쟁력을 발휘할 수 있는 연구영역의 확장이 가능해진다. 북한학과 데이터 사이언스의 접목을 기반으로 한 북한 연구에 대한 가능성은 정책 수립을 위한 객관적 자료를 생성하고 학문적인 발전을 넘어 세계적으로 북한 정책연구를 주도할 수 있는 한국에게 주어진 시대적 과제라고 생각한다.
● Issue Brief는 집필자의 견해를 토대로 작성된 것으로 연세대학교 통일연구원의 공식 입장과는 관련이 없습니다.
Comments