1장 국제무역 데이터의 특징

1장 국제무역 데이터의 특징#

출처: UNCTAD (2012), A Practical Guide to Trade Policy Analysis, Chapter 1.

1. 국제무역 데이터#

집계 무역 데이터#

국제통화기금(IMF)의 Direction of Trade Statistics(DOTS)는 집계된(aggregated) 양자간 무역 데이터의 주요 출처다(한 국가의 집계된 양자간 수출이란 한 해 동안 어느 한 교역상대국에게 수출한 모든 제품의 합계를 의미한다).

세분화된 무역 및 생산 데이터#

무역 분류 체계#

상품(“세분화된”)별 무역 데이터를 다룰 때, 가장 먼저 고려해야 하는 문제는 해당 데이터에 사용된 분류법(nomenclature)이 무엇인지 결정하는 것이다. 여러 무역 분류 체계가 존재하며, 일부는 행정적(administrative) 필요에 기반하고 있고 다른 일부는 경제적 의미를 갖도록 설계되었다.

“행정적” 분류법 중 가장 우선하는 것은 HS(Harmonized System)로, 세계관세기구(WCO)의 모든 회원국이 그들의 무역 데이터를 이에 입각해 UNCTAD에 보고한다. 관세율표와 원산지규정 체계 역시 HS로 표현된다. 2022년 1월에 마지막으로 개정된 이 체계는 네 가지 조화된 수준을 가지며, 집계 정도가 낮아짐(세분화가 증가함)에 따라 section(21개 라인), chapter(97개 라인; chapter 코드는 두 자리이므로 “HS 2”라고도 불린다), heading(HS 4; 1,224개 라인), subheading(HS 6; 5,387개 라인, 다양한 특수 범주 포함)으로 나뉜다. 우리말로는 부(section), 류(chapter), 호(heading), 소호(subheading)로 부른다.

HS 6 이상의 수준(HS 8 및 10)은 통일되어 있지 않으므로, 제품 범주의 설명과 그 수가 국가마다 다르다. 이들은 UNCTAD에 보고되지 않으며, 회원국의 관세청이나 통계청에서 직접 얻어야 한다.

HS 체계의 단점 중 하나는, 본래 경제적으로 의미 있는 무역 통계를 만들기보다는 관세 징수를 위해 설계되었다는 점이다. 따라서 섬유 및 의류와 같은 전통적인 제품(Section XI)이 기계, 차량 및 기구와 같은 신제품에 비해 서브헤딩 수 측면에서 과대 대표되어 있다. 화학제품(VI)과 기본 금속(XV)도 마찬가지다. 반대로 기계(XVI), 차량(XVII), 기구(XVIII)는 HS 서브헤딩에 비해 세계 수출에서 훨씬 더 큰 비중을 차지하고 있다.

무역 데이터는 때때로 SITC(Standard International Trade Classification: 국제표준무역분류)를 사용하여 분류되기도 한다. 유엔이 2006년 3월 회의에서 채택한 SITC Rev. 4는 그 전신들처럼 다섯 가지 수준을 가지고 있다. section(1자리, 10개 라인), division(2자리, 67개 라인), group(3자리, 262개 라인), subgroup(4자리, 1,023개 라인), basic heading(5자리, 2,970개 라인) 등이다.

생산 분류 체계#

HS에서 SITC 분류법으로 전환하는 것은 어렵지 않다. 전환표를 사용함으로써 제한적인 정보 손실만 수반된다. 그러나 무역 분류법에서 생산 분류법으로 전환하는 것은 훨씬 더 어려운데, 이는 생산 분류법이 국가 간에 전혀 통일되어 있지 않거나 혹은 불완전하게 조화되어 있기 때문이다.

생산 분류법 중에서, 최근까지 가장 널리 사용되었던 것은 SIC(Standard Industrial Classification: 표준산업분류)이다. 상품을 가장 높은 집계 수준에서는 A부터 Q까지의 범주로, 가장 낮은 수준에서는 4자리 코드로 분류한다. SIC와 매우 밀접한 ISIC Rev. 4는 2008년에 유엔에 의해 발표되었다. 다만, 그 주된 단점은 제조업에 초점을 맞추다보니 서비스 활동의 집계 수준이 너무 높다는 것이다. 이 문제를 해결하기 위해 모든 경제 활동을 포괄하는 유엔의 CPC(Central Product Classification: 중앙제품분류)가 1990년에 만들어졌다. 유럽연합(EU)은 1993년에 CPC와 유사한 분류법인 CPA(Classification of Products by Activity: 활동별제품분류)를 만들었다.

EU의 NACE(Nomenclature des Activités économiques dans la Communauté Européenne: 경제활동분류체계)는 1990년에 EU에 의해 도입되었다. NAICS(North American Industrial Classification System: 북미산업분류체계, 2007년 최종 개정)는 북미자유무역협정(NAFTA) 회원국들이 공동으로 사용하기 위해 1990년대 초에 고안되었다.

이러한 분류법들 간의 전환표는 여러 곳에서 찾아볼 수 있다. 그러나 어느 것도 완벽하지 않으므로, 보통 무역 데이터와 생산 데이터를 일치시키기 위해 한 단계 또는 여러 단계의 집계 수준을 상향 조정해야 한다. 이로 인해 무역과 생산 데이터 모두를 필요로 하는 수입침투율(import-penetration ratio)과 같은 지표는 불행하게도 상당히 집계된 수준에서만 계산될 수 있다.

‘행정적’ 분류법 외에도, 특정 목적을 위해 맞춤 제작된 여러 분류 체계가 고안되었다. 1970년에 도입된 유엔의 BEC(Broad Economic Categories: 광범위경제분류)는 제품을 최종 사용에 따라 네 가지 범주로 분류한다. 자본재(01), 중간재(02), 소비재(03), 기타(04) 등이다.

상품무역 데이터베이스#

상품별 무역에 관한 가장 첫 번째이자 가장 중요한 데이터베이스는 UN Comtrade이다. 1962년 이래 거의 모든 국가에 대해 HS 6 수준까지의 양자 무역 흐름을 포괄한다. 모든 무역 가치는 각국의 통화를 명목환율로 환산한 경상가격 미국 1,000달러 단위로 표시된다. UN Comtrade는 또한 물리적 단위로 거래량을 보고하므로, 적어도 원칙적으로는 각 상품에 대한 단위가치를 계산할 수 있다.

BACI(Base Analytique du Commerce International: 국제무역기초분석) 데이터베이스는 파리에 기반을 둔 연구소인 CEPII(Centre d’Etude Prospectives et d’Informations Internationales)에 의해 UN Comtrade의 수입 및 수출 데이터 간의 불일치를 해소하기 위해 만들어졌다. BACI는 또한 “정제된(cleaned-up)” 단위가치를 제공한다. UN Comtrade와 같이 HS 6 수준이며, 부수적으로 CIF와 FOB 무역 데이터 간의 차이에서 도출된 운임 비용 추정치도 보고한다.

2. 측정 문제#

일반적으로 수출 데이터는 수입 데이터보다 관세 행정 기관에 의해 덜 철저하게 모니터링된다. 따라서 분석 대상이 수출일지라도, 일반적으로 미러링(mirroring)이라 불리는 기법을 통해 상대국의 수입 데이터를 선호해야 한다. 그러나 관세가 높고 관세 모니터링 능력이 약한 국가에서는, 무역업자들이 관세를 피하기 위해 수입 가치를 의도적으로 과소평가하거나 제품을 더 낮은 관세가 적용되는 제품 항목으로 신고하는 경우가 있다. 그 결과, A국은 B국이 A국에 수출한 것으로 신고한 것보다 낮은 가치의 수입액을 보고하게 된다. 이러한 경우에는 미러링을 피해야 한다.

수입 데이터는 보고 오류의 영향도 받는다. 이 데이터들은 국가 기관에 의해 검토과정을 거치지만, 이러한 필터링이 모든 이상치를 제거하지는 않는다. ASYCUDA와 같은 자동화 시스템 하에서는, 데이터가 점점 더 운송회사 직원들에 의해 직접 컴퓨터 시스템에 입력되면서 가끔, 혹은 그 이상 빈번하게 입력 오류가 발생한다. 무역이 육로를 통해 이루어지고, 개발도상국 간에 일부 비공식적으로 진행될 경우, 신뢰성 문제는 더욱 악화된다.

누락값은 특별한 문제를 야기한다. 첫째, 국가 관세당국은 무역이 0인 항목을 0의 값으로 보고하기보다는 누락시키는 경우가 매우 많아 이를 쉽게 간과할 수 있다. 둘째, 실제 제로무역인지, 미보고 무역인지 또는 입력 오류인지를 구별하기가 일반적으로 어렵다. 때때로 누락된 데이터는 IMF DOTS가 하는 것처럼 미러링을 통해 보완될 수 있다. 때때로 데이터의 성격이 제로무역보다는 입력 오류를 시사하기도 하는데, 예를 들어 여러 해 동안 규칙적인 무역 흐름이 관찰되다가 중간에 0이 나타나는 경우이다. 이 경우에는 이전 값과 다음 값의 평균을 취하는 보간(interpolation)이 타당하다. 그러나 높은 수준의 세분화된 무역 데이터는 일반적으로 변동성이 크기 때문에 보간은 위험할 수 있다. 기본적으로 누락값을 어떻게 처리할 것인가는 사례별로 판단을 내려야 한다.

앞서 언급했듯이, UN Comtrade는 무역 가치뿐만 아니라 거래량도 제공한다. 그러나 거래량은 거의 사용되지 않는다. 첫째, 거래량은 합산할 수 없다(예를 들어 감자 톤수와 당근 톤수를 합산할 수 없다). 둘째, 거래량은 수출과 마찬가지로 관세 부과 대상이 아니기 때문에 관세당국에서 제대로 모니터링하지 않는다. 그렇다 하더라도, 때때로 연구자는 가격 또는 단위가치(unit values)를 계산하는 데 관심을 가지는데, 이를 위해서는 가치를 거래량으로 나누어야 한다. 그러나 그 결과는 두 가지 이유로 해석하기 어려운 경우가 많다.

첫째, 무역 카테고리가 여러 종류의 상품을 포함하게 되면(품질이 다른 유사 상품들이 함께 묶이는 경우 등) 단위가치는 이른바 구성 문제(composition problem)의 영향을 받게 된다. 즉, 관측되는 것은 특정 상품의 가격이 아니라 여러 (관측되지 않는) 하위 상품들의 평균 가격이 된다. 카테고리가 넓을수록 “구성 문제”는 악화된다. 둘째, 거래량의 측정 오류가 분모로 들어가기 때문에, 이것이 극도로 비선형적인 효과를 가져올 수 있다. 예를 들어, 매우 작은 거래량이 시스템에 잘못 입력되면, 단위가치는 무역 가치와 거래량의 비율이므로 그 값이 매우 커져 이후 계산에 심각한 편향을 초래할 것이다. 카테고리가 좁을수록 거래량이 작을 가능성이 높으므로 이러한 문제에 취약하다.

구성 문제와 소규모 거래량 문제 사이에서 균형을 맞출 필요가 있으며, 완벽한 해결책은 없다. 따라서 단위가치를 기반으로 한 계산이나 통계는 데이터 내의 이상치를 매우 신중하게 걸러내는 것으로 시작되어야 한다. 앞서 언급했듯이, CEPII의 BACI 데이터베이스는 이상치 처리를 반영한 단위가치를 제공한다.