빅데이터, 딥러닝, 클라우드, 사물인터넷 등등 데이터시대를 예견하는 용어들이 회자되기 시작한지도 꽤 오래 됐다. 2020년에는 데이터3법이 시행됨으로써 가명처리를 통한 빅데이터 생산 및 활용의 기초가 마련됐고, 2021년 10월 데이터산업법(데이터 산업진흥 및 이용촉진에 관한 기본법)이 제정돼 2022년 4월 20일 시행을 앞두고 있다.

현재도 효율적인 마케팅 또는 생산성 향상이나 시장예측을 위한 통계자료 등 다양한 형태로 데이터를 활용하는 데에 아무런 문제가 없다. 그러나 기존의 데이터 '활용'은 소위 빅데이터를 산업적으로 어떻게 이용할 것인가, 즉 효율적인 의사결정을 위해 일종의 통계자료를 '활용'하는 보조적 수단으로 인식해왔다면, '데이터산업'은 데이터를 단순한 수단이나 보조자료로 인식하는 것에 그치지 않고, 데이터 자체에 경제적 가치를 부여하고 '거래'의 대상으로 삼는다.

그러나 데이터는 민법상 '물건'에 해당하지 않으므로 소유권이 성립할 수 없고, '소유권의 이전'을 요건으로 하는 '매매계약'의 형태로 거래할 수 없다. 따라서 데이터의 거래에는 기존의 법체계와 결이 다른 완전히 새로운 법제도가 뒷받침돼야 한다. 데이터산업법은 이러한 데이터의 생산과 거래를 활성화하고 데이터산업의 발전을 촉진하기 위해 제정된 기본법이다.


데이터안심구역, 누구나 가치 있는 데이터상품을 만들 수 있어

현재도 '가명정보' 개념을 이용해 누구나, 특히 다수의 회원정보를 보유하고 있는 온라인 서비스 사업자가 회원들의 개인정보를 가명처리한 뒤 조합해 유의미한 통계자료를 만들고, 데이터베이스(DB) 등을 데이터상품으로 구성해 돈을 받고 판매할 수 있다.

그러나 여전히 돈을 받고 팔 수 있을 정도의 가치있는 데이터를 생산하는 것은 쉽지 않다. 왜냐하면 값어치가 나가는 데이터는 굉장히 많은 정보를 담고 있거나 또는 나의 데이터와 비교해 유의미한 정보를 산출해 낼 수 있어야 하는데, 민간에서 수집할 수 있는 데이터는 그 양이 한정적인 데다, 가명처리 후 판매하는 경우 구매자가 이를 활용하는 데에 상당한 제약이 생기기 때문이다.

그런데 공공데이터법에 따라 수집, 생산되는 공공데이터는 실로 그 데이터의 양이 방대하다. 민간에서 잘만 활용한다면 가치있는 데이터를 생산, 판매하고 재가공하는 선순환의 데이터 생태계가 형성될 수 있다. 그러나 공공데이터는 '누구에게나' 공개되므로, 누군가에게는 식별가능한 개인정보가 포함될 우려가 있다. 따라서 실제 공공데이터를 민간에 개방할 때에는 원래의 데이터에서 몇 개의 값을 추가적으로 삭제하게 되는데, 그 과정에서 공공데이터의 활용가치는 떨어질 수밖에 없게 된다.

그러나 민간에 개방되지 않은 공공데이터까지도 열람, 분석할 수 있고 유의미한 데이터로 가공, 생산할 수 있게 허락하는 곳이 있다. 바로 '데이터안심구역'이다. 안심구역은 개별적으로 이용신청을 해 선정된 기업(개인)만이 입장하는 방식이다. 안심구역 내부에는 별도의 서버에 가명처리 초기 단계의 미개방 데이터를 저장해 두고, 이용자가 분석할 수 있게 허락한다. 대신 분석 결과물을 외부로 반출할 때에는 다시 개인에 대한 식별가능한 정보가 포함돼 있지 않는지 확인함으로써, 개인정보를 보호하는 동시에 공공데이터의 활용도를 높인다.

데이터산업법 제11조는 이러한 데이터안심구역을 장려한다. 정부가 안심구역을 지정해 운영하고 이용자를 지원하도록 하였고, 특히 미개방데이터 지원을 위해 다른 기관에 추가적인 데이터 제공을 요청할 수 있는 법적 근거도 생겼다. 데이터산업 초기에는 안심구역의 활성화로써 민간에서의 데이터 생산이 활발해지기 시작할 것으로 생각된다.


데이터상품 시장가격은 정부 주도로 형성돼

데이터를 생산했으면 이것을 얼마에 팔아야 할 것인지 문제된다. 데이터 시장이 안착되지 않은 초기에는 구매하는 사람마다 제각각 다른 가격을 부르거나 제대로 된 시장가격이 형성되기 어렵다. 이에 데이터산업법은 정부가 데이터에 대한 객관적인 가치평가가 가능하도록 촉진하고(제14조), 데이터의 품질을 정부가 인정해 주는 제도를 도입한다(제20조). 이에 따라 제대로 된 시장가격이 형성된다면, 민간에서 좀 더 데이터를 판매하기 쉬워질 것이며, 더 많은 데이터상품의 생산과 유통, 재가공의 선순환을 가져올 수 있을 것이다.

데이터를 생산하거나 사고파는 사람들에 대하여 '데이터 사업자'로 신고하도록 해(제16조), 민간의 적극적인 데이터산업 참여를 유도하고 있다. 뿐만 아니라 공정한 유통 환경을 조성하고(제17조), 정부에서 데이터 거래 체계를 구축하도록 규정했다(제18, 19조). 또한 '데이터거래사'를 양성해 시장참여자에게 필요한 서비스를 제공할 수 있도록 하여 산업 활성화를 꾀한다(제23조).


우리는 무엇을 준비해야 하는가

4차산업혁명과 디지털 대전환의 핵심이자 원유라고 불리는 데이터. 이제 어떤 산업에서도 데이터가 없이는 도태되기 십상이다. 데이터산업법의 시행은 곧 시대의 흐름이 이미 거역할 수 없는 제도적 변화에까지 이르게 됐음을 알려주는 신호탄이며, 데이터상품의 기획과 유통은 더 이상 남의 일이 아니게 됐다. 비록 직접 데이터를 생산하지 않더라도, 더 좋은 데이터를 알아보고 확보할 수 있는 안목을 미리 길러둬야 할 것이다.