개인정보보호, 소프트웨어 정책
① 성과에 눈먼 과기정통부, 졸속 빅데이터 플랫폼 사업
데이터산업 육성이란 명분하에 예산 퍼주기식 사업 추진
데이터 없는 빅데이터 플랫폼
■ 과학기술정보통신부는 데이터 산업육성을 위하여 작년 7월 공공과 민간이 협업하여 빅데이터 센터 등에서 수집된 데이터를 플랫폼에서 분석·유통하고 혁신 서비스를 발굴·확산하는 등 데이터 기반의 가치 창출 생태계 조성을 위하여 분야별 플랫폼 구축 사업을 추진하였다.
○ 분야별 10개소와 이와 연계된 기관별 센터 100개소를 구축
○ 2019년 사업 규모는 640억원*으로, 3년간 총 1,516억원을 투입 계획
○ 1차년도(2019년) 1,400여종의 21년까지 5,100여종의 데이터 구축
* 플랫폼(240억=24억×10개소), 센터(400억=4억×100개소)
■ 해당사업은 작년 12월까지 데이터 구축이 완료되었어야 하나 대부분의 플랫폼이 금년1월부터 2월에 적재되었으며, 특히 교통과 금융 플랫폼은 금년 2월에 데이터가 적재된 것으로 나타났다. 상기 사업은 국가계약법에 따라 추진되는 사업으로 사업기간 내에 사업을 종료하지 못하면 계약 미 이행에 따른 조치를 하여야 하나 과학기술정보통신부는 이러한 사업 추진에 아무런 문제가 없다는 입장이다.
■ 그리고 사업추진 내용에는 표준 플랫폼(플랫폼표준: CKAN, 데이터구조표준: DCAT)을 적용하도록 하고 있으나, 구축된 대부분의 플랫폼 포털이 유통하려는 데이터셋 정보에 대한 이용자의 접근성 및 시인성이 CKAN 표준을 준용한 영국의 데이터 포털(data.go.uk)나 행정안전부의 공공데이터포털(data.go.kr)보다 현저히 떨어져 표준 플랫폼을 도입한 효과가 없는 것으로 나타나고 있다.
(*) 데이터셋 정보에 대한 시인성 및 접근성은 본 단체의 자체 평가임
■ 빅데이터 플랫폼은 분석에 원재료로 사용할 수 있는 원시 데이터를 수집하여 하나, 플랫폼에 적재된 데이터셋은 단순 정보성 데이터 또는 데이터를 가공 처리한 정보들이 대부분이라 분석을 목적으로 하는 수요자가 대가를 지불하며 구매할 수준의 데이터인지도 의문이 든다.
○ 원시(raw)데이터가 아닌 상당수의 데이터는 정보의 의미를 희석시킨 단순집계 데이터이다. 집계 데이터는 분석을 하는데 있어 보조 데이터이다.
< 데이터와 정보 >
구분 | 설명 | 활용 |
데이터 | 데이터는 개별사건(event)의 발생을 기록한 데이터를 칭한다. 예를 들면 고객의 주문이나 금융 거래(입금, 출금)의 기록을 말한다. | -분석도구(단순집계, 통계분석, 인공지능 등)의 원재료 |
정보 | 데이터를 단순집계처리, 통계분석 또는 고급분석(AI기술 등)처리에 의하여 생성된 결과를 말한다. | -최종 이용자를 위한 시각화의 입력 값으로 이용
-의사결정의 자료로 활용 |
○ 또한 빅데이터는 1회성 분석이 아니라 시간 변화에 따른 특성 분석이 주된 목적을 가지므로 데이터를 공급하는 센터는 동일 데이터에 대하여 지속적인 공급이 가능하여야 한다. 그러나 이에 대하여서도 일부 기관은 한계가 보이고 있어 선정 과정에 기준의 합리성에 의문이 든다.
■ 그리고 참여하는 공공기관의 데이터가 공공 데이터와 어떤 차이가 있는지, 만약 차이가 없다면 데이터의 중복이 발생되며, 차이가 있다면 공공 데이터로 개방하면 될 데이터를 공공 데이터를 유료화하는 격이 된다.
○ 공공기관(6개 플랫폼, 15개 센터)이 생산하는 데이터를 굳이 부처별로 사업을 따로 추진할 필요성이 있는지에 대하여 과학기술정보통신부와 행정안전부가 서로 따로 국밥처럼 추진하고 있어 사업의 효율성 저하에 따른 예산낭비를 초례 한다고 볼 수 있다.
■ 이와 같이 과학기술정보통신부는 데이터 산업 육성이란 성과주의에 매몰되어 성급한 사업 추진과 부실한 사업관리로 인하여 겉모습뿐인 빅데이터 플랫폼의 구축으로 국민혈세 640억원만 참여기관의 호주머니에 넣어준 격이 아닌가 한다.
■ 과학기술정보통신부는 데이터와 정보의 차이부터 이해하고 빅데이터 플랫폼에 대한개념부터 되 집어보기를 바라며, 금년 사업의 추진에 앞서 잘못 수행된 작년 사업부터 바로잡아야 할 것이다.
-끝-
■ 붙임
- 과학기술정보통신부의 국민신문고 답변
- 10개 플랫폼의 정보 접근성 및 시인성 수준
- 빅데이터 플랫폼의 단순정보 사례
- 10개 빅데이터 플랫폼 포털 화면
- 데이터 플랫폼에 특화된 CKAN 및 DCAT
o 교통 빅데이터 플랫폼: www.diamond-e.kr
o 문화 빅데이터 플랫폼: www.culture.go.kr/bigdata
o 환경 빅데이터 플랫폼: www.envbigdata.kr
o 중소기업 빅데이터 플랫폼: www.datastore.wehago.com
o 지역경제 빅데이터 플랫폼: www.ggdata.kr
o 금융 빅데이터 플랫폼: www.fnbigdata.com
o 헬스케어 빅데이터 플랫폼: www.cancerportal.kr
o 유통소비 빅데이터 플랫폼: www.kdx.kr
o 산림 빅데이터 플랫폼: www.forestdata.kr
붙임자료