빅데이터의 데이터 분류체계 2021년 12월 15일 5,862 0 빅데이터의 데이터 분류체계 패싯(facet)은 주제 분야를 구성하는 주요 속성, 관점, 혹은 특성을 의미한다(Ranganathan 1967, 88), 기본 주제를 일련의 공통적인 특성에 따라 여러 개의 기본 범주로 구분할 때 이 범주들을 기본 패싯이라 한다. 기본…
빅데이터의 역설 2020년 4월 25일 1,686 0 Xiao-Li Meng의 2018년에 발표한 "빅데이터의 통계적 낙원과 역설 (I)"에 관한 논문은 빅데이터 설정의 불확실성을 정량화하는 매력적인 접근법을 제시하고 있다. 다음은 이러한 아이디어 중 일부를 적용한 극단적인 예와 함께 요약한 내용입니다. 편향된…
빅데이터 플랫폼 및 센터 데이터 품질관리 가이드 2020년 3월 15일 4,855 0 추진 배경 현재는 데이터 시대로 양질의 데이터 확보가 기업 뿐 아니라 국가 경쟁력을 좌우하고 있으며, 애플, 구글, 아마존 등 데이터 보유 기업들이 글로벌 시장을 선도하는 등 이미 주요 선진국은 데이터로 경제적 효과를 창출하는 데이터 경제로 산업 구조를 바꾸고 있다.…
빅데이터 분석에 필요한 데이터 크기 2020년 2월 26일 4,432 0 데이터 분석의 전통적인 학문은 통계학이다. 통계학은 모집단의 성질을 파악하기 위하여 표본을 가지고 분석하여 모집단의 모수를 추정 및 검증하는 분석 기법이다. 통계적 분석은 모집단 전체를 조사하는 비용에 비하여 적은 비용으로 효율적으로 결과를 얻을 수 있는 분석…