빅데이터의 데이터 분류체계 2021년 12월 15일 5,616 0 빅데이터의 데이터 분류체계 패싯(facet)은 주제 분야를 구성하는 주요 속성, 관점, 혹은 특성을 의미한다(Ranganathan 1967, 88), 기본 주제를 일련의 공통적인 특성에 따라 여러 개의 기본 범주로 구분할 때 이 범주들을 기본 패싯이라 한다. 기본…
빅데이터의 역설 2020년 4월 25일 1,657 0 Xiao-Li Meng의 2018년에 발표한 "빅데이터의 통계적 낙원과 역설 (I)"에 관한 논문은 빅데이터 설정의 불확실성을 정량화하는 매력적인 접근법을 제시하고 있다. 다음은 이러한 아이디어 중 일부를 적용한 극단적인 예와 함께 요약한 내용입니다. 편향된…
머신 러닝을 위한 데이터 검증 2020년 3월 2일 2,803 0 검증 과정은 무엇이 잘못됐는지 직접 찾아내지 못하지만, 그 과정은 때때로 우리에게 모델의 안정성에 문제가 있다는 것을 보여줄 수 있다. 데이터는 머신 러닝의 근원입니다. 기계 학습 및 딥 러닝 모델이 아무리 강력하더라도, 나쁜 데이터로 우리가 원하는 것을…
빅데이터 분석에 필요한 데이터 크기 2020년 2월 26일 4,354 0 데이터 분석의 전통적인 학문은 통계학이다. 통계학은 모집단의 성질을 파악하기 위하여 표본을 가지고 분석하여 모집단의 모수를 추정 및 검증하는 분석 기법이다. 통계적 분석은 모집단 전체를 조사하는 비용에 비하여 적은 비용으로 효율적으로 결과를 얻을 수 있는 분석…
빅데이터 플랫폼 정보 2020년 2월 20일 11,148 0 과기정통부가 공공과 민간이 협업하여 활용도 높은 양질의 데이터를 생산·구축을 위하여 구축된 빅데이터 플랫폼 문화 빅데이터 플랫폼: https://www.bigdata-culture.kr 통신 빅데이터 플랫폼:…