하둡에 도전하는 HPCC 2013년 10월 22일 7,248 0 빅데이터라는 표현이 나오면 항상 따라오는 말이 바로 하둡(Hadoop)이다. 막대한 양의 데이터를 접속 가능하게 만든 기술이 바로 오픈소스 아파치 하둡 프로젝트(Apache Hadoop project)에 기반한 것이었기 때문이었다. 외부에서 들여다보면,…
하둡에 적용할 알고리즘의 이해 2013년 8월 27일 7,132 0 빅데이터를 분석하기 위하여 하둡(Hadoop)의 분산처리 지원은 수집, 저장에서 유용하나 분석시 분산처리를 적용할 경우 해당 알고리즘의 구조가 분산처리를 하여도 정보의 왜곡이 발생하는가를 검토하여야 한다. 분석 시 적용하는 알고리즘이 분산처리가 가능한 알고리즘이…