하둡의 특징- 여러 리눅스 기반 범용 서버들을 하나의 클러스터로 사용한다. -> 클러스터란 하나의 묶음, 집합의 개념이다. - 마스터 (Master) - 슬레이브 (Slave) 구조를 가진다. - 파일을 블록 단위로 저장한다. -> HDFS 내부 알고리즘이 블록 단위를 결정하며, 이것은 사용자가 제어하는 영역이 아니다. - 블록 데이터 복제본을 유지해 신뢰성을 보장한다. -> Default 값은 3개의 복제본이다. - 높은 내고장성 (Fault-Tolerance) -> 하둡 자체에 의해 데이터가 유실되는 경우는 없다고 본다. 하둡에 의존하는 다른 플랫폼들에서 데이터가 유실될 수 있다. - 데이터 처리의 지역성을 보장한다. 하둡에서의 블록 (Block) 개념- 하나의 블록은 64MB, 1..