목록빅데이터 (1)
study blog
[Hadoop] 하둡이란 무엇인가?
💡 병렬 분산 알고리즘을 사용하는 이유 Scaling-out is superior to Scaling-up Scale-out : 아주 많은 값싼 서버들을 이용 Scale-up : 적은 수의 값비싼 서버들을 이용 데이터 중심 (data-intensive) 어플리케이션 분야에서는 Scale-out을 더 선호한다. 가격과 성능이 선형으로 증가하지 않기 때문이다. 두 배의 성능의 프로세서 한 개를 가진 컴퓨터의 가격이 일반 프로세서 한 개를 가진 컴퓨터 가격의 두배 보다 비싸다. 그러므로 여러 컴퓨터를 묶어서 처리해야 하기 때문에 병렬 분산 알고리즘이 필요하다. 💡 맵리듀스 프레임워크 값싼 컴퓨터들을 모아서 클러스터를 만들고 여기에서 빅데이터를 처리하기 위한 scalable 병렬 소프트웨어의 구현을 쉽게 할 수..
빅데이터/Hadoop
2022. 2. 22. 23:27