728x90

하둡 2

하둡 이란?

데이터마이닝에 있어서 여러 툴 중에 하둡(Hadoop-High-Availability Distributed Object-Oriented Platform) 이란 단어을 요즘들어 자주 접하게 됩니다. 그래서 이것이 무엇일까 궁금해서 여기저기 찾아보고 있는 중입니다. 그래서 제일먼저 봐야 할 것이 Wi-Ki 라서 이곳에서 정의를 좀 살펴보았습니다. 정의는 아파치 하둡(Apache Hadoop, High-Availability Distributed Object-Oriented Platform)은 대량의 자료를 처리할 수 있는 큰 컴퓨터 클러스터에서 동작하는 분산 응용 프로그램을 지원하는 프리웨어 자바 소프트웨어 프레임워크이다. 원래 너치의 분산 처리를 지원하기 위해 개발된 것으로, 아파치 루씬의 하부 프로젝트이..

하둡 에코시스템

하둡 에코시스템 이란게 무엇일까요? 하둡이면 하둡이지 하둡 에코시스템 이란게 있어서 좀 찾아보았는데.. 내용이 좀 나와서 보니 하둡 에코시스템은 하둡의 패키지를 의미하는 것 같습니다. [그림 출처: 시작하세요! 하둡 프로그래밍(위키북스)] 저헐게 많은 시스템을 모아서 하둡에코 라고 하는데 저걸 다 할 수 있을까 하는 의구심이 들기 시작했습니다. 갈길이 정말 머네요~ 그냥 일반 툴이나 개발언어를 한다고 해서 쉽게 할 수 잇는 영역이 아닌 것 같습니다. 위 시스템의 서브카테고리 설명을 발취를 했는데 보면.. | Zookeeper 분산 환경에서 서버들간에 상호 조정이 필요한 다양한 서비스를 제공하는 시스템입니다. 첫째, 하나의 서버에만 서비스가 집중되지 않도록, 서비스를 알맞게 분산하여 동시에 처리하게 해줍니..

728x90
반응형