고려대학교 세종학술정보원

이전 결과로 돌아가기 검색화면

MARC

Hadoop 완벽 가이드 개정3판 (24회 대출)

자료유형

단행본

개인저자

White, Tom (Tom E.) 심탁길, 역 김우현, 역

서명 / 저자사항

Hadoop 완벽 가이드 / 톰 화이트 지음 ; 심탁길, 김우현 공역

판사항

개정3판

발행사항

서울 : 한빛미디어, 2013

형태사항

812 p. : 삽화 ; 24 cm

원표제

Hadoop : the definitive guide (3rd ed.)

ISBN

9788968480201

일반주기

색인수록
클라우드 컴퓨팅 구축을 위한 실전 안내서
부록: A. 아파치 하툽 설치하기, B. 클라우데라의 하둡 배포판, C. NCDC 기상 데이터의 준비

일반주제명

File organization (Computer science)

000		01152camcc2200361 c 4500
001		000045790876
005		20140313101525
007		ta
008		140311s2013 ulka 001c kor
020		▼a 9788968480201 ▼g 93560
035		▼a (KERIS)BIB000013187942
040		▼a 243001 ▼c 243001 ▼d 243001 ▼d 211009
041	1	▼a kor ▼h eng
082	0 0	▼a 005.74 ▼2 23
085		▼a 005.74 ▼2 DDCK
090		▼a 005.74 ▼b 2013z3
100	1	▼a White, Tom ▼q (Tom E.)
245	1 0	▼a Hadoop 완벽 가이드 / ▼d 톰 화이트 지음 ; ▼e 심탁길, ▼e 김우현 공역
246	1 9	▼a Hadoop : ▼b the definitive guide ▼g (3rd ed.)
246	1 8	▼a 하둡 완벽 가이드
250		▼a 개정3판
260		▼a 서울 : ▼b 한빛미디어, ▼c 2013
300		▼a 812 p. : ▼b 삽화 ; ▼c 24 cm
500		▼a 색인수록
500		▼a 클라우드 컴퓨팅 구축을 위한 실전 안내서
500		▼a 부록: A. 아파치 하툽 설치하기, B. 클라우데라의 하둡 배포판, C. NCDC 기상 데이터의 준비
630	0 0	▼a Apache Hadoop
650	0	▼a File organization (Computer science)
700	1	▼a 심탁길, ▼e 역
700	1	▼a 김우현, ▼e 역
900	1 0	▼a 화이트, 톰, ▼e 저
945		▼a KLPA

소장정보

과학도서관

No.	소장처	청구기호	등록번호	도서상태	반납예정일	예약	서비스
No. 1	소장처 과학도서관/Sci-Info(1층서고)/	청구기호 005.74 2013z3	등록번호 121228757 (24회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M

컨텐츠정보

책소개

하둡 프로젝트의 커미터이자 핵심 설계자인 톰 화이트가 저술한 책이다. 하둡을 가장 완벽하게 다루고 있다. 저자는 하둡 창시자인 더그 커팅을 비롯한 각기 전문가의 강력한 조언을 받았고 이를 본서에 충실하게 반영했다.

하둡은 물론이고 하둡과 연동해서 사용할 수 있는, 아파치 하둡 프로젝트의 서브 프로젝트인 피그, 주키퍼, HBase, 하이브, 스쿱, 에이브 등에 대해서도 다룬다. 또, Last.fm, 페이스북, 랙페이스의 하둡 활용 사례를 통해 어떻게 하둡을 활용해야 하는지 배울 수 있다. 본 한글판은 역자주를 통해 하둡 최신 정보를 반영했다.

[ 이 책이 제시하는 핵심 내용]
이 책은 구글의 알고리즘을 구현한 최고의 클라우드 컴퓨팅 기술인 하둡에 대해 다룬다. 특히 하둡 2.x와 맵리듀스 2를 다룬 최초의 책이다. 사실 하둡 2.x와 얀으로 불리는 맵리듀스 2는 기존 버전과 많이 다르다. 새로 추가된 기능들은 기존 버전에서 아쉬웠던 부분을 메꿔주기 때문에 반드시 도입해야 한다. 커미터가 직접 쓴 이 책을 밑거름 삼아 더 성공적인 클라우드 컴퓨팅 시스템을 구현하자!

[이 책의 특징과 장점]
하둡 프로젝트의 커미터이자 핵심 설계자인 톰 화이트가 저술한 이 책은 하둡을 가장 완벽하게 다루고 있다. 저자는 하둡 창시자인 더그 커팅을 비롯한 각기 전문가의 강력한 조언을 받았고 이를 본서에 충실하게 반영했다. 이 책은 하둡은 물론이고 하둡과 연동해서 사용할 수 있는, 아파치 하둡 프로젝트의 서브 프로젝트인 피그, 주키퍼, HBase, 하이브, 스쿱, 에이브 등에 대해서도 다룬다. Last.fm, 페이스북, 랙페이스의 하둡 활용 사례를 통해 어떻게 하둡을 활용해야 하는지 배울 수 있다. 본 한글판은 역자주를 통해 하둡 최신 정보를 반영했다.

[어떤 독자를 위한 책인가?]
- 클라우드 컴퓨팅 분야의 학자, 개발자, 기술 기획자
- 데이터 마이닝 등 데이터 분석 및 알고리즘 학자, 개발자

[도서 특징(책 표지 글)]
데이터에 대한 생각을 전환하라!
500기가바이트를 59초 만에, 100테라바이트를 단 173분 만에 정렬하는 하둡은 상상을 초월하는 데이터 분석 성능을 제공한다. 구글의 알고리즘을 구현한 하둡은 맵리듀스 기법으로 데이터에 대한 생각을 변화시키고, 이전에 보존해 두었던 그 어떤 데이터든지 활용할 수 있게 한다. 전에는 너무 오랜 시간이 걸려 결과를 얻을 수 없었던 문제도 이제는 하둡으로 빠르게 해답을 얻을 수 있게 되었고, 이를 통해 새로운 통찰력도 얻을 수 있게 되었다.

하둡, 클라우드 컴퓨팅의 역사를 바꾸다!
2008년 2월 - 뉴욕타임스는 1851년부터 1980년 12월까지 130년 분량의 신문기사 1,100만 매를 '아마존 S3'에 저장하고, 하둡을 이용하여 약 4테라바이트 크기의 데이터를 24시간 만에 변환했다. 이는, 일반 서버로 대략 14년이 걸리는 어마어마한 작업량이다.
2008년 4월 - 하둡은 '맵리듀스로 테라바이트 데이터 소트' 대회에서 전년도 우승자의 297초에 비해 2/3분 수준인 209초 만에 정렬하며 우승했다. 이어 2009년 5월, 야후는 하둡으로 62초 만에 1테라바이트를 정렬했다.
2009년 4월 - '1분 소트' 대회에서 500기가바이트를 59초에(1,400개 노드에서) 정렬하며 우승했다. 또한 100테라바이트를 173분에(3,400개 노드에서) 정렬했다.

[개정판에서 새로워진 내용]
3판_ 아파치 하둡의 새로운 버전 0.22와 2.x(이전에는 0.23)뿐만 아니라, 1.x(이전에는 0.20) 모두를 다룬다. 이 책의 예제는 몇 가지 예외 사항(책에서 별도로 표시)을 제외하고 모든 버전을 위해 작성되었다. 각 버전에 대한 특성들은 1장 '하둡 릴리즈'에서 상세히 다룬다.
이번 개정판은 새로운 맵리듀스 API를 대부분의 예제에 사용한다. 그럼에도 이전 API가 여전히 폭넓게 활용되고 있기 때문에 새로운 API가 나올 때 함께 논의된다. 이 책에서 제시한 웹 사이트에서 새로운 API에 대응하는 이전 API의 소스 코드가 제공될 것이다.
하둡 2.0의 주요 변화는 얀(YARN)으로 명명된 새로운 분산 리소스 관리 시스템으로 구현된 새로운 맵리듀스(맵리듀스 2)다. 얀 기반의 맵리듀스는 6장과 9장에서 각각 작동 방식 및 실행 방식에 대해 다룬다.
맵리듀스에 대한 더 많은 내용도 다룬다. 메이븐으로 맵리듀스 잡 패키징, 사용자의 자바 클래스 경로 설정, MRUnit으로 테스트 코드 작성과 같은 개발에 필요한 실질적인 내용은 5장에 포함되어 있다. 출력 커미터, 분산 캐시, 태스크 메모리 모니터링과 같은 깊이 있는 맵리듀스 특성은 8장과 9장에서 각각 다룬다. 에이브로 데이터 처리를 위한 맵리듀스 잡 작성은 4장에 새롭게 추가되었고, 오지Oozie를 활용한 간단한 맵리듀스 워크플로우 실행은 5장에 새로 추가되었다.
HDFS 고가용성과 HDFS 통합은 기존 HDFS를 다루었던 3장에 새롭게 추가되었고, WebHDFS와 HttpFS 같은 새로운 파일시스템도 3장에서 함께 다룬다.
피그, 하이브, 스쿱, 주키퍼의 각 장들도 최신 릴리즈의 특성과 변화를 반영하여 내용을 새롭게 추가했다.
이와 더불어 책 전반에 걸쳐 내용에 대한 정정과 개선이 이뤄졌다.

2판_ 하이브와 스쿱에 관한 두 개의 새로운 장(12장과 15장), 에이브로를 다루는 새로운 절(4장), 하둡의 새로운 보안 속성에 대한 소개(9장), 하둡을 사용한 대규모 네트워크 그래프 분석에 대한 새로운 사례분석이 추가되었다.

대용량 데이터에 관한 가장 완벽한 책(개정판)!
하둡 프로젝트의 커미터이자 핵심 설계자인 톰 화이트가 저술한 이 책은 하둡을 가장 완벽하게 다루고 있다. 하둡의 개념과 사용법은 물론 Last.fm, 페이스북, 랙페이스의 하둡 활용 사례를 통해 어떻게 하둡을 활용해야 하는지 배울 수 있다. 개정판에서는 최신 변경 내용을 반영하고 하이브, 스쿱, 에이브로 내용을 추가했다.

얀 기반의 맵리듀스
오지(Oozie)를 활용한 맵리듀스 워크플로우 실행
대규모 데이터셋 저장을 위해 하둡 분산파일시스템(HDFS)
맵리듀스를 통한 분산 연산 작업
데이터 압축, 정합성, 직렬화, 영속성을 위한 입출력 빌딩 블록
전용 하둡 클러스터 설계, 구축, 운영 방법
대규모 데이터 처리를 위한 피그
구조화된 데이터와 반-구조화된 데이터를 처리하는 HBase
분산 시스템 구축을 위한 주키퍼
하이브-하둡 데이터웨어하우징 시스템

정보제공 :

펼치기

저자소개

톰 화이트(지은이)

2007년 2월부터 아파치 하둡 커미터가 되었고, 이후 아파치 소프트웨어 재단의 일원이 되었다. 현재 하둡에 대한 지원과 트레이닝을 제공하는 회사인 클라우데라에서 일하고 있다. 그전에는 독립적인 하둡 고문으로서 하둡을 설치, 사용, 확장하려는 회사와 일했다. oreilly.com, java.net, IBM developerWorks에 수많은 글을 썼으며 몇몇 컨퍼런스에서 하둡에 관해 연설했다. 케임브리지 대학교에서 수학 학사학위를 취득하고, 영국 리즈Leeds 대학교에서 과학 철학 석사학위를 취득하였다.

김우현(옮긴이)

안동사범학교 본과 졸업 한국방송통신대학 행정학과 졸업 영남대학교 교육대학원 졸업 교육공무원 (43년 재직, 정년퇴임) 전, 장학관 (안동 및 경주교육청) 전, 학교장 (구미신평중 외 2개교) 현, 한국침구사협회 회원 현, 대한민국건국회 회원 침구전문 자격 약용식물관리사 자격 체조심판자격 유도, 합기도, 검도 등 (초단) [저서 및 논문] 김우현 동요작곡집 외 작곡집 5회 출판, 농악교본, 경기민요해설집, 전통음악의 원리와 교육, 교가 작곡(상모중 외 200여개 학교), 각종 교육연구대회(교육부 장관상) 12차례 수상 [표창] 황조근정훈장(대통령) 환경교육 공로 표창(환경부장관) 각종 분야 교육부장관상(3회) 도교육감 및 각종 표창(30여회)

심탁길(옮긴이)

삼성SDS, NHN, SK C&C 등에서 개발팀을 이끌며 클라우드 컴퓨팅 서비스 개발, 빅데이터 분석 등의 업무를 수행했다. 현재 틈틈이 야간에 시간을 내서 클라우드와 빅데이터 분야의 오픈소스 프로젝트를 준비 중이다.