고려대학교 세종학술정보원

이전 결과로 돌아가기 검색화면

MARC

하둡 애플리케이션 아키텍처 : 하둡 에코시스템을 활용한 빅데이터 처리 (11회 대출)

자료유형

단행본

개인저자

Grover, Mark, 저 Malaska, Ted, 저 Seidman, Jonathan, 저 Shapira, Gwen, 저 정동식, 역 홍다경, 역 우지현, 역

서명 / 저자사항

하둡 애플리케이션 아키텍처 : 하둡 에코시스템을 활용한 빅데이터 처리 / 마크 그로버 [외]지음 ; 정동식, 홍다경, 우지현 옮김

발행사항

고양 : BJ public, 2016

형태사항

xxxi, 489 p. : 삽화 ; 23 cm

원표제

Hadoop application architectures : designing real-world big data applications

ISBN

9791186697177

일반주기

색인수록
부록: 임팔라에서 조인
공저자: 테드 멀래스커, 조나단 사이드먼, 그웬 사피라

일반주제명

Computer architecture Big data

000		00000cam c2200205 c 4500
001		000045889651
005		20161202165334
007		ta
008		161202s2016 ggka 001c kor
020		▼a 9791186697177 ▼g 93000
035		▼a (KERIS)BIB000014100102
040		▼a 211062 ▼c 211062 ▼d 211009
041	1	▼a kor ▼h eng
082	0 4	▼a 005.7 ▼2 23
085		▼a 005.7 ▼2 DDCK
090		▼a 005.7 ▼b 2016
245	0 0	▼a 하둡 애플리케이션 아키텍처 : ▼b 하둡 에코시스템을 활용한 빅데이터 처리 / ▼d 마크 그로버 [외]지음 ; ▼e 정동식, ▼e 홍다경, ▼e 우지현 옮김
246	1 9	▼a Hadoop application architectures : ▼b designing real-world big data applications
260		▼a 고양 : ▼b BJ public, ▼c 2016
300		▼a xxxi, 489 p. : ▼b 삽화 ; ▼c 23 cm
500		▼a 색인수록
500		▼a 부록: 임팔라에서 조인
500		▼a 공저자: 테드 멀래스커, 조나단 사이드먼, 그웬 사피라
630	0 0	▼a Apache Hadoop
650	0	▼a Computer architecture
650	0	▼a Big data
700	1	▼a Grover, Mark, ▼e 저
700	1	▼a Malaska, Ted, ▼e 저
700	1	▼a Seidman, Jonathan, ▼e 저
700	1	▼a Shapira, Gwen, ▼e 저
700	1	▼a 정동식, ▼e 역
700	1	▼a 홍다경, ▼e 역
700	1	▼a 우지현, ▼e 역
900	1 0	▼a 그로버, 마크, ▼e 저
900	1 0	▼a 멀래스커, 테드, ▼e 저
900	1 0	▼a 사이드먼, 조나단, ▼e 저
900	1 0	▼a 사피라, 그웬, ▼e 저
945		▼a KLPA

소장정보

과학도서관

No.	소장처	청구기호	등록번호	도서상태	반납예정일	예약	서비스
No. 1	소장처 과학도서관/Sci-Info(1층서고)/	청구기호 005.7 2016	등록번호 121238253 (11회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M

컨텐츠정보

책소개

하둡에 대한 소개와 하둡을 이용해 할 수 있는 일, 또 그 일을 하기 위해 어떤 식으로 개별 옵션을 구성하고 계획해야 하는지 등을 안내하고 있다. 이 책을 통하여 아파치 하둡으로 총괄적인 데이터 관리 솔루션을 구축하는 일에 대한 전문가의 조언을 얻을 수 있다. 많은 소스를 활용하여 하둡 에코시스템의 다양한 요소들을 사용하는 방법을 설명하고, 그 요소들을 독자가 처한 개별 상황에서 완성형의 애플리케이션으로 조화롭게 통합해내기 위해 고려해야 할 아키텍처 요구 사항을 살펴보는 방법으로 이론과 실무를 동시에 다루고 있다.

아파치 하둡으로 총괄적인 데이터 관리 솔루션을 구축해보자

이 책을 통하여 아파치 하둡으로 총괄적인 데이터 관리 솔루션을 구축하는 일에 대한 전문가의 조언을 얻을 수 있다. 많은 소스를 활용하여 하둡 에코시스템의 다양한 요소들을 사용하는 방법을 설명하고,
그 요소들을 독자가 처한 개별 상황에서 완성형의 애플리케이션으로 조화롭게 통합해내기 위해 고려해야 할 아키텍처 요구 사항을 살펴보는 방법으로 이론과 실무를 동시에 다루고 있다.

하둡 애플리케이션에서 가장 일반적으로 사용되는 아키텍처의 상세한 예제가 풍부하게 제시되어 있다. 하둡 애플리케이션을 설계하거나 하둡을 기존 데이터 인프라스트럭처에 통합할 계획이 있다면, 아래 내용들로 구성된 이 책의 기술적 안내를 따라가는 것이 훌륭한 선택이 될 것이다.

- 하둡을 사용한 데이터 저장과 모델링에서 고려해야 할 사항
- 데이터를 시스템의 내/외부로 이동할 때 참고할 만한 최적 사례
- 맵리듀스, 스파크, 하이브를 포함한 데이터 프로세싱 프레임워크
- 중복 레코드 제거, 윈도잉 분석 사용 등 일반적인 하둡 프로세싱 패턴
- 하둡의 대용량 그래프 프로세싱을 위한 지라프, 그래프X, 그 외 다양한 툴
- 아파치 우지 같은 워크플로 오케스트레이션과 스케줄링 툴 활용법
- 아파치 스톰, 아파치 스파크 스트리밍, 아파치 플룸을 활용한 근접 실시간 스트림 프로세싱
- 클릭스트림 분석, 부정거래 탐지, 데이터 웨어하우스의 아키텍처 예제

[독자대상]
초중급

출판사 리뷰

‘빅데이터’는 정보 기술에 관련된 수많은 기사와 저널, 세미나에서 가장 많이 다뤄지고 있는 단어이며 최근에는 방송의 홍보 수단으로 이용될 만큼 일반인에게도 친숙한 단어다. 이와 관련하여 ‘하둡’은 기술 측면에서 빅데이터를 언급할 때 반드시 등장하는 중요한 키워드가 되고 있다.

이 책은 하둡에 대한 소개와 하둡을 이용해 할 수 있는 일, 또 그 일을 하기 위해 어떤 식으로 개별 옵션을 구성하고 계획해야 하는지 등을 안내하고 있다.

이 책은 다음과 내용을 제공한다

- 하둡 생태계를 구성하는 수많은 옵션들을 이용하여 비즈니스상의 문제 해결을 위한 아키텍처를 어떻게 구성할 것인가?
- 아키텍처 구성 관점에서 하둡 모델링, 데이터 수집 등 업무 영역을 지원하는 개별 옵션들의 구조 및 배경 지식
- 만들어 낸 아키텍처의 장단점, 실제 적용 사례까지의 폭넓은 구성

빅데이터에 대한 관심이 나날이 높아지고 있는 가운데, 이를 위한 기술과 방법론이 망라된 이 책이 빅데이터 전문가로 향하는 좋은 밑거름이 될 수 있다.

누구를 위한 책인가

하둡에 관심이 있는 초급 프로그래머와 하둡을 이용해 실제 비즈니스 문제를 해결하려는 현업 부서 IT 담당자에게는 충실한 참고 도서 역할을, 유사 업무 진행 담당자에게는 쓸모 있는 사례 연구서의 역할을 할 수 있을 것이라 기대 된다.

정보제공 :

펼치기

저자소개

마크 그로버(지은이)

아파치 빅탑(Apache Bigtop)의 커미터이자 아파치 센트리(인큐베이팅 중)의 커미터이자 PMC 멤버이다. 또한 아파치 하둡, 아파치 하이브, 아파치 스쿱, 아파치 플룸 프로젝트의 기여자이며 아파치 하이브를 다룬 『프로그래밍 하이브(Programming Hive)』(O'Reilly)의 한 섹션을 저술하였다.

테드 멀래스커(지은이)

하둡과 하둡 에코시스템을 이용하여 고객의 성공적인 수행을 도와주는 클라우데라의 수석 솔루션 아키텍트이다. 이전에는 미국 증권업계 자율규제기구(FINRA)의 선임 아키텍트로서 웹 애플리케이션과 서비스 지향적 아키텍처에서부터 빅데이터 애플리케이션까지 다수의 솔루션을 만들어냈다. 또한 그는 아파치 플룸, 아파치 애브로, 얀, 아파치 피그의 코드 기여자이다.

요나단 사이드먼(지은이)

클라우데라의 솔루션 아키텍트로 파트너의 솔루션과 클라우데라의 솔루션 스택을 통합하는 일을 하고 있다. 이전에는 오비츠 월드와이드(Orbitz Worldwide) 소속 빅데이터 팀의 기술 리더로서 인터넷에서 트래픽이 가장 높은 한 사이트의 하둡 클러스터 관리를 담당하였다. 또한 그는 시카고 하둡 사용자 그룹과 시카고 빅데이터의 공동 설립자이자 『하둡 인 프랙티스(Hadoop in Practice)』의 기술 편집자이며, 하둡과 빅데이터에 관한 다수의 비즈니스 컨퍼런스에서 발표하였다.

그웬 사피라(지은이)

클라우데라의 솔루션 아키텍트이다. 그녀는 확장성 있는 데이터 아키텍처 설계 영역에서 고객과 함께한 15년의 경험을 가지고 있다. 이전에는 피시언(Pythian)의 수석 컨설턴트, 오라클 ACE 디렉터, NoCoUG의 임원이었다. 그녀는 다수 비즈니스 컨퍼런스에서 발표하였으며 인기 있는 블로그를 운영하고 있다.

정동식(옮긴이)

경북대학교 경영학과를 졸업하였으며, 현재 LG CNS 빅데이터사업담당에서 일하고 있다. 금융, 물류, 제조 등 다양한 분야에서 빅데이터, 데이터웨어하우스, 비즈니스인텔리전스, CRM, SCM 등 데이터 관련 다수의 프로젝트를 수행하였다. 역서로 <하둡 애플리케이션 아키텍처>, <랄프 킴벌의 데이터 웨어하우스 툴킷 >, <머신 러닝 인 파이썬>등이 있다.

홍다경(옮긴이)

고려대학교 통계학과를 졸업하였으며, 현재 LG CNS 빅데이터사업담당에서 근무하고 있다.

우지현(옮긴이)

연세대학교 경영학과를 졸업하였으며, 현재 LG CNS 빅데이터사업담당에서 근무하고 있다.