HOME > 상세정보

상세정보

Data lake 플랫폼 아키텍처 : 빅데이터 서비스 플랫폼의 설계 (3회 대출)

자료유형
단행본
개인저자
윤선웅
서명 / 저자사항
Data lake 플랫폼 아키텍처 : 빅데이터 서비스 플랫폼의 설계 / 윤선웅 지음
발행사항
서울 :   좋은땅,   2021  
형태사항
248 p. : 삽화 ; 23 cm
ISBN
9791138800280
서지주기
참고문헌(p. 239-240)과 색인 수록
일반주제명
데이터 분석[--分析] 데이터 관리 시스템[--管理--] 아키텍처 설계[--設計]
000 00000cam c2200205 c 4500
001 000046103404
005 20220203115055
007 ta
008 220104s2021 ulka b 001c kor
020 ▼a 9791138800280 ▼g 03000
035 ▼a (KERIS)BIB000015897516
040 ▼a 222001 ▼c 222001 ▼d 211009
082 0 4 ▼a 005.74 ▼2 23
085 ▼a 005.74 ▼2 DDCK
090 ▼a 005.74 ▼b 2021z6
100 1 ▼a 윤선웅
245 1 0 ▼a Data lake 플랫폼 아키텍처 : ▼b 빅데이터 서비스 플랫폼의 설계 / ▼d 윤선웅 지음
246 3 ▼a 데이터 레이크 플랫폼 아키텍처
260 ▼a 서울 : ▼b 좋은땅, ▼c 2021
300 ▼a 248 p. : ▼b 삽화 ; ▼c 23 cm
504 ▼a 참고문헌(p. 239-240)과 색인 수록
650 8 ▼a 데이터 분석[--分析]
650 8 ▼a 데이터 관리 시스템[--管理--]
650 8 ▼a 아키텍처 설계[--設計]

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 005.74 2021z6 등록번호 121258914 (2회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 2 소장처 세종학술정보원/과학기술실(5층)/ 청구기호 005.74 2021z6 등록번호 151357767 (1회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M ?
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 005.74 2021z6 등록번호 121258914 (2회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 세종학술정보원/과학기술실(5층)/ 청구기호 005.74 2021z6 등록번호 151357767 (1회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M ?

컨텐츠정보

책소개

저자의 Data Lake 시리즈의 세 번째 책으로, Data Lake 플랫폼의 청사진(Blueprint)을 설계하기 위한 실무자들을 위한 책이다. Data Lake의 전체 플랫폼을 어떻게 설계할지에 대한 내용을 기술하였다.

Data Catalog는 ‘사용자 Self-Service Layer’의 하나의 구성요소에 불과하지만, Data Lake 플랫폼은 많은 구성요소와 기술요소를 포함하고 있는 복잡한 시스템이다. Data Lake 아키텍트는 이러한 많은 구성요소를 정의하고 기술을 검토하고 아키텍처를 설계해야 한다.

하지만 이들 아키텍트가 참고할 수 있는 자료는 사실상 해외 자료 몇 권과 이를 번역한 자료 정도이며, 이 자료들은 ‘람다 아키텍처’를 기반으로 한 아주 대략적인 구현 모습만을 제공하고 있다. Data Lake 설계를 위한 참고 자료가 부족한 상황에서, 저자의 지난 3년간의 Data Lake 프로젝트 수행과 리서치 경험을 바탕으로 좀 더 종합적인 관점에서 설계를 위한 기초 자료를 제공한다.

기업의 비즈니스 방향을 고려한 빅데이터 서비스 플랫폼을 설계하자!

글로벌 대형 기업들은 ‘디지털 전환(Digital Transformation)’을 핵심 현안으로 추진하고 있습니다. 이 과정에서 Data Lake 구축은 가장 중요한 과제 중 하나일 것입니다. 다른 기업들처럼 ‘람다 아키텍처‘를 기반으로 하여 하둡 에코시스템을 활용해서 구축하면 되는 것일까요? 아니면 AWS 혹은 Azure의 Public Cloud 서비스를 활용하여 구축하면 되는 것일까요? 우리 기업의 비즈니스에 적합한 Data Lake 아키텍처는 무엇일까요? 이러한 ‘중요한 질문들’에 대한 해답을 얻고자 한다면 이 책을 반드시 읽어야 할 것입니다.

• 빅데이터 참조 아키텍처(람다 vs. 카파)
• 빅데이터 솔루션 아키텍처(Cloudera vs. AWS vs. Azure)
• Data Lake 아키텍처 설계 기본원칙
• 단기와 장기 개념 아키텍처의 설계
• 아키텍처 설계 시 주요 의사결정 사항
• 구성요소별 상세 아키텍처 설계

이 책은 저자의 Data Lake 시리즈의 세 번째 책으로, Data Lake 플랫폼의 청사진(Blueprint)을 설계하기 위한 실무자들을 위한 책이다.

첫 번째 책인 《차세대 빅데이터 플랫폼 Data Lake》는 Data Lake 플랫폼의 전반적인 개요를 다루었고, Data Lake가 무엇이고, 무엇을 목적으로 하는지를 알려 준다. 두 번째 책인 《Data Catalog 만들기》는 Data Lake 플랫폼의 핵심 서비스라고 할 수 있는 Data Catalog 서비스를 소개하고, 이를 어떻게 설계하고 구축해야 하는지에 대한 방법론과 예시를 중심으로 기술하였다. 세 번째 책인 이 책에서는 Data Lake의 전체 플랫폼을 어떻게 설계할지에 대한 내용을 기술하였다.

Data Catalog는 ‘사용자 Self-Service Layer’의 하나의 구성요소에 불과하지만, Data Lake 플랫폼은 많은 구성요소와 기술요소를 포함하고 있는 복잡한 시스템이다. Data Lake 아키텍트는 이러한 많은 구성요소를 정의하고 기술을 검토하고 아키텍처를 설계해야 한다.

하지만 이들 아키텍트가 참고할 수 있는 자료는 사실상 해외 자료 몇 권과 이를 번역한 자료 정도이며, 이 자료들은 ‘람다 아키텍처’를 기반으로 한 아주 대략적인 구현 모습만을 제공하고 있다. Data Lake 설계를 위한 참고 자료가 부족한 상황에서, 저자의 지난 3년간의 Data Lake 프로젝트 수행과 리서치 경험을 바탕으로 좀 더 종합적인 관점에서 설계를 위한 기초 자료를 제공한다.


정보제공 : Aladin

저자소개

윤선웅(지은이)

저자는 IT 컨설팅과 SW 구축 분야에서 20년 이상 근무 중이다. 최근에는 빅데이터 플랫폼을 기획하고 구축하는 업무를 수행하고 있다. 저서로는 “차세대 빅데이터 플랫폼 Data Lake”, “Data Catalog 만들기”, “Data Lake 플랫폼 아키텍처”가 있다.

정보제공 : Aladin

목차

머리말

제1장 Data Lake 개요
1. Data Lake의 등장 배경
2. Data Lake의 중요성
3. Data Lake의 개념
4. Data Lake 구성요소

제2장 Data Lake 참조 아키텍처
1. 빅데이터 참조 아키텍처
1-1. 람다 아키텍처
1-2. 카파 아키텍처
1-3. 참조 아키텍처 간 비교
2. 빅데이터 솔루션 아키텍처
2-1. Cloudera Hadoop
2-2. Cloudera Data Platform
2-3. AWS Data Lake
2-4. Azure Data Lake
2-5. 솔루션 아키텍처 간 비교

제3장 Data Lake 아키텍처 설계
1. 아키텍처 설계 기본 원칙
2. 아키텍처 설계 방향
2-1. 단기 아키텍처
2-2. 장기 아키텍처
2-3. 설계 시 주요 의사결정 사항
3. 구성요소별 아키텍처 설계
3-1. 데이터 수집 Layer
3-2. 데이터 적재 Layer
3-3. 데이터 처리 Layer
3-4. 데이터 제공 Layer
3-5. 사용자 Self-Service Layer
3-6. 데이터 거버넌스 Layer

맺음말
참고자료
색인

관련분야 신착자료

Harvard Business Review (2025)