고려대학교 세종학술정보원

이전 결과로 돌아가기 검색화면

MARC

스칼라와 기계 학습 : 스칼라를 활용해 데이터에서 학습하는 시스템 만들기

자료유형

단행본

개인저자

Nicolas, Patrick R. 오현석, 역

서명 / 저자사항

스칼라와 기계 학습 : 스칼라를 활용해 데이터에서 학습하는 시스템 만들기 / 패트릭 니콜라스 지음; 오현석 옮김

발행사항

서울 : 에이콘출판사, 2016

형태사항

598 p. : 도표 ; 24 cm

총서사항

acorn + packt technical book

원표제

Scala for machine learning

ISBN

9788960778832 9788960772106 (세트)

일반주기

부록: A. 기본 개념

서지주기

참고문헌과 색인수록

000		00000cam c2200205 c 4500
001		000045925217
005		20251121135930
007		ta
008		180104s2016 ulkd b 001c kor
020		▼a 9788960778832 ▼g 94000
020	1	▼a 9788960772106 (세트)
035		▼a (KERIS)BIB000014160689
040		▼a 242001 ▼c 242001 ▼d 242001 ▼d 211009
041	1	▼a kor ▼h eng
082	0 4	▼a 005.133 ▼2 23
085		▼a 005.133 ▼2 DDCK
090		▼a 005.133 ▼b S279 2016
100	1	▼a Nicolas, Patrick R. ▼0 AUTH(211009)162854
245	1 0	▼a 스칼라와 기계 학습 : ▼b 스칼라를 활용해 데이터에서 학습하는 시스템 만들기 / ▼d 패트릭 니콜라스 지음; ▼e 오현석 옮김
246	1 9	▼a Scala for machine learning
260		▼a 서울 : ▼b 에이콘출판사, ▼c 2016
300		▼a 598 p. : ▼b 도표 ; ▼c 24 cm
440	0 0	▼a acorn + packt technical book
500		▼a 부록: A. 기본 개념
504		▼a 참고문헌과 색인수록
700	1	▼a 오현석, ▼e 역 ▼0 AUTH(211009)160205
900	1 0	▼a 니콜라스, 패트릭, ▼e 저
945		▼a KLPA

소장정보

과학도서관

No.	소장처	청구기호	등록번호	도서상태	반납예정일	예약	서비스
No. 1	소장처 과학도서관/Sci-Info(1층서고)/	청구기호 005.133 S279 2016	등록번호 121242896	도서상태 대출가능	반납예정일	예약	서비스 B M

컨텐츠정보

책소개

acorn+PACKT 시리즈. 이 책은 알파고와 시리, 자율주행 자동차 등의 시스템을 구축할 때 기초가 될 수 있는 각종 데이터 처리 방법과 비감독 학습, 베이지안 분석, 회귀와 정규화, 은닉 마코프 모델, SVM, 인공 뉴럴 네트워크, 유전자 알고리즘, 강화 학습 등의 기계 학습 알고리즘의 수학적 모델을 설명하고, 스파크 등의 빅데이터 시스템에서 쓰이고 있는 스칼라 언어를 통해 구현한다.

또한 실제 미국 증시와 외환 시장에서 가져온 각종 금융 데이터에 각 기계 학습 알고리즘을 적용하면서 알고리즘들의 장단점과 한계 등을 설명한다. 독자들은 스칼라를 활용해 규모 확장성이 있는 기계 학습 시스템을 작성하고, 자신의 필요에 맞는 기계 학습 알고리즘을 평가하고 선택할 수 있는 방법을 배울 수 있다.

이 책은 어떻게 기계 학습 알고리즘을 구현하고, 검증하고, 응용할 수 있는지 배우고 싶어 하는 스칼라 프로그래밍에 경험이 있는 소프트웨어 개발자가 주 대상이다. 함수 프로그래밍에 대해 살펴보거나 스칼라를 활용해 기존 애플리케이션의 규모 확장성을 개선하고자 하는 데이터 과학자에게도 도움이 될 것이다. 책은 금융시장에 대한 기술 분석을 활용해 직접 짜면서 비교해볼 수 있는 연습 문제를 제공하는 자습서로 고안됐다.

★ 요약 ★

이 책은 알파고와 시리, 자율주행 자동차 등의 시스템을 구축할 때 기초가 될 수 있는 각종 데이터 처리 방법과 비감독 학습, 베이지안 분석, 회귀와 정규화, 은닉 마코프 모델, SVM, 인공 뉴럴 네트워크, 유전자 알고리즘, 강화 학습 등의 기계 학습 알고리즘의 수학적 모델을 설명하고, 스파크 등의 빅데이터 시스템에서 쓰이고 있는 스칼라 언어를 통해 구현한다. 또한 실제 미국 증시와 외환 시장에서 가져온 각종 금융 데이터에 각 기계 학습 알고리즘을 적용하면서 알고리즘들의 장단점과 한계 등을 설명한다. 독자들은 스칼라를 활용해 규모 확장성이 있는 기계 학습 시스템을 작성하고, 자신의 필요에 맞는 기계 학습 알고리즘을 평가하고 선택할 수 있는 방법을 배울 수 있다.

★ 이 책에서 다루는 내용 ★

■ 과학기술 계산을 위한 동적인 워크플로우를 만드는 방법
■ 오픈소스 라이브러리를 활용해 시계열 데이터에서 패턴을 추출하는 방법
■ 분류, 군집화, 진화 알고리즘을 작성하는 방법
■ 상대적인 성능 튜닝을 수행하는 방법과 스파크에 대한 평가
■ 순차적 데이터에 대한 확률 모델
■ 정규화나 커널화 등의 고급 기법을 활용한 실험
■ 스칼라 병렬 컬렉션, 아카 액터, 아파치 스파크 클러스터 등을 활용해 빅데이터 문제를 푸는 방법
■ 금융시장에 대한 기술적 분석에 핵심 기계 학습 전략 적용

★ 이 책의 대상 독자 ★

이 책은 어떻게 기계 학습 알고리즘을 구현하고, 검증하고, 응용할 수 있는지 배우고 싶어 하는 스칼라 프로그래밍에 경험이 있는 소프트웨어 개발자가 주 대상이다.
함수 프로그래밍에 대해 살펴보거나 스칼라를 활용해 기존 애플리케이션의 규모 확장성을 개선하고자 하는 데이터 과학자에게도 도움이 될 것이다.
이 책은 금융시장에 대한 기술 분석을 활용해 직접 짜면서 비교해볼 수 있는 연습 문제를 제공하는 자습서로 고안됐다.

★ 이 책의 구성 ★

1장, '시작하며'에서는 통계 분석, 자동 분류, 회귀분석, 예측, 클러스터링, 최적화의 기본 개념을 소개한다. 스칼라 언어 특징과 라이브러리를 간단한 애플리케이션 구현과 함께 다룬다.

2장, 'Hello World!'에서는 전형적인 자동 분류 워크플로우를 설명하고, 편향/분산(bias/variance)의 트레이드 오프(trade-off) 관계, 스칼라 의존성 삽입을 활용한 검증 방법을 금융시장 분석에 응용해 살펴본다.

3장, '데이터 전처리'에서는 시계열 분석에 대해 다루며, 스칼라를 활용해 데이터 전처리를 구현하고 이동 평균과 같은 평활 기법, 이산 푸리에 변환, 그리고 칼만 재귀 필터 등을 어떻게 간편하게 구현할 수 있는지 살펴본다.

4장, '비감독 학습'에서는 가장 널리 활용되는 클러스터링 기법인 K-평균법, 기대값 최대화(EM, Expectation Maximization) 구현, 차원 축소 방법인 주성분 분석에 대해 주로 살펴본다.

5장, '나이브 베이즈 분류기'에서는 확률 그래프 모델을 소개하고, 나이브 베이즈 분류기와 다변량 베르누이 분류기를 어떻게 구현하는지 텍스트마이닝 관점에서 살펴본다.

6장, '회귀분석과 정규화'에서는 전형적인 선형 회귀와 최소 제곱법 회귀, 릿지 회귀와 정규화 기법에 대해 다루고, 마지막으로 로지스틱 회귀에 대해 살펴본다.

7장, '순차적 데이터 모델'에서는 마르코프 프로세스를 은닉 마르코프 모델 구현 전체 과정과 함께 살펴보고, 금융시장 데이터에 대한 패턴 인식 과정에 응용해본 조건부 임의 필드(conditional random field) 기법에 대해서도 살펴본다.

8장, '커널 모델과 서포트 벡터 머신'에서는 커널 함수의 개념과 지지 벡터 머신 분류기 및 회귀분석 구현 방법을 살펴보고, 이진 SVM 분류기를 활용한 이상 탐지 방법도 살펴본다.

9장, '인공 뉴럴 네트워크'에서는 앞먹임(feed-forward) 신경망과 다층 퍼셉트론(multilayer perceptron) 분류기 구현 방법을 살펴본다.

10장, '유전자 알고리즘'에서는 진화 컴퓨팅의 기초를 다루며, 다목적 유전자 알고리즘 구성 요소 각각의 구현에 대해서 살펴본다.

11장, '강화 학습'에서는 강화 학습 개념을 소개하고, Q-학습 알고리즘 구현 방법을 학습 기반 분류 시스템을 구축하기 위한 템플릿과 함께 살펴본다.

12, '확장 가능한 프레임워크'에서는 기계 학습에서 규모 확장성이 있는 애플리케이션을 개발하기 위한 아티팩트와 프레임워크를 다룬다. 이를 통해 스칼라 병렬 컬렉션, 아카(Akka), 아파치 스파크(Spark) 프레임워크 등을 살펴볼 것이다.

부록 A, '기본 개념'에서는 이 책 전체에 쓰인 스칼라 구문, 선형대수 요소에 대해 다루고, 투자와 트레이딩 전략에 대해서도 간단히 소개한다.

부록 B, '참고 문헌'은 각 장에서 참고했던 문헌의 목록을 제공한다.

정보제공 :

펼치기

저자소개

패트릭 니콜라스(지은이)

캘리포니아 애자일 SDEAgile SDE의 공학 이사다. 소프트웨어공학, C++, 자바와 최근의 스칼라/스파크 애플리케이션 구축에 이르기까지 25년 이상의 경력을 보유했으며, 여러 개의 관리 직위를 맡아왔다. 실시간 분석, 모델링, 비선형 모형 개발 등에 관심이 많다.

오현석(옮긴이)

25년간 현업 개발자로 코드를 개발해 왔으며, 지금은 (주)대동애그테크에서 미래 농업 솔루션을 개발하는 본부를 총괄하고 있다. 『객체에서 함수로』(길벗, 2024), 『코틀린 함수형 프로그래밍』(에이콘, 2023) 등 코틀린 서적을 여러 권 번역했고, 코틀린 외에도 『실전 파이썬 핸즈온 프로젝트』(책만, 2022), 『읽고 나면 진짜 쉬워지는 자료 구조』(길벗, 2024) 등 다양한 프로그래밍 언어와 프로그래밍 기술에 대한 책을 30여 권 번역했으며, 『핵심 코틀린 프로그래밍』(에이콘, 2023) 책을 쓴 저자이기도 하다.