고려대학교 세종학술정보원

이전 결과로 돌아가기 검색화면

MARC

Building machine learning systems with Python : scikit-learn 라이브러리로 구현하는 기계 학습 시스템 (33회 대출)

자료유형

단행본

개인저자

Richert, Willi Coelho, Luis Pedro, 저 전철욱, 역

서명 / 저자사항

Building machine learning systems with Python : scikit-learn 라이브러리로 구현하는 기계 학습 시스템 / 윌리 리커트, 루이스 페드로 코엘류 지음 ; 전철욱 옮김

발행사항

의왕 : 에이콘, 2014

형태사항

317 p. : 삽화, 도표 ; 24 cm

총서사항

acorn+PACKT technical book 시리즈

원표제

Building machine learning systems with Python

ISBN

9788960775367

일반주기

색인수록
기술감수자: 마티유 브루쉐르(Matthieu Brucher), 마이크 드리즈콜(Mike Driscoll), 모리스 링(Maurice HT Ling)

일반주제명

Multimedia systems Programming languages (Electronic computers) Machine learning Python (Computer program language)

000		00000nam c2200205 c 4500
001		000045795534
005		20230224163138
007		ta
008		140408s2014 ggkad 001c kor
020		▼a 9788960775367 ▼g 94000
040		▼a 211009 ▼c 211009 ▼d 211009
041	1	▼a kor ▼h eng
082	0 4	▼a 005.13/3 ▼a 006.4 ▼2 23
085		▼a 005.133 ▼2 DDCK
090		▼a 005.133 ▼b P999 2014z1
100	1	▼a Richert, Willi
245	1 0	▼a Building machine learning systems with Python : ▼b scikit-learn 라이브러리로 구현하는 기계 학습 시스템 / ▼d 윌리 리커트, ▼e 루이스 페드로 코엘류 지음 ; ▼e 전철욱 옮김
246	0 9	▼a Building machine learning systems with Python
260		▼a 의왕 : ▼b 에이콘, ▼c 2014
300		▼a 317 p. : ▼b 삽화, 도표 ; ▼c 24 cm
440	0 0	▼a acorn+PACKT technical book 시리즈
500		▼a 색인수록
500		▼a 기술감수자: 마티유 브루쉐르(Matthieu Brucher), 마이크 드리즈콜(Mike Driscoll), 모리스 링(Maurice HT Ling)
650	0	▼a Multimedia systems
650	0	▼a Programming languages (Electronic computers)
650	0	▼a Machine learning
650	0	▼a Python (Computer program language)
700	1	▼a Coelho, Luis Pedro, ▼e 저
700	1	▼a 전철욱, ▼e 역 ▼0 AUTH(211009)1319
900	1 0	▼a 리커트, 윌리, ▼e 저
900	1 0	▼a 코엘류, 루이스 페드로, ▼e 저
945		▼a KLPA

소장정보

No.	소장처	청구기호	등록번호	도서상태	반납예정일	예약	서비스
No. 1	소장처 과학도서관/Sci-Info(1층서고)/	청구기호 005.133 P999 2014z1	등록번호 121229428 (33회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M
No. 2	소장처 세종학술정보원/학과비치/	청구기호 컴퓨터정보학과 005.133 P999 2014z1	등록번호 151324104	도서상태 대출불가(열람가능)	반납예정일	예약	서비스 M ?

No.	소장처	청구기호	등록번호	도서상태	반납예정일	예약	서비스
No. 1	소장처 과학도서관/Sci-Info(1층서고)/	청구기호 005.133 P999 2014z1	등록번호 121229428 (33회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M

No.	소장처	청구기호	등록번호	도서상태	반납예정일	예약	서비스
No. 1	소장처 세종학술정보원/학과비치/	청구기호 컴퓨터정보학과 005.133 P999 2014z1	등록번호 151324104	도서상태 대출불가(열람가능)	반납예정일	예약	서비스 M ?

컨텐츠정보

책소개

acorn+PACKT 시리즈. 파이썬을 활용해 대표적인 Scikit-learn 오픈소스 라이브러리로 실제 기계 학습 시스템을 구현하는 방법을 보여주는 책이다. 일반적인 CSV 데이터가 아닌 독자들이 실제로 해 보고 싶었던 문제인 위키피디아의 주제별 분류, 트위터의 감성 분류, 영화 추천, 사진의 범주적 분류, MP3의 음악 장르 분류 등을 기계 학습을 통해 구현하며 각 기법을 평가한다.

또한, 빅 데이터 시대에 맞춰 대량의 데이터를 빠르게 처리하는 기계 학습환경을 구축해 본다. 파이썬과 NumPy, SciPy, scikit-learn 등 다양한 라이브러리를 사용하여 파이썬의 생태계를 이해할 수 있으며 파이썬 언어를 좀더 깊이 이해할 수 있다.

텍스트, 이미지, 사운드를 적용하는 분류 시스템 개발, 파이썬 오픈소스 라이브러리 Scikit-learn, 이미지 처리와 컴퓨터 비전을 위한 mahotas 라이브러리, 위키피디아 전체를 모델로 하는 주제 모델링, 장바구니 분석을 사용해 추천 준비 등을 다루고 있다.

이 책은 오픈소스 라이브러리를 사용해 기계 학습을 수행하는 방법을 배우고자 하는 파이썬 프로그래머를 대상으로 한다. 현실적인 예제를 기반으로 기계 학습의 기본 방식을 둘러본다. 또한 파이썬을 사용해 시스템을 만들기 시작하려는 기계 학습자도 대상으로 한다.

★ 요약 ★

파이썬을 활용해 대표적인 Scikit-learn 오픈소스 라이브러리로 실제 기계 학습 시스템을 구현하는 방법을 보여주는 책이다. 일반적인 CSV 데이터가 아닌 독자들이 실제로 해 보고 싶었던 문제인 위키피디아의 주제별 분류, 트위터의 감성 분류, 영화 추천, 사진의 범주적 분류, MP3의 음악 장르 분류 등을 기계 학습을 통해 구현하며 각 기법을 평가한다. 또한, 빅 데이터 시대에 맞춰 대량의 데이터를 빠르게 처리하는 기계 학습환경을 구축해 본다. 파이썬과 NumPy, SciPy, scikit-learn 등 다양한 라이브러리를 사용하여 파이썬의 생태계를 이해할 수 있으며 파이썬 언어를 좀더 깊이 이해할 수 있다.

★ 이 책에서 다루는 내용 ★

■ 텍스트, 이미지, 사운드를 적용하는 분류 시스템 개발
■ 파이썬 오픈소스 라이브러리 Scikit-learn
■ 이미지 처리와 컴퓨터 비전을 위한 mahotas 라이브러리
■ 위키피디아 전체를 모델로 하는 주제 모델링
■ 장바구니 분석을 사용해 추천 준비
■ 데이터 분석을 위한 jug 패키지
■ 클라우드에서 분석을 실행하고자 아마존 웹 서비스 활용
■ 과거 구매를 기반으로 사용자에게 제품 추천하기

★ 이 책의 대상 독자 ★

이 책은 오픈소스 라이브러리를 사용해 기계 학습을 수행하는 방법을 배우고자 하는 파이썬 프로그래머를 대상으로 한다. 현실적인 예제를 기반으로 기계 학습의 기본 방식을 둘러본다.
이 책은 또한 파이썬을 사용해 시스템을 만들기 시작하려는 기계 학습자도 대상으로 한다. 파이썬은 빠른 프로토타이핑을 위한 유연한 언어다. 반면 기본적인 알고리즘 모두는 C나 C++로 최적화해 작성됐다. 그러므로 결과 코드는 제품에 사용하기에 충분히 빠르고 강건하다.

★ 이 책의 구성 ★

1장, 기계 학습 파이썬으로 시작하기 매우 단순한 예제로 기계 학습의 기본적인 개념을 소개한다. 단순하지만 과적합(overfitting)의 위험을 제기한다.
2장, 실제 예제를 이용한 분류법 학습 분류에 대해 배울 실제 데이터를 설명하고 꽃의 범주를 구별할 수 있도록 컴퓨터를 훈련한다.
3장, 군집화: 관련된 게시물 찾기 단어 주머니(bag-of-words) 접근법이 게시물에 대한 이해 없이 유사한 게시물 찾기에 적용할 때 얼마나 뛰어난지 설명한다.
4장, 주제 모델링 각 게시물을 하나의 군집으로 배정하는 것을 넘어, 실제 텍스트가 여러 주제에 속하듯이 게시물이 몇몇 주제에 어떻게 배정되는지 보여준다.
5장, 분류 I: 형편없는 답변 감지 질문에 대한 사용자의 답변이 좋은지 나쁜지를 판단하기 위한 로지스틱 회귀(logistic regression)의 사용법을 설명한다. 이와 더불어, 기계 학습 모델을 분석하기 위해 편향(bias)과 변화량(variance)의 균형을 어떻게 사용하는지도 배운다.
6장, 분류II: 감성 분석 나이브 베이즈(Naive Bayes)가 어떻게 작동하는지 소개하고, 트윗이 긍정적인지 부정적인지를 분류하는 데 나이브 베이즈를 어떻게 사용하는지 알아본다.
7장, 회귀: 추천 데이터를 다루는 고전적인 주제를 이야기한다. 그러나 이 고전적인 주제는 오늘날까지도 적절하다. 추천 시스템을 만들기 위해 이를 사용하고자 한다. 이 시스템은 새로운 제품을 추천하기 위해 좋고 싫음에 대해 사용자의 입력을 받는다.
8장, 회귀: 향상된 추천 동시에 여러 가지 기법을 사용해 추천을 향상시킨다. 평점 데이터(사용자가 항상 제공하진 않는다) 없이 쇼핑 데이터로부터 추천을 어떻게 만드는지 알아본다.
9장, 분류III: 음악 장르 분류 무작위의 수많은 노래를 기계 학습기가 분류할 수 있는 방법을 알아본다. 우리 스스로 속성을 만들기보다는 누군가의 전문 지식을 믿는 편이 더 괜찮을 때도 있음을 보여준다.
10장, 컴퓨터 비전: 패턴 인식 이미지를 다루는 구체적인 영역인 패턴 인식 분야에서 분류를 어떻게 적용하는지 설명한다.
11장, 차원 수 줄이기 기계 학습 알고리즘에 잘 적용할 수 있도록 데이터의 크기를 줄이는 그 밖의 기법들을 알아본다.
12장, (조금 더 큰) 빅데이터 데이터 크기가 어떻게 점점 커지는지를 설명하고 이런 점이 분석에서 자주 문제가 되는 이유를 설명한다. 이 장에서는 멀티코어와 컴퓨팅 클러스터의 장점을 활용해 좀 더 큰 데이터를 다루는 기법들을 살펴본다. 클라우드 컴퓨팅을 사용해 소개한다(클라우드 제공자로서 아마존의 웹 서비스를 사용한다).
부록, 기계 학습에 대한 보충 자료 기계 학습에 대한 훌륭한 리소스 목록이 실려 있다.

★ 저자 서문 ★

이 책을 만난 건 좋은 인연이다. 무엇보다, 수많은 독자가 읽는 수백만 권의 책이 매년 출판되는 와중에 여러분은 이 책을 읽고 있다. 몇몇 기계 학습 알고리즘이 여러분을 이 책으로 이끄는 중요한 역할을 했을 수도 있다. 그리고 우리 저자들은 여러분이 방법(how)과 이유(why)를 좀 더 이해하고자 한다는 사실에 행복하다.
이 책의 대부분은 방법을 다룬다. 기계 학습 알고리즘이 데이터를 최대한 잘 활용하기 위해서는 데이터를 어떻게 다뤄야 할까? 어떻게 문제에 즉시 적용할 수 있는 적합한 알고리즘을 선택할 수 있을까?
가끔은 이유도 다룬다. 왜 정확하게 측정하는 일이 중요한가? 왜 주어진 시나리오에서 어떤 알고리즘은 다른 알고리즘보다 좋은 성능을 내는가?
이 분야에서 전문가가 되려면 배워야 할 내용이 훨씬 많다. 여기서 다루는 '어떻게'와 '왜'는 그중 일부일 뿐이지만, 결국에는 이 혼이 여러분이 가능한 한 빨리 전문가가 되는 밑거름이 되길 바란다.

정보제공 :

펼치기

저자소개

윌리 리커트(지은이)

다양한 로봇이 모방 학습을 하도록 강화 학습(reinforcement learning), 은닉 마코프 모델(hidden Markov models), 베이즈 네트워크(Bayesian network)를 활용하는 기계 학습과 로보틱스 박사 학위자이다. 현재 마이크로소프트 빙(Bing)의 코어 렐러번스 팀(Core Relevance Team)에서 일하고 있다. 액티브 학습과 통계적 기계 번역 같은 다양한 기계 학습에 관여하고 있다.

루이스 페드로 코엘류(지은이)

생체 시스템을 이해하려, 컴퓨터를 사용하는 전산 생물 학자다. 특히, 미생물의 행위를 특징짓기 위해 미생물군집(microbial communities)에서 나온 DNA를 분석하고 있다. 그는 생체 표본 이미지를 분석하는 데 기계 학습 기술을 활용하는 분야인 바이오이미지 인포매틱스(Bioimage Informatics)에 관련된 일도 한다. 주 관심사는 대용량 이미지 데이터 처리다. 기계 학습 분야에서 세계적인 대학 중 하나인 카네기 멜론 대학교(Carnegie Mellon University)의 박사 학위자이며, 몇몇 과학 출판물의 저자이기도 하다. 리스본 기술 대학교(Technical University of Lisbon) 컴퓨터 학과에서 배운 것을 실제 코드로 적용하고자 1998년부터 오픈소스 소프트웨어를 개발하기 시작했다. 2004년부터 파이썬으로 개발하기 시작했으며, 몇몇 오픈소스 라이브러리에 기여했다. 기계 학습 코드의 기여자뿐만 아니라 인기 있는 파이썬 컴퓨터 비전 패키지와 mahotas의 리더 개발자다. 현재 룩셈부르크와 하이델베르크를 오가며 생활하고 있다.

전철욱(옮긴이)

웹의 개방성, 파이썬의 기민성, 기계 학습의 예측성을 좋아한다. 공익을 위한 재능을 만들고자 노력 중이다. 호주에서 여우 세 마리에게 잡혀 살고 있다. 에이콘출판사의 『파이썬과 기계 학습』(2015), 『Julia 프로그래밍』(2015), 『Building Machine Learning Systems with Python 한국어판 (개정판)』(2015)과 『R을 활용한 기계 학습』(2014)을 번역했다.