| 000 | 00000cam c2200205 c 4500 | |
| 001 | 000045985447 | |
| 005 | 20190604092633 | |
| 007 | ta | |
| 008 | 190603s2018 ulka 001c kor | |
| 020 | ▼a 9791161751283 ▼g 94000 | |
| 020 | 1 | ▼a 9788960772106 (Set) |
| 035 | ▼a (KERIS)BIB000014760951 | |
| 040 | ▼a 241050 ▼c 241050 ▼d 241050 ▼c 241050 ▼d 211009 | |
| 041 | 1 | ▼a kor ▼h eng |
| 082 | 0 4 | ▼a 006.31 ▼2 23 |
| 085 | ▼a 006.31 ▼2 DDCK | |
| 090 | ▼a 006.31 ▼b 2018z36 | |
| 100 | 1 | ▼a Lesmeister, Cory |
| 245 | 1 0 | ▼a R로 마스터하는 머신 러닝 : ▼b 업무에 활용할 수 있는 선형모델에서 딥러닝까지 / ▼d 코리 레즈마이스터 지음 ; ▼e 김종원 [외]옮김 |
| 246 | 1 9 | ▼a Mastering machine learning with R : ▼b advanced prediction, algorithms, and learning methods with R 3.x ▼g (2nd ed.) |
| 260 | ▼a 서울 : ▼b 에이콘, ▼c 2018 | |
| 300 | ▼a 550 p. : ▼b 삽화(일부천연색) ; ▼c 24 cm | |
| 500 | ▼a 부록: A. R의 기본, B. 자료 출처 | |
| 500 | ▼a 공역자: 김태영, 류성희, 이호 | |
| 500 | ▼a 색인수록 | |
| 650 | 0 | ▼a Machine learning |
| 650 | 0 | ▼a R (Computer program language) |
| 700 | 1 | ▼a 김종원, ▼e 역 |
| 700 | 1 | ▼a 김태영, ▼e 역 |
| 700 | 1 | ▼a 류성희, ▼e 역 |
| 700 | 1 | ▼a 이호, ▼e 역 |
| 900 | 1 0 | ▼a 레즈마이스터, 코리, ▼e 저 |
| 945 | ▼a KLPA |
소장정보
| No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
|---|---|---|---|---|---|---|---|
| No. 1 | 소장처 중앙도서관/제2자료실(3층)/ | 청구기호 006.31 2018z36 | 등록번호 111810515 (11회 대출) | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
컨텐츠정보
책소개
통계 계산과 그래픽에 특화된 언어인 R을 사용해 머신 러닝을 배우는데 필요한 여러 통계적 기법을 실제 사례에 적용하며 설명한다. 복잡한 수식이나 전문 프로그래밍 기법을 사용하지 않으면서, 선형 회귀에서부터 분류 문제나 딥러닝, 추천 시스템, 군집화, 시계열 분석, 텍스트 마이닝까지 머신 러닝의 거의 전 영역에 대해 실제 데이터를 이용해 간결한 R 코드로 명확하게 설명한다.
통계 계산과 그래픽에 특화된 언어인 R을 사용해 머신 러닝을 배우는데 필요한 여러 통계적 기법을 실제 사례에 적용하며 설명한다. 복잡한 수식이나 전문 프로그래밍 기법을 사용하지 않으면서, 선형 회귀에서부터 분류 문제나 딥러닝, 추천 시스템, 군집화, 시계열 분석, 텍스트 마이닝까지 머신 러닝의 거의 전 영역에 대해 실제 데이터를 이용해 간결한 R 코드로 명확하게 설명한다. 기초 통계와 프로그래밍을 조금 할 줄 안다면 더욱 더 이해하기 쉬울 것이다.
★ 이 책에서 다루는 내용 ★
■ 실제 업계에서 머신 러닝 도구를 적용하는 방법
■ R을 사용해 데이터를 분석하기 전에 효과적으로 준비하는 작업
■ 데이터를 효과적으로 시각화하는 방법
■ 분석을 위해 학습용 데이터 세트와 테스트용 데이터 세트를 만드는 이유와 방법에 대한 이해
■ 가장 기본적인 머신 러닝 방법인 선형 회귀와 로지스틱 회귀
■ 서포트 벡터 머신 같은 심화 머신 러닝 방법 이해
■ 아마존 클라우드 서비스에서 R 사용하기
★ 이 책의 대상 독자 ★
데이터 과학자, 데이터 분석가, R을 이용해 머신 러닝을 하는, 실무 지식이 있는 사람들 대상으로 한다. 갖고 있는 기술을 한 단계 더 끌어올려 이 분야에서 전문가가 되고 싶은 사람을 위한 책이다.
★ 2판에 추가된 내용 ★
1장, '성공을 위한 과정'에서는 순서도상의 오타를 정정하고 새로운 방법론을 추가했다.
2장, '선형 회귀 - 머신 러닝의 기본 기술'에서는 코드를 개선하고 좀 더 나은 도표를 넣었다. 이를 제외하면 초판과 가까운 편이다.
3장, '로지스틱 회귀와 판별 분석'에서는 코드를 개선하고 정리했다. 좋아하는 기법인 다변량 적응 회귀 스프라인(multivariate adaptive regression spline)을 추가했는데, 잘 동작하고 비선형 데이터를 다룰 수 있으며 사용하기도 쉽다. 이를 기준 모형으로 사용해 다른 "도전자" 모형들이 이보다 더 성능이 좋은지 살펴본다.
4장, '선형 모형에서 고급 피처 선택'에서는 회귀뿐만 아니라 분류 문제도 다룬다.
5장, '다른 분류 기법들 - K-최근접 이웃법과 서포트 벡터 머신'에서는 코드를 정리했다.
6장, '분류 트리와 회귀 트리'에서는XG부스트(XGBoost) 패키지가 제공하는 매우 좋은 기법을 사용하는 것과 피처를 선택할 때 랜덤 포레스트(random forest) 기법을 사용을 추가했다.
7장, '신경망과 딥러닝'에서는 딥러닝 방법에 관한 최신 정보를 넣었고, 하이퍼파라미터(hyperparameter) 검색을 포함해 H2O 패키지에 관련된 코드를 개선했다.
8장, '군집화 분석'에서는 랜덤 포레스트를 이용해 비지도학습(unsupervised learning)을 하는 방법을 넣었다.
9장, '주성분 분석'에서는 다른 데이터 세트를 사용하고, 표본 외 예측(out-of-sample prediction)을 추가했다.
10장, '장바구니 분석, 추천 엔진과 순차적 분석'에서는 영업 분야에서 점점 더 중요해지고 있는 순차적 분석(sequential analysis)을 추가했다.
11장, '앙상블 생성과 다중 클래스 분류'에서는 여러 좋은 패키지를 사용해 완전히 새롭게 썼다.
12장, '시계열 자료와 인과관계'에서는 몇 년간의 기후 자료를 더 추가했고, 인과관계를 검사하는 여러 방법을 보여준다.
13장, '텍스트 마이닝'에서는 데이터를 추가하고 코드를 개선했다.
14장, '클라우드에서 R 사용하기'에서는 클라우드에서 R을 사용하는 법을 쉽고 빠르게 배울 수 있다.
부록 A. 'R의 기본'에서는 데이터를 다루는 방법을 추가했다.
부록 B. '자료 출처'에서는 자료 출처와 참고 자료의 목록을 작성했다.
정보제공 :
저자소개
코리 레즈마이스터(지은이)
10년 넘게 정량 분석에 관련된 일을 해왔으며, 현재 금융계에서 정량 분석 관리자로서 마케팅과 통제 모형을 만드는 일을 하고 있다. 일라이 릴리(Eli Lilly and Company)에서 16년간 일하면서 영업과 시장 분석, 린 식스 시그마(Lean Six Sigma), 시장 분석, 새 제품 예측 등의 일을 했다. 미국 육군에서 복무했으며, 2009년에는 이라크 바그다드에서 2만 9,000명 규모의 이라크 원유 경찰의 전략 고문으로 일하면서 이라크가 원유 관련 산업 시설들을 안전하게 보호하는데 필요한 장비를 공급했다. 비행기 애호가로서 노스 다코다 대학(University of North Dakoda)에서 항공 관리학으로 학사 학위를 받았고, 상용 헬리콥터 자격증을 갖고 있다.
이호(옮긴이)
대학교 동아리에서 컴퓨터 프로그래밍을 배워 한국에서 여러 소프트웨어 벤처에서 경력을 쌓았다. 이후 미국에 건너가 퀄컴, 엔비디아 등에서 리눅스 커널과 시스템 프로그래밍 관련 일을 했으며, 현재 뉴욕주에 있는 헤지펀드에서 소프트웨어 엔지니어로 일하고 있다. 역서로는 『리눅스 커널의 이해』(한빛미디어, 2003)가 있다.
김종원(옮긴이)
여섯 살 딸아이의 아빠로서 초등학생 때부터 프로그래밍을 시작하여 38년째 프로그래밍을 하고 있다. 과학소설과 만화를 좋아하며 새로운 것에 늘 관심이 많다. 『세계 최초의 프로그래머 에이다 러블레이스』, 『컴퓨터 코딩의 여왕 그레이스 호퍼』, 『코믹 SF 걸작선』, 『윈도우 7 프로그래밍』, 『R로 마스터하는 머신러닝』 등을 번역했다. 현재 엔씨소프트에서 테스트 자동화 연구를 하고 있다.
김태영(옮긴이)
고등학교 시절 영화 월-E(Wall-E)를 보고 AI를 전공하기로 결심했다. 미국에서 석사를 마친 후 엔씨소프트에서 배운 것들을 사용해볼 기회를 호시탐탐 엿보고 있다.
류성희(옮긴이)
산업공학을 전공하고 금융관련 SI 업체에서 프로그래머로 일하다가 생태학과 환경에 관심이 생겨 농업 생태계 모델링을 공부하기 위해 유학을 갔으나 늦깎이로 통계학을 시작해 현재 아이오와 대학 통계학 박사 과정에 있다. 공부는 평생 하는 것이고, 언제든 다시 시작할 수 있다고 생각한다.
목차
1장. 성공을 위한 과정 __CRISP-DM 모형화 기법 __비즈니스 이해 ____비즈니스의 목적을 확인하는 것 ____현재의 상황 판단 ____분석적 목표의 결정 ____프로젝트의 진행 계획을 만드는 것 __데이터 이해 __데이터 준비 __모형화 __평가적용알고리즘 순서도 __요약 2장. 선형 회귀-머신 러닝의 기본 기 __단변량 선형 회귀 ____비즈니스 이해하기 __다변량 선형 회귀 ____비즈니스 이해하기 ____데이터의 이해와 준비 과정 ____모형화와 평가 __선형 모형에서 다른 고려사항 ____질적 피처 ____상호작용 항 __요약 3장. 로지스틱 회귀와 판별 분석 __분류 방법 및 선형 회귀 __로지스틱 회귀 ____비즈니스 이해하기 ____데이터의 이해와 준비 과정 ____모형화와 평가 ________로지스틱 회귀 모형 ________교차 검증을 포함한 로지스틱 회귀 __판별 분석의 개요 ____판별 분석의 적용 __다변량 적응 회귀 스플라인(MARS) 모__형 선택 __요약 4장. 선형 모형에서 고급 피처 선택 __규제화(regularization)란? ____능형 회귀 분석 ____LASSO ____일래스틱넷 __비즈니스 사례 ____비즈니스 이해하기 ____데이터의 이해와 준비 과정 __모형화와 평가.. ____최량 부분 집합 ____능형 회귀 분석 ____LASSO ____일래스틱넷 ____glmnet을 사용한 교차 검증 __모형 선택 __규제화와 분류 ____로지스틱 회귀의 예 __요약 5장. 다른 분류 기법들 - K-최근접 이웃법과 서포트 벡터 머신 __K-최근접 이웃법 __서포트 벡터 머신 __비즈니스 사례 ____비즈니스 이해하기 ____데이터의 이해와 준비 과정 ____모형화와 평가 ________최근접 이웃(KNN) 모형화 ________서포트 벡터 머신 모형화. ____모형 선택 __서포트 벡터 머신에서의 피처 선택 __요약 6장. 분류 트리와 회귀 트리 __개괄적인 방법 ____회귀 트리 ____분류 트리 ____랜덤 포레스트(무작위의 숲) ____그레이디언트 부스트(경사 부양 기법) __비즈니스 사례 ____모형화 및 평가 ________회귀 트리 ________분류 트리 ________랜덤 포레스트 회귀 분석(random forest regression) ________랜덤 포레스트 분류 ________익스트림 그레디언트 부스트 기법 - 분류 ____모형 선정. ____랜덤 포레스트를 사용한 피처 선택 __요약 7장. 신경망과 딥러닝 __신경망 소개 __딥러닝, 간단히 살펴보기 ____딥러닝을 위한 자료와 심화 기법 __비즈니스의 이해 __데이터의 이해와 준비 과정 __모형화와 평가 __딥러닝 예제 ____H2O의 배경 ____데이터를 H2O에 업로드하기 ____훈련 및 테스트 데이터 세트 생성 ____모형화 __요약 8장. 군집화 분석 __계층적 군집화 ____거리 계산 __K-평균 군집화 __가워와 중간점 구역 분할 ____가워 비유사성 계수 ____중간점 구역 분할 군집화(PAM) __랜덤 포레스트 __비즈니스 이해하기 __데이터 이해와 준비 과정 __모형화와 평가 ____계층적 군집화 __K-평균 군집화 ____가워와 중간점 구역 분할 ____랜덤 포레스트와 중간점 구역 분할 __요약 9장. 주성분 분석 __주성분의 개요 ____회전 __비즈니스 이해하기 ____데이터의 이해와 준비 과정 __모형화와 평가 ____성분 추출 ____직각 회전과 해석 ____성분으로부터 요인 점수 생성 ____회귀 분석 __요약 10장. 장바구니 분석, 추천 엔진과 순차적 분석 __장바구니 분석의 개요 __비즈니스 이해하기 __데이터의 이해와 준비 과정 __모형화와 평가 __추천 엔진의 개요 ____사용자 기반 협업 필터링 ____아이템 기반 협업 필터링 ____특이값 분해와 주성분 분석 __비즈니스 이해와 추천 __데이터의 이해와 준비 과정과 추천 __모형화와 평가 그리고 추천하기 __순차적 데이터 분석 ____순차적 데이터 분석의 적용 __요약 11장. 앙상블 생성과 다중 클래스 분류 __앙상블 __비즈니스와 데이터 이해하기 __모형화와 평가 그리고 선택 __비즈니스와 데이터 이해하기 __모형 평가와 선택 ____랜덤 포레스트 ____능형 회귀 분석 __MLR에서의 앙상블 __요약 12장. 시계열 자료와 인과관계 __단변량 시계열 분석 ____그랜저 인과관계 이해하기 __비지니스 이해하기 ____데이터의 이해와 준비 과정 __모형화와 평가 ____단변량 시계열 예측 ____인과관계의 검사 ________선형 회귀 ________벡터 자기회귀 모형(Vector autoregression) __요약 13장. 텍스트 마이닝 __텍스트 마이닝 프레임워크와 기법 __주제(topic) 모형 ____그 밖의 정량 분석 기법 __비즈니스 이해 ____데이터의 이해와 준비 __모형화와 평가 ____단어 빈도와 주제 모형 ____또 다른 양적 분석 기법 __요약 14장. 클라우드에서 R 사용하기 __아마존 웹 서비스 계정 생성하기 ____가상 머신 실행 ____RStudio 시작하기 __요약 부록. A R의 기본 __R을 실행하기 __R 사용하기 __데이터 프레임과 행렬 __요약 통계 내기 __패키지를 설치하고 로드하기 __dplyr 패키지를 이용해 데이터 다루기 __요약 부록 B. 자료 출처



