| 000 | 00000cam c2200205 c 4500 | |
| 001 | 000045857144 | |
| 005 | 20240717151135 | |
| 007 | ta | |
| 008 | 160113s2014 ulka b 001c kor | |
| 020 | ▼a 9788966261055 ▼g 13000 | |
| 035 | ▼a (KERIS)BIB000013370657 | |
| 040 | ▼a 247017 ▼c 211009 ▼d 211009 | |
| 041 | 1 | ▼a kor ▼h eng |
| 082 | 0 4 | ▼a 005.1 ▼2 23 |
| 085 | ▼a 005.1 ▼2 DDCK | |
| 090 | ▼a 005.1 ▼b 2014z9 | |
| 100 | 1 | ▼a Conway, Drew |
| 245 | 2 0 | ▼a (해커 스타일로 배우는) 기계학습 : ▼b 들여다보고, 쪼개보고, 직접 만들며 배우는 데이터 분석 / ▼d 드류 콘웨이, ▼e 존 마일즈 화이트 지음 ; ▼e 김진홍 옮김 |
| 246 | 1 9 | ▼a Machine learning for hackers |
| 260 | ▼a 서울 : ▼b 인사이트, ▼c 2014 | |
| 300 | ▼a xvi, 312 p. : ▼b 삽화(일부천연색) ; ▼c 24 cm | |
| 440 | 0 0 | ▼a Programming insight |
| 504 | ▼a 참고문헌(p. 306-307)과 색인수록 | |
| 650 | 0 | ▼a Computer algorithms |
| 650 | 0 | ▼a Electronic data processing ▼x Automation |
| 700 | 1 | ▼a White, John Myles, ▼e 저 |
| 700 | 1 | ▼a 김진홍, ▼e 역 ▼0 AUTH(211009)164737 |
| 900 | 1 0 | ▼a 콘웨이, 드류, ▼e 저 |
| 900 | 1 0 | ▼a 화이트, 존 마일즈, ▼e 저 |
| 945 | ▼a KLPA |
소장정보
| No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
|---|---|---|---|---|---|---|---|
| No. 1 | 소장처 과학도서관/Sci-Info(1층서고)/ | 청구기호 005.1 2014z9 | 등록번호 121235311 (18회 대출) | 도서상태 분실(장서관리) | 반납예정일 | 예약 | 서비스 |
컨텐츠정보
책소개
기계학습의 12개 기법을 대한 훌륭한 사례들이 담겨 있는 책. 이론을 설명하는 대신 과정에 초점을 맞췄기 때문에, 프로그래밍을 조금 할 줄 알고 정량적으로 사고할 줄 아는 사람이면 누구나 이해하기 쉽다. 각 장은 분류, 예측, 최적화, 추천 문제와 같이 기계학습의 특정 문제들에 초점을 맞춘다. 독자들은 R 프로그래밍 언어를 사용해서 샘플 데이터를 분석하는 법과 간단한 기계학습 알고리즘을 작성하는 법을 배우게 될 것이다.
들여다보고, 쪼개보고, 직접 만들며 배우는 데이터 분석
프로그래밍 경력이 있고 데이터 처리에 관심이 있다면, 이 책으로 기계학습을 배워보도록 하자. 이 책에는 기계학습의 12개 기법을 대한 훌륭한 사례들이 담겨 있다. 이론을 설명하는 대신 과정에 초점을 맞췄기 때문에, 프로그래밍을 조금 할 줄 알고 정량적으로 사고할 줄 아는 사람이면 누구나 이해하기 쉽다.
각 장은 분류, 예측, 최적화, 추천 문제와 같이 기계학습의 특정 문제들에 초점을 맞춘다. 독자들은 R 프로그래밍 언어를 사용해서 샘플 데이터를 분석하는 법과 간단한 기계학습 알고리즘을 작성하는 법을 배우게 될 것이다. 경영, 행정, 학문 연구 등 여러 배경의 프로그래머들이 '기계학습'을 배우는 이상적인 책이다.
*책에서 다루는 내용
- 이메일 텍스트를 분석하는 단순 베이즈 분류기를 작성해서 스팸 여부 알아내기
- 선형 회귀를 이용해서 상위 1,000등 웹사이트의 페이지뷰 예측하기
- 최적화 기법을 이용해서 간단한 문자 암호 해독하기
- 미국 상원의원 들의 투표기록을 이용해서 통계적으로 비교, 대조하기
- 트위터 데이터를 활용해서 "팔로우 추천" 시스템 구축하기
정보제공 :
저자소개
드류 콘웨이(지은이)
뉴욕대학의 정치학 박사후보생이다. 드류는 수학, 통계학, 전산학을 도구로 활용해서 국제관계, 분쟁, 테러리즘 현상을 깊게 이해하려는 연구를 수행 중이다. 그의 학문적 호기심은 미국 정보 및 안보 기관에서 분석가로 활동한 경력에 영향을 받았다.
존 마일즈 화이트(지은이)
프린스턴대 심리학과의 박사과정생으로, 사람들의 의사결정에 대해 이론 및 실험적으로 연구하고 있다. 존은 학계 밖에서 데이터분석을 오픈소스 소프트웨어로 하는 데이터과학 운동에 깊게 관여하고 있다. 그는 ProjectTemplate와 log4r 등의 몇 가지 유명한 R 패키지의 주요 관리자maintainer이기도 하다.
김진홍(옮긴이)
서울대 물리학과 복잡계네트워크 연구실에서 통계 물리학을 전공하고, IT 업계에서 데이터 분석 및 모델링에 관련한 일을 계속 해왔다. 데이터에 담겨 있는 흥미로운 이야기를 다른 이에게 들려 주어 그 변화에 일조할 수 있는 사람이 되는 것이 목표다. 옮긴 책으로는 《아름다운 시각화》, 《해커 스타일로 배우는 기계학습》, 《디자이닝 인포메이션》, 《정보 검색의 이론과 실제》가 있다.
목차
1장 R 사용하기 _1.1 기계학습을 위한 R __1.1.1 R 다운로드와 설치 __1.1.2 IDE와 텍스트 편집기 __1.1.3 R 패키지 설치 및 로드하기 __1.1.4 기계학습을 위한 R 기초 __1.1.5 R에 대해 더 읽을거리 2장 데이터 탐색(data exploration) _2.1 탐색(exploration) 대 확증(confirmation) _2.2 데이터란 무엇인가? _2.3 열의 데이터 형식 알아내기 _2.4 의미 추측 _2.5 수치요약 _2.6 평균값, 중앙값, 최빈값(mode) _2.7 분위수(Quantile) _2.8 표준편차와 분산 _2.9 탐색적 데이터 시각화 _2.10 열 간 관계성을 시각화하기 3장 분류: 스팸 필터 _3.1 이것 아니면 저것: 이항 분류 _3.2 조건부 확률을 찬찬히 알아보기 _3.3 베이즈 스팸 분류기 개발 __3.3.1 분류기를 정의하고 고난도 햄 데이터로 검증하기 __3.3.2 모든 이메일 종류에 대해 분류기 검증 __3.3.3 결과 개선 4장 순위 매기기: 자동 분류함(priority inbox _4.1 순서를 모르는 대상을 어떻게 정렬할까? _4.2 이메일 메시지를 우선순위에 따라 정렬하기 __4.2.1 이메일의 우선순위 특성 _4.3 자동분류함 작성 __4.3.1 특성값 추출을 위한 함수들 __4.3.2 등급을 위한 가중치 설정법 __4.3.3 이메일 스레드 활동에 대한 가중치 설정 __4.3.4 학습 및 검증 5장 회귀 모형: 페이지 방문 수 예측 _5.1 회귀 소개 __5.1.1 기본 모형 __5.1.2 가변수를 활용한 회귀 __5.1.3 선형 회귀 간단 설명 _5.2 웹 트래픽 예측 _5.3 상관계수 정의 6장 정규화: 텍스트 회 _6.1 데이터 열 사이의 비선형 관계: 직선을 넘어서 __6.1.1 다항식 회귀 소개 _6.2 과대적합을 막는 방법 __6.2.1 정규화를 이용한 과대적합 방지 _6.3 텍스트 회귀 __6.3.1 로지스틱 회귀로 빠져나가기 7장 최적화: 암호 해 _7.1 최적화에 대한 소개 _7.2 능선 회귀(Ridge Regression) _7.3 최적화로 암호해독하기 8장 PCA: 주가 지수 작성 _8.1 자율학습(Unsupervised Learning) 9장 MDS: 미국 상원의원 유사성을 시각적으로 탐색하 _9.1 유사성에 기반한 군집화 __9.1.1 다차원 척도법과 거리 측도에 대한 간략 소개 _9.2 미 상원의원들은 어떻게 뭉쳐있는가? __9.2.1 미국 상원 기명 투표 데이터 10장 kNN: 추천 시스템 _10.1 k-근접 이웃 알고리즘 _10.2 R 패키지 설치 데이터 11장 소셜 네트워크 분 _11.1 소셜 네트워크 분석 __11.1.1 네트워크로 생각하기 _11.2 트위터 소셜 네트워크 데이터 해킹하기 __11.2.1 구글 소셜그래프(SocialGraph) API 다루기 _11.3 트위터 네트워크 분석 __11.3.1 지역 군집 구조(Local Community Structure) __11.3.2 Gephi로 트위터 네트워크 군집 시각화하기 __11.3.3 자신만의 “팔로우 추천” 엔진 제작하기 12장 모형 비교 _12.1 SVM: 지지벡터기계 _12.2 알고리즘 비교 인용된 문헌 찾아보기



