| 000 | 00000cam c2200205 c 4500 | |
| 001 | 000046191529 | |
| 005 | 20250107103944 | |
| 007 | ta | |
| 008 | 241230s2024 ggkad b 001c kor | |
| 020 | ▼a 9791158086107 ▼g 93310 | |
| 035 | ▼a (KERIS)BIB000017128448 | |
| 040 | ▼a 211046 ▼c 211046 ▼d 211009 | |
| 082 | 0 4 | ▼a 006.312 ▼2 23 |
| 085 | ▼a 006.312 ▼2 DDCK | |
| 090 | ▼a 006.312 ▼b 2024z1 | |
| 245 | 0 0 | ▼a 데이터마이닝의 원리와 구현 : ▼b R과 함께 / ▼d 전치혁 [외]지음 |
| 260 | ▼a 파주 : ▼b 자유아카데미, ▼c 2024 | |
| 300 | ▼a x, 566 p. : ▼b 삽화(일부천연색), 도표 ; ▼c 26 cm | |
| 500 | ▼a 공저자: 이혜선, 이영록, 이종석 | |
| 500 | ▼a 부록: 6.1. 정규분포 모수에 대한 최우추정법, 6.2. 최우추정치에 대한 표준오차, 9.1. 비선형계획 문제 외 | |
| 504 | ▼a 참고문헌과 색인수록 | |
| 700 | 1 | ▼a 전치혁, ▼g 全治赫, ▼d 1954-, ▼e 저 ▼0 AUTH(211009)141265 |
| 700 | 1 | ▼a 이혜선, ▼e 저 |
| 700 | 1 | ▼a 이영록, ▼e 저 |
| 700 | 1 | ▼a 이종석, ▼e 저 |
| 945 | ▼a ITMT |
소장정보
| No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
|---|---|---|---|---|---|---|---|
| No. 1 | 소장처 중앙도서관/제2자료실(3층)/ | 청구기호 006.312 2024z1 | 등록번호 111905738 (2회 대출) | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
| No. 2 | 소장처 세종학술정보원/과학기술실(5층)/ | 청구기호 006.312 2024z1 | 등록번호 151372115 | 도서상태 정리중 | 반납예정일 | 예약 예약가능 | 서비스 |
| No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
|---|---|---|---|---|---|---|---|
| No. 1 | 소장처 중앙도서관/제2자료실(3층)/ | 청구기호 006.312 2024z1 | 등록번호 111905738 (2회 대출) | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
| No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
|---|---|---|---|---|---|---|---|
| No. 1 | 소장처 세종학술정보원/과학기술실(5층)/ | 청구기호 006.312 2024z1 | 등록번호 151372115 | 도서상태 정리중 | 반납예정일 | 예약 예약가능 | 서비스 |
컨텐츠정보
책소개
데이터마이닝 기법의 알고리즘 원리와 함께 실제 예제를 많이 수록하였다. 각 기법을 소개한 후 데이터 예제로 기법을 쉽게 이해할 수 있도록 하였으며, 코드를 삽입하여 독자들이 해당 기법을 직접 구현하고 결과를 확인할 수 있도록 구성하였다.
우선 이 책의 근간이 된 것은 첫 저자(전치혁)가 10여 년 전에 저술한 ‘데이터마이닝 기법과 응용’이라는 점을 밝히고자 한다. 이 책은 데이터마이닝의 주요 기법에 대한 이론을 쉽게 이해할 수 있는 책을 만들자는 목적으로 저술되었다. 최근 이 분야에서 공동 연구를 수행해 왔던 공저자들, 이혜선 교수, 이영록 박사, 이종석 교수로부터 데이터마이닝 기법의 구현을 포함시키면 좋겠다는 의견을 수렴하게 되었으며, 이에 데이터마이닝 기법을 일부 추가하고 R 언어로 코드 작성하는 등 1년간의 공동 작업으로 책을 완성하게 되었다.
최근 ChatGPT의 등장과 활발한 적용 사례를 접하게 되면서 인공지능(AI)에 대한 관심이 고조되고 있으며, 이와 함께 머신러닝 및 데이터마이닝 기법의 알고리즘 구현 과정 이해의 필요성이 증대하게 되었다. 이 책을 통해 이러한 궁금점을 해결할 수 있도록 각 기법의 원리를 보다 쉽게 이해할 수 있도록 설명하였으며, 데이터와 R 코드를 통해 구현 방법을 습득할 수 있게 서술하였다. 또한 Python 사용자들을 위해 교재에 포함되지 않은 Python 코드를 별도로 제공하고 있다.
데이터마이닝 기법은 목적에 따라 크게 예측, 분류분석, 군집분석, 연관규칙으로 나눌 수 있는데, 이 책에서도 이러한 순서에 따라 내용을 전개하였다. 먼저, 예측기법으로는 회귀분석, 규제 회귀분석, 차원축소 회귀분석을 다루며, 분류분석에서는 로지스틱 회귀분석, 판별분석, 트리 기반 기법, 서포트 벡터 머신, 앙상블 기법을 설명한다. 여기서 앙상블 기법에서는 랜덤 포레스트, 아다부스트, 그레디언트 부스트 등을 포함한다. 다음으로 군집분석을 다루는데, 계층적 군집분석과 비계층 군집분석으로 구분하여 계층적 군집분석에서는 주로 연결법을 설명하고 비계층 군집분석에서는 K-means, K-medoids, 퍼지 K-means, 모형기반 군집 방법, 디비스캔(DBSCAN) 등을 소개한다. 이어서 연관규칙과 추천시스템을 다루는데, 연관규칙은 다른 데이터마이닝 서적에서 구체적인 알고리즘을 소개하지 않고 있지만, 데이터로부터 유용한 구매패턴을 찾는 기법으로 고객 마케팅에 많이 활용된다. 추천시스템은 연관규칙과는 다소 목적이 다르나 사용자들이 제품을 평가하는 특성을 서로 연관시키는 면에서 공통점을 찾을 수 있는 방식이라고 할 수 있다.
이 책에서는 데이터마이닝 기법의 알고리즘 원리와 함께 실제 예제를 많이 수록하였다. 각 기법을 소개한 후 데이터 예제로 기법을 쉽게 이해할 수 있도록 하였으며, 앞서 언급한 바와 같이 코드를 삽입하여 독자들이 해당 기법을 직접 구현하고 결과를 확인할 수 있도록 구성하였다.
실습용 데이터파일, R과 Python 코드는 자유아카데미 홈페이지(www.freeaca.com) 자료실에서 제공하고 있으며, 출간 후에 발견되는 수정사항이나 제안은 출판사를 통해 저자들에게 전달이 가능하니 참고하기를 바란다.
정보제공 :
저자소개
전치혁(지은이)
서울대학교 자원공학 학사 KAIST 산업공학 석사 미국 UC, Berkeley 산업공학 박사 포항공과대학교 산업경영공학과 교수 (현) 포항공과대학교 산업경영공학과 명예교수 (현) 한국과학기술한림원 정회원 e-mail: chjun@postech.ac.kr
이혜선(지은이)
서울대학교 소비자학(경제학 부전공) 학사 미국 Cornell University 통계학 석사 경북대학교 통계학 박사 미국 National Opinion Research Center 프로그래머 미국 UC, San Diego 의과대학 통계분석가 포항공과대학교 산업경영공학과 연구교수 (현) 포항공과대학교 산업경영공학과 겸직교수
이영록(지은이)
포항공과대학교 산업공학 학사 포항공과대학교 산업공학 석사 미국 Iowa State University 산업공학 박사 (현) 미국 소재 엔터테인먼트 회사 Decision Science Manager
이종석(지은이)
인하대학교 산업공학 학사 포항공과대학교 정보통신대학원 석사 미국 Iowa State University 산업공학 박사 미국 SAS Institute JMP Division 프로그래머 성균관대학교 시스템경영공학과 조교수, 부교수 포스코 철강전문교수 (현) KAIST 산업및시스템공학과 부교수
목차
목차
1장 데이터마이닝 개요와 활용
1.1 데이터마이닝의 정의
1.2 데이터마이닝의 기능과 기법
1.3 데이터마이닝의 활용 분야
2장 회귀분석
2.1 다중회귀모형
2.2 회귀계수의 추정
2.3 모형에 대한 추론
2.4 변수선택방법
2.5 회귀모형의 진단
2.6 반응치에 대한 추정 및 예측
2.7 다중공선성
2.8 지시변수와 회귀모형
R 코드
참고문헌
연습문제
3장 규제 회귀분석
3.1 라소(LASSO) 회귀분석
3.2 릿지(Ridge) 회귀분석
3.3 라소와 릿지 회귀의 비교
R 코드
참고문헌
연습문제
4장 차원축소 회귀분석
4.1 변수의 변동과 제곱합
4.2 주성분의 이해
4.3 행렬의 분해
4.4 주성분 스코어
4.5 주성분의 제곱합 분해
4.6 NIPALS 알고리즘
4.7 주성분 회귀분석
4.8 PLS 회귀분석의 개요
4.9 하나의 종속변수에 대한 PLS 회귀분석
4.10 다수의 종속변수에 대한 PLS 회귀분석
4.11 예측성능 평가
R 코드
참고문헌
연습문제
5장 분류분석 개요
5.1 분류 문제 및 분류기법
5.2 기본적인 분류기법
5.3 분류의 성능평가
5.4 ROC 곡선
5.5 이익도표
R 코드
참고문헌
연습문제
6장 로지스틱 회귀분석
6.1 이분 로지스틱 회귀모형
6.2 명목 로지스틱 회귀모형
6.3 서열 로지스틱 회귀모형
부록 6.1 정규분포 모수에 대한 최우추정법
부록 6.2 최우추정치에 대한 표준오차
R 코드
참고문헌
연습문제
7장 판별분석
7.1 피셔 방법
7.2 의사결정론에 의한 분류규칙
7.3 오분류비용을 고려한 분류규칙
7.4 이차 판별분석
7.5 세 범주 이상의 분류
R 코드 27
참고문헌
연습문제
8장 트리 기반 기법
8.1 CART 개요
8.2 트리의 형성
8.3 가지치기 및 최적트리 선정
8.4 기타 트리 기법
R 코드
참고문헌
연습문제
9장 서포트 벡터 머신
9.1 선형 SVM - 분리 가능의 경우
9.2 선형 SVM - 분리 불가능 경우
9.3 비선형 SVM
부록 9.1 비선형계획 문제
R 코드
참고문헌
연습문제
10장 앙상블 기법
10.1 앙상블의 개요
10.2 부트스트래핑
10.3 랜덤 포레스트
10.4 아다부스트
10.5 그래디언트 부스팅
R 코드
참고문헌
연습문제
11장 군집분석 개요
11.1 군집방법
11.2 객체 간의 유사성 척도
11.3 범주형 속성을 포함한 객체의 유사성 척도
R 코드
참고문헌
연습문제
12장 계층적 군집 방법
12.1 군집 간 거리척도 및 연결법
12.2 연결법의 군집 알고리즘
12.3 워드 방법
12.4 분리적 방법 - 다이아나
12.5 군집 수의 결정
R 코드
참고문헌
연습문제
13장 비계층적 군집 방법
13.1 K-means 알고리즘
13.2 K-medoids 군집 방법
13.3 퍼지 K-means 알고리즘
13.4 모형기반 군집 방법
13.5 밀도기반 군집 방법 - 디비스캔(DBSCAN)
R 코드
참고문헌
연습문제
14장 군집해의 평가 및 해석
14.1 군집해의 평가
14.2 군집해의 해석
R 코드
참고문헌
연습문제
15장 연관규칙
15.1 연관규칙의 개요
15.2 연관규칙의 정의 및 성능척도
15.3 연관규칙의 탐색
15.4 순차적 패턴의 탐색
15.5 항목의 선정
R 코드
참고문헌
연습문제
16장 추천시스템
16.1 내용기반 추천시스템
16.2 협업 필터링
16.3 시장바구니 데이터를 이용한 협업 필터링
R 코드
참고문헌
연습문제
정보제공 :



