목차
Part Ⅰ 데이터 마이닝의 기초
Chapter 1 데이터 마이닝: 처음 훑어보기 = 2
1.1 데이터 마이닝: 정의 = 3
1.2 컴퓨터와 학습 = 4
1.3 데이터 마이닝에 적합한 문제 = 14
1.4 전문가 시스템 혹은 데이터 마이닝 = 17
1.5 데이터 마이닝 프로세스를 위한 간단한 모델 = 19
1.6 탐색기법의 한계 = 22
1.7 데이터 마이닝 어플리케이션 = 25
1.8 요약 = 28
1.9 핵심 용어 = 29
1.10 연습 문제 = 31
Chapter 2 데이터 마이닝: 조금 더 자세히 보기 = 33
2.1 데이터 마이닝 전략 = 34
2.2 Supervised 데이터 마이닝 기법들 = 42
2.3 연관 규칙 = 49
2.4 클러스터링 기법 = 51
2.5 성능 평가 = 53
2.6 요약 = 61
2.7 핵심 용어 = 62
2.8 연습 문제 = 63
Chapter 3 데이터 마이닝 기법의 기초 = 67
3.1 결정 트리(Decision Tree) = 68
3.2 연관 규칙(association rules) 생성 = 78
3.3 K-Means 알고리즘 = 85
3.4 유전자 학습(Genetic learning) = 91
3.5 데이터 마이닝 기법의 선택 = 99
3.6 요약 = 102
3.7 핵심 용어 = 103
3.8 연습 문제 = 104
Chapter 4 엑셀 기반의 데이터 마이닝 툴 = 106
4.1 iData Analyzer(iDA) = 107
4.2 ESX : 데이터 마이닝을 위한 다목적 툴(Tool) = 111
4.3 iDAV 형식 = 111
4.4 Unsupervised 클러스터링을 위한 5단계 접근 = 111
4.5 Supervised Learning에 대한 6단계 접근 = 129
4.6 규칙 생성을 위한 기법 = 135
4.7 인스턴스 전형성(Instance Typicality) = 137
4.8 추가적 고려사항들과 특징 = 139
4.9 요약 = 144
4.10 핵심 용어 = 145
4.11 연습 문제 = 146
Part Ⅱ 지식발견을 위한 도구
Chapter 5 데이터베이스의 지식발견 = 152
5.1 KDD 프로세스 모델 = 153
5.2 1단계: 목표 설정 = 155
5.3 2단계: 목표 데이터 집합 만들기 = 156
5.4 3단계: 데이터 전처리(Preprocessing) = 158
5.5 4단계: 데이터 변환(Transformation) = 161
5.6 5단계: 데이터 마이닝 = 167
5.7 6단계: 결과의 해석과 평가 = 168
5.8 7단계: 결과의 실제 적용(Taking Action) = 169
5.9 CRISP - DM 프로세스 모델 = 169
5.10 ESX로 실험하기 = 170
5.11 요약 = 180
5.12 핵심 용어 = 181
5.13 연습 문제 = 182
Chapter 6 데이터 웨어하우스 = 186
6.1 운영 데이터베이스 = 187
6.2 데이터 웨어하우스 설계 = 191
6.3 온라인 분석 프로세싱(OLAP) = 199
6.4 데이터 분석을 위한 엑셀 피벗 레이블 = 205
6.5 요약 = 216
6.6 핵심 용어 = 217
6.7 연습 문제 = 220
Chapter 7 정식 평가 기법 = 222
7.1 평가의 대상 = 223
7.2 평가 도구 = 225
7.3 test 집합 신뢰 구간 계산 방법 = 232
7.4 Supervised 학습자 모델의 비교 = 231
7.5 어트리뷰트 평가 = 237
7.6 Unsupervised 평가 기법 = 244
7.7 Supervised 모델이 수치 출력 값을 가진 경우의 평가 = 246
7.8 요약 = 248
7.9 핵심 용어 = 249
7.10 연습 문제 = 251
Part Ⅲ 고급 데이터 마이닝 기법
Chapter 8 신경망(Neural Networks) 학습 = 256
8.1 전방향 신경망(Feed-Forward Neural Networks) = 257
8.2 신경망의 훈련: 개념적 관점 = 262
8.3 학습된 신경망의 해석(Neural Network Explanation) = 266
8.4 일반적 고찰 = 267
8.5 신경망 훈련: 자세하게 보기 = 269
8.6 요약 = 275
8.7 핵심 용어 = 276
8.8 연습 문제 = 277
Chapter 9 iDA로 신경망 구성하기 = 278
9.1 역전파(backpropagation) 학습을 위한 4단계(four-step) 접근 방법 = 279
9.2 신경망 클러스터링을 위한 4단계(four-step) 접근 방법 = 290
9.3 신경망 클러스터 분석을 위한 ESX = 296
9.4 요약 = 298
9.5 핵심 용어 = 299
9.6 연습 문제 = 299
Chapter 10 통계적 기법 = 303
10.1 선형 회귀 분석(Linear Regression Analysis) = 304
10.2 로지스틱 회귀 분석(Logistic Regression) = 311
10.3 베이즈 분류기(Bayes Classifier) = 315
10.4 클러스터링 알고리즘(Clustering Algorithms) = 322
10.5 휴리스틱이냐 통계냐? = 332
10.6 요약(Chapter Summary) = 334
10.7 핵심 용어 = 336
10.8 연습 문제 = 337
Chapter 11 그 외의 특별한 기법들 = 341
11.1 시계열 분석(Time-Series Analysis) = 342
11.2 웹 마이닝 = 348
11.3 테스트 데이터 마이닝 = 357
11.4 성능 향상 = 358
11.5 요약 = 363
11.6 핵심 용어 = 364
11.7 연습 문제 = 365
부록 A iDA 소프트웨어 = 368
A.1 소프트웨어 설치 = 368
A.2 iDA의 제거 = 370
A.3 소프트웨어의 제한점 = 370
A.4 소프트웨어 사용에 대한 일반적 가이드라인 = 371
A.5 문제 해결 = 372
A.6 소프트웨어 지원 = 373
부록B 데이터 마이닝에서 사용된 데이터 집합 = 374
B.1 iDA 데이터 집합 패키지 = 374
B.2 데이터 마이닝을 위한 데이터 집합이 있는 웹사이트들 = 379
참고문헌 = 381
찾아보기 = 386