HOME > 상세정보

상세정보

자연어처리 바이블 : ChatGPT 핵심기술 (6회 대출)

자료유형
단행본
개인저자
임희석, 林希錫, 1969-
단체저자명
고려대학교. 자연어처리연구실, 저
서명 / 저자사항
자연어처리 바이블 = Bible for natural language processing : ChatGPT 핵심기술 / 임희석, 고려대학교 자연어처리연구실 저
발행사항
서울 :   휴먼싸이언스,   2023  
형태사항
xiv, 625 p. : 삽화, 도표 ; 25 cm
ISBN
9791189057367
일반주기
2024년도 대한민국학술원 선정 교육부 우수학술도서  
서지주기
참고문헌 수록
000 00000cam c2200205 c 4500
001 000046172148
005 20241210131634
007 ta
008 240311s2023 ulkad b 000c kor
020 ▼a 9791189057367 ▼g 93560
035 ▼a (KERIS)BIB000016786470
040 ▼a 211062 ▼c 211062 ▼d 211009
082 0 4 ▼a 006.35 ▼2 23
085 ▼a 006.35 ▼2 DDCK
090 ▼a 006.35 ▼b 2023z3
100 1 ▼a 임희석, ▼g 林希錫, ▼d 1969- ▼0 AUTH(211009)68972
245 1 0 ▼a 자연어처리 바이블 = ▼x Bible for natural language processing : ▼b ChatGPT 핵심기술 / ▼d 임희석, ▼e 고려대학교 자연어처리연구실 저
260 ▼a 서울 : ▼b 휴먼싸이언스, ▼c 2023
300 ▼a xiv, 625 p. : ▼b 삽화, 도표 ; ▼c 25 cm
500 ▼a 2024년도 대한민국학술원 선정 교육부 우수학술도서
504 ▼a 참고문헌 수록
710 ▼a 고려대학교. ▼b 자연어처리연구실, ▼e
945 ▼a ITMT

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info/지정도서 청구기호 006.35 2023z3 등록번호 121265840 (1회 대출) 도서상태 지정도서 반납예정일 예약 서비스 M
No. 2 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 006.35 2023z3 등록번호 121267969 (5회 대출) 도서상태 대출중 반납예정일 2026-04-11 예약 예약가능 R 서비스 M
No. 3 소장처 세종학술정보원/과학기술실(5층)/ 청구기호 006.35 2023z3 등록번호 151370295 도서상태 대출가능 반납예정일 예약 서비스 B M ?
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info/지정도서 청구기호 006.35 2023z3 등록번호 121265840 (1회 대출) 도서상태 지정도서 반납예정일 예약 서비스 M
No. 2 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 006.35 2023z3 등록번호 121267969 (5회 대출) 도서상태 대출중 반납예정일 2026-04-11 예약 예약가능 R 서비스 M
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 세종학술정보원/과학기술실(5층)/ 청구기호 006.35 2023z3 등록번호 151370295 도서상태 대출가능 반납예정일 예약 서비스 B M ?

컨텐츠정보

책소개

한국의 학생, 연구원, 그리고 학자들이 좀 더 쉽게 자연어처리를 습득할 수 있고, 한국어의 특성을 반영한 자연어처리를 배울 수 있기를 희망하며 집필되었다. 크게 세 가지 파트로 구성되었다. 첫 번째 파트에서는 자연어처리를 배우기 위하여 필요로 하는 수학, 언어학 등의 기본 지식과 파이프라인 방식의 자연어처리를 위한 각 단계들에 대한 핵심 원리를 설명한다.

두 번째 파트에서는 자연어처리 기술을 활용하여 개발될 수 있는 여러 가지 응용 시스템을 설명하고, 각 시스템의 기본 원리를 설명하였다. 이미지처리 영역에서 높은 성과를 보였던 딥러닝 기술이 최근에는 자연어처리 기술에도 활발하게 적용되고 있다.

세 번째 파트에서는 딥러닝 기술의 원리와 딥러닝 기술을 이용한 자연어처리 기술에 대하여 설명한다. 여기서는 첫 번째 파트에서 소개된 자연어처리의 각 단계의 기술들이 어떻게 딥러닝 기술을 이용하여 개발되어질 수 있는지를 중심으로 설명한다.

머리말

저자는 1990년대 초 대학원에 진학해서 자연어처리에 대한 연구와 공부를 시작했다. 당시 주변 사람들에게 자연어처리를 연구한다고 하면 컴퓨터학을 연구하는 사람들조차도 바로 알아듣는 사람들이 많지 않은 실정이었다. 하지만 요즘은 학계와 산업계뿐만 아니라 일반인들 중에서도 자연어처리에 대해서 관심을 갖고 공부하고 관련 기술을 습득하기를 원하는 사람들이 늘어나고 있는 상황이다. 자연어처리가 왜 중요하게 여겨지고 관심을 받고 있는 걸까? 사람의 지능에 가깝고 또 능가하는 인공지능을 개발하기 위해서는 세상에 대한 지식(world knowledge)을 컴퓨터가 사용할 수 있도록 표현하는 기술(knowledge representation)과 세상으로부터 지식을 자동으로 획득하는 지식 획득 기술(knowledge acquisition)이 매우 중요하다. 대부분의 세상 지식은 자연어로 기술되어 있다. 따라서 자연어를 이해하여 세상 지식으로 변환하는데 필수적인 자연어처리 기술이 인공지능 개발에 있어서 대단히 중요하다. 또한 사람과 컴퓨터간의 자연스러운 사용자 인터페이스 중에서 언어를 이용한 인터페이스가 매우 중요하다. 컴퓨터가 사람이 이야기한 내용을 알아듣고 사람들이 이해하기 쉬운 자연어 구사를 가능케 하는 자연어처리 기술은 사람들이 컴퓨터 사용법을 배우거나 프로그래밍 언어를 배워야 하는 어려움을 없애줄 수 있다. 위에서 기술한 두 가지 이외에도 인공지능 시대에서의 자연어처리 기술의 역할은 매우 크다.
자연어처리 기술의 중요성과 관심이 높아지는 상황에 비해 한국인들이 쉽게 자연어처리를 배울 수 있는 한국어로 쓰여진 자연어처리 교재가 거의 전무한 상황이다. 또한 한국어 자연어처리를 위해서 알아야 할 한국어 특성을 반영한 자연어처리의 원리와 개념을 배울 수 있는 교재도 많지 않은 실정이다. 본 서는 한국의 학생, 연구원, 그리고 학자들이 좀 더 쉽게 자연어처리를 습득할 수 있고, 한국어의 특성을 반영한 자연어처리를 배울 수 있기를 희망하며 집필되었다.
본 서는 크게 세 가지 파트로 구성되었다. 첫 번째 파트에서는 자연어처리를 배우기 위하여 필요로 하는 수학, 언어학 등의 기본 지식과 파이프라인 방식의 자연어처리를 위한 각 단계들에 대한 핵심 원리를 설명한다. 두 번째 파트에서는 자연어처리 기술을 활용하여 개발될 수 있는 여러 가지 응용 시스템을 설명하고, 각 시스템의 기본 원리를 설명하였다. 이미지처리 영역에서 높은 성과를 보였던 딥러닝 기술이 최근에는 자연어처리 기술에도 활발하게 적용되고 있다. 세 번째 파트에서는 딥러닝 기술의 원리와 딥러닝 기술을 이용한 자연어처리 기술에 대하여 설명한다. 여기서는 첫 번째 파트에서 소개된 자연어처리의 각 단계의 기술들이 어떻게 딥러닝 기술을 이용하여 개발되어질 수 있는지를 중심으로 설명한다.
매우 부족하지만 본 서의 초판을 집필하면서 한국어 자연어처리 연구와 교육을 하는 사람으로서 한국어로된 교재를 쓰지 못해 가졌던 부담과 짐을 조금은 덜 수 있을 것 같다. 방대한 양의 본 서를 출판하는 데에는 각 맡은 부분에 대한 내용을 조사하고 연구하고 집필한 고려대학교 NLP & AI Lab.의 모든 구성원의 역할이 매우 지대했음을 밝히지 않을 수 없다. 그들이 없었으면 본 서는 세상의 빛을 보지 못했을 것이다. 지면관계상 모든 사람들의 이름을 밝히지 못함에 용서를 구한다. 또한 오랫동안 우유부단하게 책 집필을 시작하지 못한 저자를 움직이게 하고, 또 후원해주신 인성 유휘성 회장님께 감사의 말씀을 전한다. 늘 남편을 응원하고 사랑해주는 아내, 삶의 기업처럼 든든한 아들과 딸에게도 무한한 감사의 마음을 전한다. 마지막으로 저자를 포함한 모든 공동 저자들에게 학문과 연구를 하고, 아는 것을 글로 잘 표현할 수 있는 지혜를 주신 하나님께 감사드리며 그 분께 모든 영광을 돌린다.


정보제공 : Aladin

저자소개

임희석(지은이)

2008년부터 고려대학교 컴퓨터학과 교수로 재직 중이다. 1992년 고려대학교 컴퓨터학과를 졸업하고, 97년 동대학원에서 박사학위를 받았다. 한국컴퓨터교육학회 논문지의 편집위원장을 역임하였으며, 현재 Human inspired AI 연구소장과 한국융합학회 부회장으로 활동 중이다. 주요 연구분야는 자연어처리, 인공지능, 정보검색, 뇌 신경 언어처리이다. 저서로는 알기 쉬운 컴퓨팅 사고력(Human Science, 2017년), 컴퓨팅 사고력과 일상의 빅데이터(Human Science, 2016년), 도와주세요! 아이폰이 생겼어요(시리즈)(한빛미디어, 2010년~11년), 번역서로는 검색엔진:최신정보검색론(Human Science, 2011년), C++를 이용한 데이터 구조 및 알고리즘 분석(홍릉과학출판사, 2010년)이 있으며, 중학교 정보 교과서(천재교육, 2017년), 고등학교 정보 교과서(천재교육, 2017년), 중학교 정보 교과서(비상교육, 2018년) 그리고 고등학교 정보 교과서(비상교육, 2018년)를 집필하였다.

고려대학교 자연어처리연구실(지은이)

정보제공 : Aladin

목차

자연어처리의 기본

CHAPTER 1 자연어처리의 기본 3
1.1 자연어처리란 3
1.2 자연어처리의 응용 분야 6
1.3 자연어처리는 왜 어려운가? 8
1.4 자연어처리 연구의 패러다임 11
1.5 딥러닝을 사용하는 자연어처리 연구 16
참고문헌 19
CHAPTER 2 자연어 처리를 위한 수학 21
2.1 확률의 기초 21
2.2 MLE와 MAP 28
2.3 정보이론과 엔트로피 31
참고문헌 36
CHAPTER 3 언어학의 기본 원리 37
3.1 언어학 개요 37
3.2 음절, 형태소, 어절 그리고 품사 37
3.3 구구조와 의존구조 45
3.4 의미론과 화용론 47
참고문헌 49
CHAPTER 4 텍스트의 전처리 51
4.1 비정형데이터 내의 오류 51
4.2 텍스트 문서의 변환 53
4.3 띄어쓰기 교정 방법 55
4.4 철자 및 맞춤법 교정 방법 59
참고문헌 62
CHAPTER 5 어휘 분석(Lexical Analysis) 63
5.1 형태소 분석(Morphological Analysis) 63
5.2 품사 태깅 69
5.3 형태소 분석 및 품사 태깅기의 활용 분야 82
참고문헌 83
CHAPTER 6 구문 분석 85
6.1 구문 분석 개요 85
6.2 구구조 구문 분석 88
6.3 의존 구문 분석 95
6.4 구문 분석 접근 방법의 장단점 99
6.5 더 알아보기 100
참고문헌 103
CHAPTER 7 의미 분석 105
7.1 단어와 단어 의미 중의성 105
7.2 단어 의미 중의성 해소 기법(Word Sense Disambiguation) 106
7.3 의미역(Semantic Role) 분석 112
7.4 의미표현 114
참고문헌 118



PART
II







다양한 자연어 처리 응용







CHAPTER 8 개체명 인식 (Named Entity Recognition) 123
8.1 개체명 인식(Named Entity Recognition) 소개 123
8.2 개체명 인식이란 124
8.3 NER 시스템 126
8.4 NER 평가 척도 133
8.5 BIO Tagging Scheme 134
8.6 학습 코퍼스 134
참고문헌 138
CHAPTER 9 언어 모델(Language Model) 139
9.1 언어 모델이란? 139
9.2 통계적 언어 모델(Statistical Language Model, SLM) 140
9.3 일반화(Generalization) 150
9.4 모델 평가와 퍼플렉서티(Perplexity) 153
CHAPTER 10 정보추출(Information Extraction) 157
10.1 정보추출이란 157
10.2 정보추출의 학습 방법 158
10.3 정보추출의 접근법 160
10.4 정보추출의 하위 작업 165
참고문헌 168
CHAPTER 11 Question & Answering 171
11.1 질의응답(Question & Answering)이란 171
11.2 정보검색 기반 질의응답(IR based question answering) 172
참고문헌 182
CHAPTER 12 기계 번역 (Machine Translation) 185
12.1 기계 번역이란 185
12.1 규칙기반 기계번역 188
12.3 통계 기반 기계 번역 190
12.4 인공신경망 기계번역 197
12.5 기계번역 하위분야 소개 198
참고문헌 200
CHAPTER 13 자연어 생성 203
13.1 배경 203
13.2 지도 학습 기반 자연어 생성 205
13.3 강화 학습 기반 자연어 생성 209
13.4 적대 학습 기반 자연어 생성 211
13.5 자연어 생성에서의 디코딩 전략 214
13.6 자연어 생성 응용 분야 218
참고문헌 220
CHAPTER 14 대화 시스템(Dialog System) 223
14.1 대화 시스템 개론 223
14.2 대화시스템의 분류 232
14.3 대화 데이터 234
참고문헌 241
CHAPTER 15 문서 요약(Text Summarization) 243
15.1 문서 요약이란 243
15.2 문서 요약 방법 244
15.3 접근법 252
15.4 평가 256
참고문헌 258
CHAPTER 16 텍스트 분류(Text Categorization) 261
16.1 텍스트 분류란? 261
16.2 다양한 텍스트 분류 예시 264
16.3 텍스트 분류 프로세스 267
16.4 텍스트 분류, 군집화 알고리즘 270
16.5 Scikit-Learn 274
16.6 데이터 시각화 275
참고문헌 276



PART
III







딥러닝기반의 자연어처리







CHAPTER 17 딥러닝의 소개 281
17.1 딥러닝 개요 281
17.2 딥러닝 모델의 핵심: 자동적인 계층적 자질 표상 습득 283
17.3 딥러닝 시스템 구축을 위한 고려사항: 데이터와 모델 구조 285
17.4 딥러닝 모델의 뼈대: 퍼셉트론 287
17.5 비선형 결정 경계와 활성 함수 289
17.6 딥러닝 모델의 학습 290
참고문헌 291
CHAPTER 18 단어 임베딩 295
18.1 단어 임베딩이란? 295
18.2 분포 가설과 언어 모델링 297
18.3 Word2vec 이전의 단어 임베딩 297
18.4 단어 단위 임베딩: Word2vec, GloVe, FastText 299
18.5 ELMo 이후의 임베딩: 문장 단위 임베딩 301
18.6 한국어의 단어 임베딩과 입력의 최소 단위 305
18.7 최신 연구 동향 306
참고문헌 307
CHAPTER 19 CNN(Convolutional Neural Networks) 311
19.1 CNN 개념 311
19.2 CNN을 이용한 문장 분류 316
참고문헌 321
CHAPTER 20 순환 신경망(Recurrent Neural Networks, RNN) 323
20.1 기본 순환 신경망(Vanilla Recurrent Neural Networks) 323
20.2 응용 순환 신경망(Advanced Recurrent Neural Networks) 327
20.3 순환 신경망 기반 자연어 생성 333
참고문헌 335
CHAPTER 21 딥러닝 기반 한국어 형태소 분석과 품사 태깅 337
21.1 형태소 분석 품사 태깅 개요 337
21.2 KoNLPy 형태소 분석 도구 소개[21-1] 338
21.3 딥러닝 이전의 형태소 분석, 품사 태깅 소개 338
21.4 딥러닝 기반 형태소 분석, 품사 태깅 소개 339
참고문헌 343
CHAPTER 22 딥러닝 기반 한국어 단어의미 분석 345
22.1 한국어 의미역 분석 345
22.2 심층학습 기반 단어 중의성 해소 349
참고문헌 354
CHAPTER 23 딥러닝 기반의 자연어처리 355
23.1 딥러닝 기반 NER 355
23.2 단어 단위의 구조 355
23.3 문자 단위의 구조 356
23.4 단어 + 문자 단위의 구조 357
참고문헌 358
CHAPTER 24 딥러닝 기반의 질의응답(Question Answering) 359
24.1 딥러닝 기반 질의응답(Question Answering) 359
24.2 딥러닝 기반 질의응답(Question Answering) 모델 361
24.3 시각 질의응답(Visual Question Answering, VQA) 364
24.3 상식 질의응답(Commonsense QA) 368
참고문헌 372
CHAPTER 25 딥러닝 기반 기계번역 375
25.1 딥러닝 기반 기계번역의 흐름 375
25.2 Sequence to Sequence 구조와 인코더 디코더 377
25.3 RNN기반 Neural Machine Translation 379
25.4 Attention 기반 NMT 380
25.5 Transformer기반 NMT 383
25.6 Cross Lingual 언어모델 기반 NMT 392
25.7 딥러닝 기반 기계번역의 하위분야 396
참고문헌 402
CHAPTER 26 딥러닝 기반 문장생성 405
26.1 순환 신경망 언어 모델을 이용한 문장 생성 406
26.2 셀프 어텐션 기반 언어 모델을 이용한 문장 생성 409
참고문헌 413
CHAPTER 27 딥러닝 기반 문서 요약(Text Summarization) 415
27.1 딥러닝 기반 문서 요약의 동향 415
27.2 딥러닝 기반의 추상 요약 416
참고문헌 426
CHAPTER 28 딥러닝 기반 대화 시스템 427
28.1 목적 지향 대화 시스템(Task-Oriented Dialogue System) 428
28.2 비목적 지향 대화 시스템(챗봇 시스템) 433
참고문헌 439
CHAPTER 29 딥러닝을 이용한 SNS(Social Network Service) 분석 441
29.1 SNS 441
29.2 SNS 분석 443
29.3 SNS 분석 기법 444
참고문헌 451
CHAPTER 30 응용: 이미지 캡션 생성 453
30.1 이미지 캡션 생성 개요 453
30.2 이미지 캡션 생성 과정 456
30.3 이미지 캡션 생성 모델: Show & Tell 459
30.4 훈련에 따른 성능변화 463
30.4 결론 466
참고문헌 466
CHAPTER 31 가짜뉴스 탐지 467
31.1 가짜뉴스 탐지 개요 467
31.2 가짜뉴스 정의 468
31.3 딥러닝 기반의 가짜뉴스 탐지 발전 방향 469
31.4 딥러닝 기반 가짜뉴스 탐지 향후 과제 475
참고문헌 477
CHAPTER 32 PLM, Transformer 479
32.1 트랜스포머(Transformer) 479
32.2 인코더-디코더 480
32.3 BERT 482
32.4 Transformer 기반 언어모델 485
32.5 사전 학습 모델 488
참고문헌 498
실습 499

관련분야 신착자료

Negro, Alessandro (2026)
Dyer-Witheford, Nick (2026)
양성봉 (2025)