HOME > 상세정보

상세정보

파이썬과 자연어 처리 : 파이썬과 함께하는 NLP 애플리케이션 만들기 (42회 대출)

자료유형
단행본
개인저자
Chopra, Deepti Mathur, Iti, 저 Joshi, Nisheeth, 저 유연재, 역
서명 / 저자사항
파이썬과 자연어 처리 : 파이썬과 함께하는 NLP 애플리케이션 만들기 / 딥티 초프라, 니쉬트 조쉬, 이티 마투르 지음 ; 유연재 옮김
발행사항
서울 :   에이콘,   2017  
형태사항
318 p. : 삽화 ; 24 cm
총서사항
acorn+PACKT technical book
원표제
Mastering natural language processing with Python : maximize your NLP capabilities while creating amazing NLP projects in Python
ISBN
9791161750255 9798960772106 (세트)
일반주기
색인수록  
일반주제명
Natural language processing (Computer science) Python (Computer program language)
000 00000cam c2200205 c 4500
001 000045913136
005 20170822182940
007 ta
008 170822s2017 ulka 001c kor
020 ▼a 9791161750255 ▼g 94000
020 1 ▼a 9798960772106 (세트)
035 ▼a (KERIS)BIB000014547922
040 ▼a 211040 ▼c 211040 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 4 ▼a 006.35 ▼2 23
085 ▼a 006.35 ▼2 DDCK
090 ▼a 006.35 ▼b 2017
100 1 ▼a Chopra, Deepti
245 1 0 ▼a 파이썬과 자연어 처리 : ▼b 파이썬과 함께하는 NLP 애플리케이션 만들기 / ▼d 딥티 초프라, ▼e 니쉬트 조쉬, ▼e 이티 마투르 지음 ; ▼e 유연재 옮김
246 1 9 ▼a Mastering natural language processing with Python : ▼b maximize your NLP capabilities while creating amazing NLP projects in Python
260 ▼a 서울 : ▼b 에이콘, ▼c 2017
300 ▼a 318 p. : ▼b 삽화 ; ▼c 24 cm
440 0 0 ▼a acorn+PACKT technical book
500 ▼a 색인수록
650 0 ▼a Natural language processing (Computer science)
650 0 ▼a Python (Computer program language)
700 1 ▼a Mathur, Iti, ▼e
700 1 ▼a Joshi, Nisheeth, ▼e
700 1 ▼a 유연재, ▼e
900 1 0 ▼a 초프라, 딥티, ▼e
900 1 0 ▼a 조쉬, 니쉬트, ▼e
900 1 0 ▼a 마투르, 이티, ▼e
945 ▼a KLPA

소장정보

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 006.35 2017 등록번호 121241248 (19회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 2 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 006.35 2017 등록번호 121241806 (23회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M

컨텐츠정보

책소개

acorn+PACKT 시리즈. 자연어 처리는 인간과 컴퓨터 간의 상호 작용에 관련된 인공지능(AI) 분야의 하나다. 이 책은 파이썬을 이용해 자연어 처리 애플리케이션을 개발하는 데 필요한 기술을 배우고, 이를 실제로 활용할 수 있도록 하는 지침서다. 자연 언어에 대한 기본 개념과 문자열 매칭, 스테머, 파싱, 의미 분석, 감정 분석, 정보 검색 등의 활용 예제를 살펴보며 독자들이 파이썬을 통해 자연어 처리를 빠르게 학습할 수 있도록 도와줄 것이다.

★ 이 책에서 다루는 내용 ★

■ 문자열 매칭 알고리즘 및 정규화 기술 구현
■ 통계 언어 모델링 기법 구현
■ 스테머, 원형화기, 형태소 생성기 개발에 대한 통찰력 습득
■ 검색 엔진 개발, n-gram 접근법과 관련된 POS 태깅 개념 및 통계 모델링 개념 구현
■ 트리뱅크(Treebank) 구조, CFG 생성, CYK 차트 파싱 알고리즘 및 Earley 차트 파싱 알고리즘 개념 습득
■ NER 기반 시스템 개발과 감정 분석의 개념 이해 및 적용
■ 정보 검색 및 텍스트 요약의 개념 이해 및 구현
■ 담화 분석 시스템 및 대용어 복원(anaphora resolution) 기반 시스템 개발

★ 이 책의 대상 독자 ★

합리적인 지식 수준과 파이썬에 대한 이해를 바탕으로 NLP 중급 개발자를 대상으로 한다.

★ 이 책의 구성 ★

1장, ‘문자열을 사용한 작업’에서는 토큰화와 정규화 같은 텍스트에 대한 사전 처리 작업을 수행하는 방법과 다양한 문자열 매칭 방법을 설명한다.
2장, ‘통계 언어 모델링’에서는 단어 빈도를 계산하고 다양한 언어 모델링 기법을 수행하는 방법을 다룬다.
3장, ‘형태학 - 시작하다’에서는 스테머, 형태소 분석기 및 형태소 생성기 개발 방법을 다룬다.
4장, ‘품사 태깅 - 단어 식별’에서는 품사 태깅 및 n-gram 접근법을 포함한 통계 모델링을 다룬다.
5장, ‘파싱 - 훈련 데이터 분석’에서는 트리 뱅크 구성, CFG 구성, CYK 알고리즘, 차트 파싱 알고리즘 및 음역의 개념에 대한 정보를 살펴본다.
6장, ‘의미 분석 - 본질 표현’에서는 얕은 의미 분석과 WordNet을 사용하는 WSD의 개념과 애플리케이션에 대해 살펴본다.
7장, ‘감정 분석 - 나는 행복하다’에서는 감정 분석의 개념을 이해하고 적용하는 데 도움이 되는 정보를 제공한다.
8장, ‘정보 검색 - 정보 접속’에서는 정보 검색 및 텍스트 요약의 개념을 이해하고 적용한다.
9장, ‘담화 분석 - 아는 것은 믿는 것이다’에서는 담화 분석 시스템과 대용어 복원 기반 시스템을 개발한다.
10장, ‘NLP 시스템의 평가 - 성능 분석’에서는 NLP 시스템을 평가하는 개념을 이해하고 적용하는 방법에 대해 살펴본다.


정보제공 : Aladin

저자소개

딥티 초프라(지은이)

바나스탈리 대학(Banasthali University)의 조교수다. 주요 연구 분야는 전산 언어학, 자연어 처리 및 인공지능이다. 여러 저널 및 컨퍼런스에서 간행물을 발간했으며 관련 프로그램 위원회에서도 활동하고 있다.

니쉬트 조쉬(지은이)

바나스탈리 대학(Banasthali University)의 부교수다. 관심 분야는 전산 언어학, 자연어 처리 및 인공지능이다. 인도에서 언어 기술 기금 및 연구(Language Technology Funding and Research)를 총괄하는 최상위 기관인 인도 정부(Govt) 정보 기술부(Department of Information Technology)에서 TDIL 프로그램의 배심 전문가로도 활동하고 있다. 여러 저널 및 컨퍼런스에서 간행물을 발간했으며 관련 프로그램 위원회 및 편집 위원으로도 활동한다.

이티 마투르(지은이)

바나스탈리 대학(Banasthali University)의 조교수다. 관심 분야는 전산 의미론 및 온톨로지 공학(ontological engineering)이다. 인도 정부(Govt)의 전자 정보 기술부(Department of Electronics and Information Technology,DeitY TDIL) 프로그램의 배심 전문가로도 활동하고 있다. 여러 저널 및 컨퍼런스에서 간행물을 발간했으며 관련 프로그램 위원회 및 편집 위원으로 활동한다.

유연재(옮긴이)

프로그램 개발과 관련한 모든 분야에 관심이 많다. 항상 부족한 것이 많다고 생각하며 노력하는 40대 프로그래머다. 현재는 보험의 디지털 혁신을 꿈꾸는 캐롯손해보험에서 일반보험 IT 개발을 담당하고 있다. 에이콘출판사에서 출간한 『자바 네트워크 프로그래밍』(2016), 『파이썬과 자연어 처리』(2017), 『파이썬 비즈니스 자동화』(2018)를 번역했다.

정보제공 : Aladin

목차

1장. 문자열을 사용한 작업 
__토큰화 
____텍스트를 문장으로 토큰화 
____다양한 언어의 텍스트 토큰화 
____문장을 단어로 토큰화 
____TreebankWordTokenizer를 사용한 토큰화 
____정규 표현식을 사용한 토큰화 
__정규화 
____문장 부호 제거 
____소문자와 대문자로 변환 
____불용어 처리 
____영어의 불용어 계산 
__토큰의 대체 및 수정 
____정규 표현식을 사용한 단어 대체 
____텍스트를 다른 텍스트로 대체하는 예제 
____토큰화 전에 대체 수행 
____반복되는 문자 처리 
____반복 문자를 삭제하는 예제 
____단어를 동의어로 대체 
____단어를 동의어로 대체하는 예제 
__텍스트에 지프의 법칙 적용 
__유사 척도 
____편집 거리 알고리즘을 사용한 유사 척도 
____자카드 계수를 사용한 유사 척도 
____스미스 워터맨 거리를 사용한 유사 척도 적용 
____그 외 문자열 유사도 메트릭 
__요약 

2장. 통계 언어 모델링 
__단어 빈도 이해 
____주어진 텍스트의 MLE 개발 
____은닉 마르코프 모델 추정 
__MLE 모델의 스무딩 적용 
____에드온 스무딩 
____Good Turing 
____크네저 네이 추정 
____위튼 벨 추정 
__MLE의 백-오프 메커니즘 개발 
__믹스 앤 매치를 얻기 위한 데이터 보간법 적용 
__혼잡도를 통한 언어 모델 평가 
__모델링 언어에서 메트로폴리스 헤이스팅스 적용 
__언어 처리에서 깁스 샘플링 적용 
__요약 

3장. 형태학 ? 시작하기 
__형태학 소개 
__스테머 이해 
__원형복원 이해 
__비영어 언어의 스테머 개발 
__형태소 분석기 
__형태소 생성기 
__검색 엔진 
__요약 

4장. 품사 태깅 - 단어 식별 
__품사 태깅 소개 
____기본 태깅 
__POS-tagged corpora 생성 
__기계 학습 알고리즘 선택 
__n-gram 접근법과 관련된 통계 모델링 
__pos-tagged data를 사용한 청커 개발 
__요약 

5장. 파싱 - 훈련 데이터 분석 
__파싱 소개 
__트리뱅크 구성 
__트리뱅크의 문맥 자유 문법 규칙 추출 
__CFG에서 확률적 문맥 자유 문법 생성 
__CYK 차트 파싱 알고리즘 
__Earley 차트 파싱 알고리즘 
__요약 

6장. 의미 분석 - 본질 표현 
__의미 분석 소개 
____NER 소개 
____은닉 마르코프 모델을 사용한 NER 시스템 
____기계 학습 툴킷을 사용한 NER 훈련 
____POS 태깅을 사용한 NER 
__Wordnet의 synset id 생성 
__Wordnet을 사용한 의미 판별 
__요약 

7장. 감정 분석 - 나는 행복하다. 
__감정 분석 소개 
____NER를 사용한 감정 분석 
____기계 학습을 사용한 감정 분석 
____NER 시스템의 평가 
__요약 

8장. 정보 검색 - 정보 접속 
__정보 검색 소개 
____불용어 제거 
____벡터 공간 모델을 사용한 정보 검색 
__벡터 공간 스코링 및 질의 연산자 상호 작용 
__잠재 의미 색인을 이용한 IR 시스템 개발 
__텍스트 요약 
__질의 응답 시스템 
__요약 

9장. 담화 분석 - 아는 것은 믿는 것이다. 
__담화 분석 소개 
____중심화 이론을 사용한 담화 분석 
____대용어복원 
__요약 

10장. NLP 시스템의 평가 - 성능 분석 
__NLP 시스템 평가의 필요성 
____NLP 도구(POS 태거, 스테머, 형태소 분석기) 평가 
____골드 데이터를 사용한 파서 평가 
__IR 시스템의 평가 
__오류 식별 메트릭 
__어휘 매칭 기반 메트릭 
__구문 매칭 기반 메트릭 
__얕은 의미 매칭을 사용한 메트릭 
__요약

관련분야 신착자료

Negro, Alessandro (2026)
Dyer-Witheford, Nick (2026)