| 000 | 00000cam c2200205 c 4500 | |
| 001 | 000045913136 | |
| 005 | 20170822182940 | |
| 007 | ta | |
| 008 | 170822s2017 ulka 001c kor | |
| 020 | ▼a 9791161750255 ▼g 94000 | |
| 020 | 1 | ▼a 9798960772106 (세트) |
| 035 | ▼a (KERIS)BIB000014547922 | |
| 040 | ▼a 211040 ▼c 211040 ▼d 211009 | |
| 041 | 1 | ▼a kor ▼h eng |
| 082 | 0 4 | ▼a 006.35 ▼2 23 |
| 085 | ▼a 006.35 ▼2 DDCK | |
| 090 | ▼a 006.35 ▼b 2017 | |
| 100 | 1 | ▼a Chopra, Deepti |
| 245 | 1 0 | ▼a 파이썬과 자연어 처리 : ▼b 파이썬과 함께하는 NLP 애플리케이션 만들기 / ▼d 딥티 초프라, ▼e 니쉬트 조쉬, ▼e 이티 마투르 지음 ; ▼e 유연재 옮김 |
| 246 | 1 9 | ▼a Mastering natural language processing with Python : ▼b maximize your NLP capabilities while creating amazing NLP projects in Python |
| 260 | ▼a 서울 : ▼b 에이콘, ▼c 2017 | |
| 300 | ▼a 318 p. : ▼b 삽화 ; ▼c 24 cm | |
| 440 | 0 0 | ▼a acorn+PACKT technical book |
| 500 | ▼a 색인수록 | |
| 650 | 0 | ▼a Natural language processing (Computer science) |
| 650 | 0 | ▼a Python (Computer program language) |
| 700 | 1 | ▼a Mathur, Iti, ▼e 저 |
| 700 | 1 | ▼a Joshi, Nisheeth, ▼e 저 |
| 700 | 1 | ▼a 유연재, ▼e 역 |
| 900 | 1 0 | ▼a 초프라, 딥티, ▼e 저 |
| 900 | 1 0 | ▼a 조쉬, 니쉬트, ▼e 저 |
| 900 | 1 0 | ▼a 마투르, 이티, ▼e 저 |
| 945 | ▼a KLPA |
소장정보
| No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
|---|---|---|---|---|---|---|---|
| No. 1 | 소장처 과학도서관/Sci-Info(1층서고)/ | 청구기호 006.35 2017 | 등록번호 121241248 (19회 대출) | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
| No. 2 | 소장처 과학도서관/Sci-Info(1층서고)/ | 청구기호 006.35 2017 | 등록번호 121241806 (23회 대출) | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
컨텐츠정보
책소개
acorn+PACKT 시리즈. 자연어 처리는 인간과 컴퓨터 간의 상호 작용에 관련된 인공지능(AI) 분야의 하나다. 이 책은 파이썬을 이용해 자연어 처리 애플리케이션을 개발하는 데 필요한 기술을 배우고, 이를 실제로 활용할 수 있도록 하는 지침서다. 자연 언어에 대한 기본 개념과 문자열 매칭, 스테머, 파싱, 의미 분석, 감정 분석, 정보 검색 등의 활용 예제를 살펴보며 독자들이 파이썬을 통해 자연어 처리를 빠르게 학습할 수 있도록 도와줄 것이다.
★ 이 책에서 다루는 내용 ★
■ 문자열 매칭 알고리즘 및 정규화 기술 구현
■ 통계 언어 모델링 기법 구현
■ 스테머, 원형화기, 형태소 생성기 개발에 대한 통찰력 습득
■ 검색 엔진 개발, n-gram 접근법과 관련된 POS 태깅 개념 및 통계 모델링 개념 구현
■ 트리뱅크(Treebank) 구조, CFG 생성, CYK 차트 파싱 알고리즘 및 Earley 차트 파싱 알고리즘 개념 습득
■ NER 기반 시스템 개발과 감정 분석의 개념 이해 및 적용
■ 정보 검색 및 텍스트 요약의 개념 이해 및 구현
■ 담화 분석 시스템 및 대용어 복원(anaphora resolution) 기반 시스템 개발
★ 이 책의 대상 독자 ★
합리적인 지식 수준과 파이썬에 대한 이해를 바탕으로 NLP 중급 개발자를 대상으로 한다.
★ 이 책의 구성 ★
1장, ‘문자열을 사용한 작업’에서는 토큰화와 정규화 같은 텍스트에 대한 사전 처리 작업을 수행하는 방법과 다양한 문자열 매칭 방법을 설명한다.
2장, ‘통계 언어 모델링’에서는 단어 빈도를 계산하고 다양한 언어 모델링 기법을 수행하는 방법을 다룬다.
3장, ‘형태학 - 시작하다’에서는 스테머, 형태소 분석기 및 형태소 생성기 개발 방법을 다룬다.
4장, ‘품사 태깅 - 단어 식별’에서는 품사 태깅 및 n-gram 접근법을 포함한 통계 모델링을 다룬다.
5장, ‘파싱 - 훈련 데이터 분석’에서는 트리 뱅크 구성, CFG 구성, CYK 알고리즘, 차트 파싱 알고리즘 및 음역의 개념에 대한 정보를 살펴본다.
6장, ‘의미 분석 - 본질 표현’에서는 얕은 의미 분석과 WordNet을 사용하는 WSD의 개념과 애플리케이션에 대해 살펴본다.
7장, ‘감정 분석 - 나는 행복하다’에서는 감정 분석의 개념을 이해하고 적용하는 데 도움이 되는 정보를 제공한다.
8장, ‘정보 검색 - 정보 접속’에서는 정보 검색 및 텍스트 요약의 개념을 이해하고 적용한다.
9장, ‘담화 분석 - 아는 것은 믿는 것이다’에서는 담화 분석 시스템과 대용어 복원 기반 시스템을 개발한다.
10장, ‘NLP 시스템의 평가 - 성능 분석’에서는 NLP 시스템을 평가하는 개념을 이해하고 적용하는 방법에 대해 살펴본다.
정보제공 :
저자소개
딥티 초프라(지은이)
바나스탈리 대학(Banasthali University)의 조교수다. 주요 연구 분야는 전산 언어학, 자연어 처리 및 인공지능이다. 여러 저널 및 컨퍼런스에서 간행물을 발간했으며 관련 프로그램 위원회에서도 활동하고 있다.
니쉬트 조쉬(지은이)
바나스탈리 대학(Banasthali University)의 부교수다. 관심 분야는 전산 언어학, 자연어 처리 및 인공지능이다. 인도에서 언어 기술 기금 및 연구(Language Technology Funding and Research)를 총괄하는 최상위 기관인 인도 정부(Govt) 정보 기술부(Department of Information Technology)에서 TDIL 프로그램의 배심 전문가로도 활동하고 있다. 여러 저널 및 컨퍼런스에서 간행물을 발간했으며 관련 프로그램 위원회 및 편집 위원으로도 활동한다.
이티 마투르(지은이)
바나스탈리 대학(Banasthali University)의 조교수다. 관심 분야는 전산 의미론 및 온톨로지 공학(ontological engineering)이다. 인도 정부(Govt)의 전자 정보 기술부(Department of Electronics and Information Technology,DeitY TDIL) 프로그램의 배심 전문가로도 활동하고 있다. 여러 저널 및 컨퍼런스에서 간행물을 발간했으며 관련 프로그램 위원회 및 편집 위원으로 활동한다.
유연재(옮긴이)
프로그램 개발과 관련한 모든 분야에 관심이 많다. 항상 부족한 것이 많다고 생각하며 노력하는 40대 프로그래머다. 현재는 보험의 디지털 혁신을 꿈꾸는 캐롯손해보험에서 일반보험 IT 개발을 담당하고 있다. 에이콘출판사에서 출간한 『자바 네트워크 프로그래밍』(2016), 『파이썬과 자연어 처리』(2017), 『파이썬 비즈니스 자동화』(2018)를 번역했다.
목차
1장. 문자열을 사용한 작업 __토큰화 ____텍스트를 문장으로 토큰화 ____다양한 언어의 텍스트 토큰화 ____문장을 단어로 토큰화 ____TreebankWordTokenizer를 사용한 토큰화 ____정규 표현식을 사용한 토큰화 __정규화 ____문장 부호 제거 ____소문자와 대문자로 변환 ____불용어 처리 ____영어의 불용어 계산 __토큰의 대체 및 수정 ____정규 표현식을 사용한 단어 대체 ____텍스트를 다른 텍스트로 대체하는 예제 ____토큰화 전에 대체 수행 ____반복되는 문자 처리 ____반복 문자를 삭제하는 예제 ____단어를 동의어로 대체 ____단어를 동의어로 대체하는 예제 __텍스트에 지프의 법칙 적용 __유사 척도 ____편집 거리 알고리즘을 사용한 유사 척도 ____자카드 계수를 사용한 유사 척도 ____스미스 워터맨 거리를 사용한 유사 척도 적용 ____그 외 문자열 유사도 메트릭 __요약 2장. 통계 언어 모델링 __단어 빈도 이해 ____주어진 텍스트의 MLE 개발 ____은닉 마르코프 모델 추정 __MLE 모델의 스무딩 적용 ____에드온 스무딩 ____Good Turing ____크네저 네이 추정 ____위튼 벨 추정 __MLE의 백-오프 메커니즘 개발 __믹스 앤 매치를 얻기 위한 데이터 보간법 적용 __혼잡도를 통한 언어 모델 평가 __모델링 언어에서 메트로폴리스 헤이스팅스 적용 __언어 처리에서 깁스 샘플링 적용 __요약 3장. 형태학 ? 시작하기 __형태학 소개 __스테머 이해 __원형복원 이해 __비영어 언어의 스테머 개발 __형태소 분석기 __형태소 생성기 __검색 엔진 __요약 4장. 품사 태깅 - 단어 식별 __품사 태깅 소개 ____기본 태깅 __POS-tagged corpora 생성 __기계 학습 알고리즘 선택 __n-gram 접근법과 관련된 통계 모델링 __pos-tagged data를 사용한 청커 개발 __요약 5장. 파싱 - 훈련 데이터 분석 __파싱 소개 __트리뱅크 구성 __트리뱅크의 문맥 자유 문법 규칙 추출 __CFG에서 확률적 문맥 자유 문법 생성 __CYK 차트 파싱 알고리즘 __Earley 차트 파싱 알고리즘 __요약 6장. 의미 분석 - 본질 표현 __의미 분석 소개 ____NER 소개 ____은닉 마르코프 모델을 사용한 NER 시스템 ____기계 학습 툴킷을 사용한 NER 훈련 ____POS 태깅을 사용한 NER __Wordnet의 synset id 생성 __Wordnet을 사용한 의미 판별 __요약 7장. 감정 분석 - 나는 행복하다. __감정 분석 소개 ____NER를 사용한 감정 분석 ____기계 학습을 사용한 감정 분석 ____NER 시스템의 평가 __요약 8장. 정보 검색 - 정보 접속 __정보 검색 소개 ____불용어 제거 ____벡터 공간 모델을 사용한 정보 검색 __벡터 공간 스코링 및 질의 연산자 상호 작용 __잠재 의미 색인을 이용한 IR 시스템 개발 __텍스트 요약 __질의 응답 시스템 __요약 9장. 담화 분석 - 아는 것은 믿는 것이다. __담화 분석 소개 ____중심화 이론을 사용한 담화 분석 ____대용어복원 __요약 10장. NLP 시스템의 평가 - 성능 분석 __NLP 시스템 평가의 필요성 ____NLP 도구(POS 태거, 스테머, 형태소 분석기) 평가 ____골드 데이터를 사용한 파서 평가 __IR 시스템의 평가 __오류 식별 메트릭 __어휘 매칭 기반 메트릭 __구문 매칭 기반 메트릭 __얕은 의미 매칭을 사용한 메트릭 __요약


