HOME > 상세정보

상세정보

자연어 처리 쿡북 with 파이썬 : 파이썬으로 NLP를 구현하는 60여가지 레시피 (56회 대출)

자료유형
단행본
개인저자
Bhavsar, Krishna Naresh Kumar, 저 Dangeti, Pratap, 저 지은, 역
서명 / 저자사항
자연어 처리 쿡북 with 파이썬 : 파이썬으로 NLP를 구현하는 60여가지 레시피 / 크리슈나 바브사, 나레쉬 쿠마르, 프라탑 단게티 지음 ; 지은 옮김
발행사항
서울 :   에이콘출판,   2019  
형태사항
341 p. : 삽화 ; 24 cm
총서사항
acorn+PACKT technical book
원표제
Natural language processing with Python cookbook
ISBN
9791161752655 9788960772106 (세트)
일반주기
색인수록  
000 00000cam c2200205 c 4500
001 000045971256
005 20190218165841
007 ta
008 190216s2019 ulka 001c kor
020 ▼a 9791161752655 ▼g 94000
020 1 ▼a 9788960772106 (세트)
035 ▼a (KERIS)BIB000015051420
040 ▼a 222003 ▼c 222003 ▼d 211009
041 1 ▼a kor ▼h eng
082 0 4 ▼a 006.35 ▼2 23
085 ▼a 006.35 ▼2 DDCK
090 ▼a 006.35 ▼b 2019
100 1 ▼a Bhavsar, Krishna
245 1 0 ▼a 자연어 처리 쿡북 with 파이썬 : ▼b 파이썬으로 NLP를 구현하는 60여가지 레시피 / ▼d 크리슈나 바브사, ▼e 나레쉬 쿠마르, ▼e 프라탑 단게티 지음 ; ▼e 지은 옮김
246 1 9 ▼a Natural language processing with Python cookbook
260 ▼a 서울 : ▼b 에이콘출판, ▼c 2019
300 ▼a 341 p. : ▼b 삽화 ; ▼c 24 cm
440 0 0 ▼a acorn+PACKT technical book
500 ▼a 색인수록
700 1 ▼a Naresh Kumar, ▼e
700 1 ▼a Dangeti, Pratap, ▼e
700 0 ▼a 지은, ▼e
900 1 0 ▼a 바브사, 크리슈나, ▼e
900 1 0 ▼a 쿠마르, 나레쉬, ▼e
900 1 0 ▼a 단게티, 프라탑, ▼e
945 ▼a KLPA

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 중앙도서관/제2자료실(3층)/ 청구기호 006.35 2019 등록번호 111805051 (18회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 2 소장처 중앙도서관/제2자료실(3층)/ 청구기호 006.35 2019 등록번호 111806498 (19회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 3 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 006.35 2019 등록번호 121247983 (19회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 중앙도서관/제2자료실(3층)/ 청구기호 006.35 2019 등록번호 111805051 (18회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 2 소장처 중앙도서관/제2자료실(3층)/ 청구기호 006.35 2019 등록번호 111806498 (19회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 006.35 2019 등록번호 121247983 (19회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M

컨텐츠정보

책소개

최고의 플랫폼인 파이썬과 자연어 툴킷(NLTK)을 이용해 자연어 처리(NLP)를 수행하는 다양한 방법을 알려주는 독창적인 레시피가 담긴 책이다. 자연어 이해(NLU), 자연어 처리, 구문 분석 등 다양한 주제를 포함해 자연어를 다루는 데 사용할 수 있는 60여 개의 레시피를 접할 수 있다. 자연어 처리에 입문하면서 궁금한 부분이 생기면 레시피를 찾아보듯이 필요한 부분을 꺼내볼 수 있게 구성했다. 실용적인 감정 분석부터 최신 딥러닝 기술의 적용 방법까지 배울 수 있다. 이 책을 마치면 파이썬으로 NLP를 구현하는 데 필요한 모든 지식을 얻게 될 것이다.

★ 이 책에서 다루는 내용 ★

■ NLTK에서 사용할 수 있는 다양한 말뭉치 탐색과 워드넷 말뭉치 사용법
■ HTML, RSS, PDF, 워드 문서 등과 같은 원시 텍스트 관리와 처리
■ 토큰화, 형태소 분석, 철자 검사기 등과 같은 기술을 사용해 원시 텍스트를 전처리하는 방법과 정규표현식을 사용한 구현
■ 정규표현식을 사용한 텍스트 분석의 패턴 일치 기본 사항
■ 품사 태거와 문법을 사용해 직접 만드는 방법
■ 개체명(NE) 추출 방법과 RD, 시프트 감소, 차트 파서 등의 파서
■ LSTM을 사용한 셰익스피어 소설에서의 텍스트 생성
■ BABI 데이터셋과 LSTM을 사용한 에피소드 모델링
■ 딥러닝을 통해 생성(generative) 방식으로 개발하는 챗봇

★ 이 책의 대상 독자 ★

NLP를 사용해 고급 텍스트 분석을 구현하고자 기존 기술을 업그레이드하려는 데이터 과학자, 데이터 분석가를 대상으로 한다. 자연어 처리에 대한 몇 가지 기본 지식이 있으면 좋다.

★ 이 책의 구성 ★

1장, '말뭉치와 워드넷'에서는 NLTK에서 기본 제공하는 말뭉치와 빈도 분포에 접근하는 방법을 소개한다. 워드넷이 무엇인지 알아보고 그 기능과 사용법을 탐구할 것이다.
2장, '원시 텍스트, 소싱, 정규화'에서는 다양한 형식의 데이터 소스에서 텍스트를 추출하는 방법을 보여준다. 웹상에서 원시 텍스트를 추출하는 방법도 배우게 된다. 이러한 이질적인 소스로부터 원시 텍스트를 정규화하고, 텍스트를 말뭉치로 조직화할 것이다.
3장, '전처리'에서는 토큰화, 스테밍, 원형 복원, 편집 거리와 같이 몇 가지 중요한 사전 처리 단계를 소개한다.
4장, '정규표현식'에서는 가장 기본적이고 간단하지만 가장 중요하면서 강력한 도구 중 하나를 다룬다. 텍스트 분석을 수행하는 방법으로 패턴 매칭의 개념을 배우게 되며, 이를 위해 정규표현식보다 더 좋은 도구는 없다.
5장, '품사 태깅과 문법'에서는 품사 태깅은 구문 분석의 기초를 형성하며 문법은 품사 태그 및 청크를 사용해 형성되고 변형될 수 있다. 자체 품사 태거 및 문법을 사용하고 또 작성하는 법을 배운다.
6장, '청킹, 문장 구문 분석, 의존성'에서는 기본 제공 청커를 사용하는 방법을 배우고 자체 청커(의존성 파서)를 학습/작성하는 데 도움을 준다. 훈련된 모델을 평가하는 방법을 배우게 된다.
7장, '정보 추출과 텍스트 분류'에서는 개체명 인식에 대해 자세히 알려준다. 내장된 개체명을 사용하거나 딕셔너리를 사용해 개체명을 생성할 것이다. 기본 제공되는 텍스트 분류 알고리즘과 애플리케이션 주변의 간단한 레시피를 사용하는 방법을 배워보자.
8장, '고급 NLP 레시피'에서는 지금까지 모든 수업을 결합하고 실제 응용 문제에 쉽게 적용할 수 있는 응용 가능한 레시피를 만드는 방법에 관한 것이다. 텍스트 유사도, 요약, 감정 분석, 표현 합성, 대용어 처리 등과 같은 레시피를 작성한다.
9장, 'NLP에서의 딥러닝 적용'에서는 이메일 분류, CNN 및 LSTM의 감정 분류, 마지막으로 저차원 공간에서의 고차원 단어 시각화와 같은 NLP 문제의 애플리케이션을 사용하는 딥러닝에 필요한 다양한 기본적인 사항을 전달한다.
10장, 'NLP 분야에서 딥러닝의 고급 응용'에서는 딥러닝을 이용한 최첨단 문제 해결 방법을 설명한다. 단편적인 사건들로 이뤄진 데이터에 대한 답변, 다음 최상의 단어를 예측하기 위한 언어 모델링 그리고 생성 기법을 사용하는 챗봇(chatbot) 개발을 포함한다.


정보제공 : Aladin

저자소개

나레쉬 쿠마르(지은이)

「포춘(Fortune)」이 선정한 5백대 기업에서 대규모 인터넷 애플리케이션을 설계, 구현하고 운용하는 데 수십 년 이상의 전문 경험을 보유하고 있다. 전자상거래, 웹 호스팅, 의료, 빅데이터 및 분석, 데이터 스트리밍, 광고, 데이터베이스 등의 분야에서 실무 경험을 쌓은 풀스택 아키텍트다. 오픈소스를 신봉하며 적극적으로 기여한다. 리눅스 시스템 내부에서부터 프론트엔드에 이르기까지 최신식의 기술을 알고자 노력한다. 인도 라자스탄주(Rajasthan)에 있는 비츠 필라니(BITS-Pilani)대학에서 컴퓨터과학과 경제학을 복수 전공했다.

프라탑 단게티(지은이)

방갈로 TCS 혁신 연구소의 '분석과 통찰' 부서에서 구조화 이미지 및 텍스트 솔루션 개발과 관련된 머신 러닝과 딥러닝 솔루션을 개발하고 있다. 분석학과 데이터 과학 분야에 폭넓은 경험을 갖고 있으며, 봄베이 IIT에서 산업공학과 오퍼레이션 리서치로 석사 학위를 받았다. 인공지능에 큰 관심을 갖고 있으며, 쉬는 날에는 차세대 기술과 혁신적 기법과 관련된 책을 즐겨 읽는다.

크리슈나 바브사(지은이)

서비스업, 은행업, 헬스케어 등과 같은 다양한 산업 영역에서 10년간 근무하며 자연어 처리, 소셜미디어 분석, 텍스트 마이닝 작업을 했다. Stanford CoreNLP, IBM의 SystemText와 BigInsights, GATE, NLTK와 같은 다양한 NLP 라이브러리에서 텍스트 분석과 관련된 산업 문제를 해결하기 위해 연구했다. 또한 유명 TV 프로그램과 인기 있는 리테일 브랜드와 제품에 대한 소셜미디어 반응을 분석하는 일을 하고 있다. 2010년 NAACL에서 감정 분석 기술에 관한 논문을 발표했다. 최근에 NLP 파이프라인/툴 세트를 만들어 대중에게 오픈소스로 공개했다. 학문과 기술 외에도 오토바이와 축구에 대해 열정을 지니고 있다. 여가 시간에는 여행하고 탐험하는 것을 좋아한다. 오토바이로 인도를 일주하고 배낭여행으로 동남아시아와 유럽의 대부분의 국가를 여행했다.

지은(옮긴이)

인포메이션 아키텍처, 데이터 시각화, 콘텐츠 큐레이션 등 다방면에 관심이 많다. 장르를 불문하고, 글을 짓는 작가들 그리고 어떤 언어로 된 글을 다른 언어의 글로 옮기는 데 힘을 쏟고 있는 모든 이에게 경의를 표한다.

정보제공 : Aladin

목차

1장. 말뭉치와 워드넷 
__소개 
__내장 말뭉치 액세스 
__외부 말뭉치 다운로드, 로드하고 액세스하기 
__브라운 코퍼스에서 세 가지 장르의 wh 단어 모두 세기 
__웹 및 채팅 텍스트 자료 파일 중 하나에서 빈도 분포 작업 탐색 
__모호한 단어를 가지고 워드넷을 사용해 모든 의미 탐구 
__두 개의 구별되는 동의어 집합을 선택하고 워드넷을 사용해 상위어와 하위어 개념 탐색 
__워드넷으로 명사, 동사, 형용사, 부사의 다의어 평균 계산 

2장. 처리 전 텍스트, 소싱, 정규화 
__소개 
__문자열 연산의 중요성 
__문자열 연산 심화 
__파이썬에서 PDF 파일 읽기 
__파이썬에서 워드 문서 읽기 
__PDF, DOCX, 일반 텍스트 파일을 가져와 사용자 정의 말뭉치 생성 
__RSS 피드에서 내용 읽기 
__BeautifulSoup를 사용한 HTML 파싱 

3장. 전처리 
__소개 
__토큰화-NLTK 내장 토크나이저 사용법 
__스테밍-NLTK 내장 스테머 사용법 
__원형 복원-NLTK WordnetLemmatizer 사용법 
__불용어-불용어 말뭉치 사용법과 불용어가 만들어내는 차이점 확인 
__편집 거리-두 문자열 간의 편집 거리를 찾기 위한 알고리즘 작성 
__두 단문 처리와 둘 사이의 공통 어휘 추출 

4장. 정규표현식 
__소개 
__정규표현식-*, +, ? 사용법 
__정규표현식-$와 ^, 단어의 시작과 끝이 아닌 단어를 사용하는 방법 
__여러 개의 리터럴 문자열과 하위 문자열 검색 
__날짜 정규표현식과 문자 집합 또는 문자 범위 집합 만들기 
__문장에서 모든 다섯 글자 단어를 찾고 약어 만들기 
__자체 정규식 토크나이저 작성법 
__자체 정규식 스테머 작성법 

5장. 품사 태깅과 문법 
__소개 
__내장 태거 탐구 
__자체 태거 작성 
__자체 태거 학습 
__자체 문법 작성 학습 
__확률적 문맥 무관 문법-CFG 작성 
__재귀 CFG 작성 

6장. 청킹, 문장 구문 분석, 의존성 
__소개 
__내장 청커 사용 
__간단한 청커 작성 
__청커 학습 
__재귀 하향 구문 분석 
__시프트 변환 구문 분석 
__의존 문법과 투사 의존성 구문 분석 
__차트 구문 분석 

7장. 정보 추출과 텍스트 분류 
__소개 
__내장 개체명 인식 기능 사용 
__딕셔너리 생성, 반전, 사용 
__피처셋 선택 
__분류기를 사용한 문장 분할 
__문서 분류 
__문맥 기반 품사 태거 작성 

8장. 고급 NLP 레시피 
__소개 
__NLP 파이프라인 생성 
__텍스트 유사도 문제 해결 
__주제 식별 
__텍스트 요약 
__대용어 해결 
__단어 의미 명확화 
__감정 분석 수행 
__고급 감정 분석 탐색 
__대화형 비서 또는 챗봇 만들기 

9장. NLP의 딥러닝 적용 
__소개 
__TF-IDF 생성 후 심층 신경망을 이용한 이메일 분류 
__합성곱망 CNN 1D를 이용한 IMDB 감정 분류 
__양방향 LSTM을 이용한 IMDB 감정 분류 
__신경 단어 벡터 시각화를 사용해 고차원의 단어를 2차원으로 시각화 

10장. NLP 분야에서 딥러닝의 고급 응용 
__소개 
__LSTM을 사용해 셰익스피어의 저서에서 고급 자동 텍스트 생성 
__메모리 네트워크를 사용해 에피소드 데이터에 대한 질의 응답 
__순환 신경망을 사용해 다음 단어를 예측하는 언어 모델링-LSTM 
__딥러닝 순환망을 사용하는 생성 챗봇 개발-LSTM

관련분야 신착자료

Negro, Alessandro (2026)
Dyer-Witheford, Nick (2026)
양성봉 (2025)