고려대학교 세종학술정보원

이전 결과로 돌아가기 검색화면

MARC

자연어 처리 쿡북 with 파이썬 : 파이썬으로 NLP를 구현하는 60여가지 레시피 (56회 대출)

자료유형

단행본

개인저자

Bhavsar, Krishna Naresh Kumar, 저 Dangeti, Pratap, 저 지은, 역

서명 / 저자사항

자연어 처리 쿡북 with 파이썬 : 파이썬으로 NLP를 구현하는 60여가지 레시피 / 크리슈나 바브사, 나레쉬 쿠마르, 프라탑 단게티 지음 ; 지은 옮김

발행사항

서울 : 에이콘출판, 2019

형태사항

341 p. : 삽화 ; 24 cm

총서사항

acorn+PACKT technical book

원표제

Natural language processing with Python cookbook

ISBN

9791161752655 9788960772106 (세트)

일반주기

색인수록

000		00000cam c2200205 c 4500
001		000045971256
005		20190218165841
007		ta
008		190216s2019 ulka 001c kor
020		▼a 9791161752655 ▼g 94000
020	1	▼a 9788960772106 (세트)
035		▼a (KERIS)BIB000015051420
040		▼a 222003 ▼c 222003 ▼d 211009
041	1	▼a kor ▼h eng
082	0 4	▼a 006.35 ▼2 23
085		▼a 006.35 ▼2 DDCK
090		▼a 006.35 ▼b 2019
100	1	▼a Bhavsar, Krishna
245	1 0	▼a 자연어 처리 쿡북 with 파이썬 : ▼b 파이썬으로 NLP를 구현하는 60여가지 레시피 / ▼d 크리슈나 바브사, ▼e 나레쉬 쿠마르, ▼e 프라탑 단게티 지음 ; ▼e 지은 옮김
246	1 9	▼a Natural language processing with Python cookbook
260		▼a 서울 : ▼b 에이콘출판, ▼c 2019
300		▼a 341 p. : ▼b 삽화 ; ▼c 24 cm
440	0 0	▼a acorn+PACKT technical book
500		▼a 색인수록
700	1	▼a Naresh Kumar, ▼e 저
700	1	▼a Dangeti, Pratap, ▼e 저
700	0	▼a 지은, ▼e 역
900	1 0	▼a 바브사, 크리슈나, ▼e 저
900	1 0	▼a 쿠마르, 나레쉬, ▼e 저
900	1 0	▼a 단게티, 프라탑, ▼e 저
945		▼a KLPA

소장정보

No.	소장처	청구기호	등록번호	도서상태	반납예정일	예약	서비스
No. 1	소장처 중앙도서관/제2자료실(3층)/	청구기호 006.35 2019	등록번호 111805051 (18회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M
No. 2	소장처 중앙도서관/제2자료실(3층)/	청구기호 006.35 2019	등록번호 111806498 (19회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M
No. 3	소장처 과학도서관/Sci-Info(1층서고)/	청구기호 006.35 2019	등록번호 121247983 (19회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M

No.	소장처	청구기호	등록번호	도서상태	반납예정일	예약	서비스
No. 1	소장처 중앙도서관/제2자료실(3층)/	청구기호 006.35 2019	등록번호 111805051 (18회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M
No. 2	소장처 중앙도서관/제2자료실(3층)/	청구기호 006.35 2019	등록번호 111806498 (19회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M

No.	소장처	청구기호	등록번호	도서상태	반납예정일	예약	서비스
No. 1	소장처 과학도서관/Sci-Info(1층서고)/	청구기호 006.35 2019	등록번호 121247983 (19회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M

컨텐츠정보

책소개

최고의 플랫폼인 파이썬과 자연어 툴킷(NLTK)을 이용해 자연어 처리(NLP)를 수행하는 다양한 방법을 알려주는 독창적인 레시피가 담긴 책이다. 자연어 이해(NLU), 자연어 처리, 구문 분석 등 다양한 주제를 포함해 자연어를 다루는 데 사용할 수 있는 60여 개의 레시피를 접할 수 있다. 자연어 처리에 입문하면서 궁금한 부분이 생기면 레시피를 찾아보듯이 필요한 부분을 꺼내볼 수 있게 구성했다. 실용적인 감정 분석부터 최신 딥러닝 기술의 적용 방법까지 배울 수 있다. 이 책을 마치면 파이썬으로 NLP를 구현하는 데 필요한 모든 지식을 얻게 될 것이다.

★ 이 책에서 다루는 내용 ★

■ NLTK에서 사용할 수 있는 다양한 말뭉치 탐색과 워드넷 말뭉치 사용법
■ HTML, RSS, PDF, 워드 문서 등과 같은 원시 텍스트 관리와 처리
■ 토큰화, 형태소 분석, 철자 검사기 등과 같은 기술을 사용해 원시 텍스트를 전처리하는 방법과 정규표현식을 사용한 구현
■ 정규표현식을 사용한 텍스트 분석의 패턴 일치 기본 사항
■ 품사 태거와 문법을 사용해 직접 만드는 방법
■ 개체명(NE) 추출 방법과 RD, 시프트 감소, 차트 파서 등의 파서
■ LSTM을 사용한 셰익스피어 소설에서의 텍스트 생성
■ BABI 데이터셋과 LSTM을 사용한 에피소드 모델링
■ 딥러닝을 통해 생성(generative) 방식으로 개발하는 챗봇

★ 이 책의 대상 독자 ★

NLP를 사용해 고급 텍스트 분석을 구현하고자 기존 기술을 업그레이드하려는 데이터 과학자, 데이터 분석가를 대상으로 한다. 자연어 처리에 대한 몇 가지 기본 지식이 있으면 좋다.

★ 이 책의 구성 ★

1장, '말뭉치와 워드넷'에서는 NLTK에서 기본 제공하는 말뭉치와 빈도 분포에 접근하는 방법을 소개한다. 워드넷이 무엇인지 알아보고 그 기능과 사용법을 탐구할 것이다.
2장, '원시 텍스트, 소싱, 정규화'에서는 다양한 형식의 데이터 소스에서 텍스트를 추출하는 방법을 보여준다. 웹상에서 원시 텍스트를 추출하는 방법도 배우게 된다. 이러한 이질적인 소스로부터 원시 텍스트를 정규화하고, 텍스트를 말뭉치로 조직화할 것이다.
3장, '전처리'에서는 토큰화, 스테밍, 원형 복원, 편집 거리와 같이 몇 가지 중요한 사전 처리 단계를 소개한다.
4장, '정규표현식'에서는 가장 기본적이고 간단하지만 가장 중요하면서 강력한 도구 중 하나를 다룬다. 텍스트 분석을 수행하는 방법으로 패턴 매칭의 개념을 배우게 되며, 이를 위해 정규표현식보다 더 좋은 도구는 없다.
5장, '품사 태깅과 문법'에서는 품사 태깅은 구문 분석의 기초를 형성하며 문법은 품사 태그 및 청크를 사용해 형성되고 변형될 수 있다. 자체 품사 태거 및 문법을 사용하고 또 작성하는 법을 배운다.
6장, '청킹, 문장 구문 분석, 의존성'에서는 기본 제공 청커를 사용하는 방법을 배우고 자체 청커(의존성 파서)를 학습/작성하는 데 도움을 준다. 훈련된 모델을 평가하는 방법을 배우게 된다.
7장, '정보 추출과 텍스트 분류'에서는 개체명 인식에 대해 자세히 알려준다. 내장된 개체명을 사용하거나 딕셔너리를 사용해 개체명을 생성할 것이다. 기본 제공되는 텍스트 분류 알고리즘과 애플리케이션 주변의 간단한 레시피를 사용하는 방법을 배워보자.
8장, '고급 NLP 레시피'에서는 지금까지 모든 수업을 결합하고 실제 응용 문제에 쉽게 적용할 수 있는 응용 가능한 레시피를 만드는 방법에 관한 것이다. 텍스트 유사도, 요약, 감정 분석, 표현 합성, 대용어 처리 등과 같은 레시피를 작성한다.
9장, 'NLP에서의 딥러닝 적용'에서는 이메일 분류, CNN 및 LSTM의 감정 분류, 마지막으로 저차원 공간에서의 고차원 단어 시각화와 같은 NLP 문제의 애플리케이션을 사용하는 딥러닝에 필요한 다양한 기본적인 사항을 전달한다.
10장, 'NLP 분야에서 딥러닝의 고급 응용'에서는 딥러닝을 이용한 최첨단 문제 해결 방법을 설명한다. 단편적인 사건들로 이뤄진 데이터에 대한 답변, 다음 최상의 단어를 예측하기 위한 언어 모델링 그리고 생성 기법을 사용하는 챗봇(chatbot) 개발을 포함한다.

정보제공 :

펼치기

저자소개

나레쉬 쿠마르(지은이)

「포춘(Fortune)」이 선정한 5백대 기업에서 대규모 인터넷 애플리케이션을 설계, 구현하고 운용하는 데 수십 년 이상의 전문 경험을 보유하고 있다. 전자상거래, 웹 호스팅, 의료, 빅데이터 및 분석, 데이터 스트리밍, 광고, 데이터베이스 등의 분야에서 실무 경험을 쌓은 풀스택 아키텍트다. 오픈소스를 신봉하며 적극적으로 기여한다. 리눅스 시스템 내부에서부터 프론트엔드에 이르기까지 최신식의 기술을 알고자 노력한다. 인도 라자스탄주(Rajasthan)에 있는 비츠 필라니(BITS-Pilani)대학에서 컴퓨터과학과 경제학을 복수 전공했다.

프라탑 단게티(지은이)

방갈로 TCS 혁신 연구소의 '분석과 통찰' 부서에서 구조화 이미지 및 텍스트 솔루션 개발과 관련된 머신 러닝과 딥러닝 솔루션을 개발하고 있다. 분석학과 데이터 과학 분야에 폭넓은 경험을 갖고 있으며, 봄베이 IIT에서 산업공학과 오퍼레이션 리서치로 석사 학위를 받았다. 인공지능에 큰 관심을 갖고 있으며, 쉬는 날에는 차세대 기술과 혁신적 기법과 관련된 책을 즐겨 읽는다.

크리슈나 바브사(지은이)

서비스업, 은행업, 헬스케어 등과 같은 다양한 산업 영역에서 10년간 근무하며 자연어 처리, 소셜미디어 분석, 텍스트 마이닝 작업을 했다. Stanford CoreNLP, IBM의 SystemText와 BigInsights, GATE, NLTK와 같은 다양한 NLP 라이브러리에서 텍스트 분석과 관련된 산업 문제를 해결하기 위해 연구했다. 또한 유명 TV 프로그램과 인기 있는 리테일 브랜드와 제품에 대한 소셜미디어 반응을 분석하는 일을 하고 있다. 2010년 NAACL에서 감정 분석 기술에 관한 논문을 발표했다. 최근에 NLP 파이프라인/툴 세트를 만들어 대중에게 오픈소스로 공개했다. 학문과 기술 외에도 오토바이와 축구에 대해 열정을 지니고 있다. 여가 시간에는 여행하고 탐험하는 것을 좋아한다. 오토바이로 인도를 일주하고 배낭여행으로 동남아시아와 유럽의 대부분의 국가를 여행했다.

지은(옮긴이)

인포메이션 아키텍처, 데이터 시각화, 콘텐츠 큐레이션 등 다방면에 관심이 많다. 장르를 불문하고, 글을 짓는 작가들 그리고 어떤 언어로 된 글을 다른 언어의 글로 옮기는 데 힘을 쏟고 있는 모든 이에게 경의를 표한다.