| 000 | 00000cam c2200205 c 4500 | |
| 001 | 000045922781 | |
| 005 | 20251114174725 | |
| 007 | ta | |
| 008 | 171208s2017 ulka b 001c kor | |
| 020 | ▼a 9791160502152 ▼g 93560 | |
| 035 | ▼a (KERIS)BIB000014543799 | |
| 040 | ▼a 211062 ▼c 211062 ▼d 211009 | |
| 041 | 1 | ▼a kor ▼h eng |
| 082 | 0 4 | ▼a 005.74 ▼2 23 |
| 085 | ▼a 005.74 ▼2 DDCK | |
| 090 | ▼a 005.74 ▼b 2017z4 | |
| 100 | 1 | ▼a Zinoviev, Dmitry ▼0 AUTH(211009)63863 |
| 245 | 1 0 | ▼a 모두의 데이터 과학 with 파이썬 / ▼d 드미트리 지노비에프 지음 ; ▼e 황준식 옮김 |
| 246 | 1 9 | ▼a Data science essentials in Python : ▼b collect - organize - explore - predict - value |
| 260 | ▼a 서울 : ▼b 길벗, ▼c 2017 ▼g (2018 2쇄) | |
| 300 | ▼a 292 p. : ▼b 천연색삽화 ; ▼c 24 cm | |
| 500 | ▼a 부록: A. 더 읽어 보기, B. 별 1개짜리 연습문제 해답 보기, C. 실습 환경 설정하기 | |
| 504 | ▼a 참고문헌(p. 287)과 색인수록 | |
| 700 | 1 | ▼a 황준식, ▼e 역 ▼0 AUTH(211009)160363 |
| 900 | 1 0 | ▼a 지노비에프, 드미트리, ▼e 저 |
소장정보
| No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
|---|---|---|---|---|---|---|---|
| No. 1 | 소장처 과학도서관/Sci-Info(1층서고)/ | 청구기호 005.74 2017z4 | 등록번호 121251689 (10회 대출) | 도서상태 대출중 | 반납예정일 2026-05-11 | 예약 예약가능 | 서비스 |
| No. 2 | 소장처 세종학술정보원/과학기술실(5층)/ | 청구기호 005.74 2017z4 | 등록번호 151337945 (17회 대출) | 도서상태 대출중 | 반납예정일 2026-03-31 | 예약 예약가능 | 서비스 |
| No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
|---|---|---|---|---|---|---|---|
| No. 1 | 소장처 과학도서관/Sci-Info(1층서고)/ | 청구기호 005.74 2017z4 | 등록번호 121251689 (10회 대출) | 도서상태 대출중 | 반납예정일 2026-05-11 | 예약 예약가능 | 서비스 |
| No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
|---|---|---|---|---|---|---|---|
| No. 1 | 소장처 세종학술정보원/과학기술실(5층)/ | 청구기호 005.74 2017z4 | 등록번호 151337945 (17회 대출) | 도서상태 대출중 | 반납예정일 2026-03-31 | 예약 예약가능 | 서비스 |
컨텐츠정보
책소개
데이터 과학의 개념을 알아보고, 데이터 과학에서 주로 사용하는 파이썬의 핵심 내용을 살펴보는 한편, HTML, CSV, JSON 파일, 수치형 및 테이블형 데이터를 Beautiful Soup, NLTK, NumPy, Pandas를 사용해 분석하고 그래프를 만들어 보면서 실제로 데이터를 어떻게 다루고 활용할 수 있는지 이해할 수 있다. 초보자와 비전공자가 배울 수 있게 최대한 전문 용어와 복잡한 수학을 사용하지 않고 설명해 이해를 돕는다.
빅데이터 시대, 왜 데이터 과학인가?
데이터를 분석해 의미를 찾는 것이 중요하다!
<모두의 데이터 과학 with 파이썬>은 초보자와 비전공자가 배울 수 있게 최대한 전문 용어와 복잡한 수학을 사용하지 않고 설명한다. 먼저 데이터 과학의 개념을 알아보고, 데이터 과학에서 주로 사용하는 파이썬의 핵심 내용을 살펴본다. 또한 HTML, CSV, JSON 파일, 수치형 및 테이블형 데이터를 Beautiful Soup, NLTK, NumPy, Pandas를 사용해 분석하고 그래프를 만들어 보면서 실제로 데이터를 어떻게 다루고 활용할 수 있는지 이해할 수 있다. 데이터 과학이 처음이라면 고민하지 말고 시작해 보자!
누구나 파이썬으로 데이터를 분석하고 시각화할 수 있다!
UNIT 1~12 | 데이터 과학의 개념과 파이썬 핵심 배우기
데이터 과학이 무엇인지 개념을 알아보고, 기본 문자열 함수, 자료구조, 카운터, 리스트, 정규 표현식, pickle과 같은 데이터 과학에서 주로 사용하는 파이썬 핵심도 배웁니다.
UNIT 13~40 | 다양한 데이터 다루기
HTML, CSV, JSON 파일 등의 텍스트를 Beautiful Soup, NLTK를 사용해 다루는 방법, NumPy를 사용해 수치형 데이터를 처리하는 방법, Pandas를 사용해 테이블형 데이터를 다루는 방법, NetworkX를 사용한 네트워크 분석을 다룹니다. MySQL(관계형 데이터베이스)과 MongoDB(비관계형 데이터베이스)와 같은 외부 데이터베이스를 사용하는 방법도 설명합니다.
UNIT 41~51 | 데이터 시각화와 확률 통계, 머신 러닝
pyplot, Pandas를 사용해 여러 가지 플롯을 그리고 꾸미는 방법을 설명합니다. 예측 분석, 확률 분포, 파이썬 통계 분석, K-평균 클러스터링으로 데이터 묶기, 랜덤 포레스트와 같은 색다른 주제도 간단히 살펴봅니다.
정보제공 :
저자소개
드미트리 지노비에프(지은이)
모스크바 국립 대학교에서 물리학 석사 학위를, 스토니브룩대학교에서 컴퓨터공학 박사 학위를 취득했다. 주요 연구 분야는 컴퓨터 시뮬레이션과 모델링, 네트워크 과학, 소셜 네트워크 분석, 디지털 인류학이다. 2001년부터 매사추세츠 보스턴에 위치한 서퍽대학교에서 학생들을 가르치고 있다.
황준식(옮긴이)
대학을 졸업한 후 뒤늦게 데이터 분석과 머신러닝의 세계를 알게 되었다. 즐거운 배움의 길을 걷다 보니 현재 넥슨 코리아에서 머신러닝을 이용해 다양한 문제에 도전하고 있다. 호기심을 실험과 기록으로 남기는 개인 블로그 jsideas.net을 운영 중이며, <모두의 데이터 과학 with 파이썬>(길벗, 2017), <머신러닝을 다루는 기술 with 파이썬, 사이킷런>(길벗, 2020)을 번역했다.
목차
목차 추천사 = 3 지은이 머리말 = 4 옮긴이 머리말 = 5 이 책의 구성과 활용법 = 6 1장 데이터 과학이란? UNIT 01 데이터 분석 과정 = 15 UNIT 02 데이터 수집 파이프라인 = 17 UNIT 03 보고서 구조 = 19 해보자 = 20 2장 데이터 과학에서 파이썬의 핵심 알기 UNIT 04 기본 문자열 함수 이해하기 = 23 UNIT 05 올바른 자료구조 선택하기 = 27 UNIT 06 리스트 내포로 리스트 이해하기 = 29 UNIT 07 카운터로 세기 = 31 UNIT 08 파일 다루기 = 32 UNIT 09 웹에 접근하기 = 34 UNIT 10 정규 표현식으로 패턴 매칭하기 = 36 UNIT 11 파일과 기타 스트링 다루기 = 42 UNIT 12 pickle로 데이터 압축하기 = 43 해보자 = 44 3장 텍스트 데이터 다루기 UNIT 13 HTML 파일 처리하기 = 47 UNIT 14 CSV 파일 다루기 = 53 UNIT 15 JSON 파일 읽기 = 56 UNIT 16 자연어 처리하기 = 59 해보자 = 67 4장 데이터베이스 다루기 UNIT 17 MySQL 데이터베이스 설정하기 = 71 UNIT 18 MySQL 사용하기 : 명령줄 = 75 UNIT 19 MySQL 사용하기 : pymysql = 81 UNIT 20 문서 다루기 : MongoDB = 83 해보자 = 88 5장 테이블형 수치 데이터 다루기 UNIT 21 배열 만들기 = 91 UNIT 22 행열 전환과 형태 변형하기 = 95 UNIT 23 인덱싱과 자르기 = 98 UNIT 24 브로드캐스팅 = 101 UNIT 25 유니버셜 함수 파헤치기 = 103 UNIT 26 조건부 함수 이해하기 = 106 UNIT 27 배열 집계와 정렬하기 = 108 UNIT 28 배열을 셋처럼 다루기 = 110 UNIT 29 배열 저장하고 읽기 = 112 UNIT 30 합성 사인파 만들기 = 113 해보자 = 116 6장 데이터 시리즈와 프레임 다루기 UNIT 31 Pandas 데이터 구조에 익숙해지기 = 121 UNIT 32 데이터 모양 바꾸기 = 131 UNIT 33 데이터 누락 다루기 = 140 UNIT 34 데이터 합치기 = 144 UNIT 35 데이터 정렬하기 = 151 UNIT 36 데이터 변환하기 = 158 UNIT 37 Pandas 파일 입출력 다루기 = 167 해보자 = 172 7장 네트워크 데이터 다루기 UNIT 38 그래프 분해하기 = 177 UNIT 39 네트워크 분석 순서 = 182 UNIT 40 NetworkX 사용하기 = 183 해보자 = 194 8장 플로팅하기 UNIT 41 pyplot으로 기본 플롯 그리기 = 199 UNIT 42 다른 플롯 타입 알아보기 = 203 UNIT 43 플롯 꾸미기 = 204 UNIT 44 Pandas로 플롯 그리기 = 207 해보자 = 210 9장 확률과 통계 UNIT 45 확률 분포 다시 보기 = 213 UNIT 46 통계 방법론 다시 보기 = 216 UNIT 47 파이썬으로 통계 분석하기 = 219 해보자 = 225 10장 머신 러닝 UNIT 48 예측 실험 디자인하기 = 229 UNIT 49 회귀 직선 적합하기 = 232 UNIT 50 K-평균 클러스터링으로 데이터 묶기 = 239 UNIT 51 랜덤 포레스트에서 살아남기 = 243 해보자 = 246 부록 부록A 더 읽어 보기 = 250 부록B 별 1개짜리 연습문제 해답 보기 = 252 부록C 실습 환경 설정하기 = 264 참고문헌 = 287 찾아보기 = 288



