| 000 | 00000cam c2200205 c 4500 | |
| 001 | 000046220899 | |
| 005 | 20260327143259 | |
| 007 | ta | |
| 008 | 260323s2026 ulkad 001c kor | |
| 020 | ▼a 9788966265145 ▼g 93000 | |
| 035 | ▼a (KERIS)BIB000017378549 | |
| 040 | ▼a 211019 ▼c 211019 ▼d 211009 | |
| 041 | 1 | ▼a kor ▼h eng |
| 082 | 0 4 | ▼a 006.312 ▼a 004 ▼2 23 |
| 085 | ▼a 006.312 ▼2 DDCK | |
| 090 | ▼a 006.312 ▼b 2026z1 | |
| 100 | 1 | ▼a Wickham, Hadley ▼0 AUTH(211009)136127 |
| 245 | 1 0 | ▼a R을 활용한 데이터 과학 : ▼b 데이터 불러오기, 정돈하기, 변형하기, 시각화하기 / ▼d 해들리 위컴, ▼e 미네 체틴카야-룬델, ▼e 개럿 그롤먼드 지음 ; ▼e 김영우 옮김 |
| 246 | 1 9 | ▼a R for data science : ▼b import, tidy, transform, visualize, and model data ▼g (2nd ed.) |
| 246 | 3 9 | ▼a R for data science : ▼b import, tidy, transform, and visualize data |
| 260 | ▼a 서울 : ▼b 인사이트, ▼c 2026 | |
| 300 | ▼a xxviii, 627 p. : ▼b 삽화(일부천연색), 도표 ; ▼c 24 cm | |
| 490 | 1 0 | ▼a 프로그래밍 인사이트 |
| 500 | ▼a 색인수록 | |
| 650 | 0 | ▼a Data mining ▼x Computer programs |
| 650 | 0 | ▼a Information visualization ▼x Computer programs |
| 650 | 0 | ▼a R (Computer program language) |
| 650 | 0 | ▼a Big data |
| 700 | 1 | ▼a Çetinkaya-Rundel, Mine, ▼e 저 |
| 700 | 1 | ▼a Grolemund, Garrett, ▼e 저 ▼0 AUTH(211009)89899 |
| 700 | 1 | ▼a 김영우, ▼e 역 |
| 830 | 0 | ▼a 프로그래밍 인사이트 |
| 900 | 1 0 | ▼a 위컴, 해들리, ▼e 저 |
| 900 | 1 0 | ▼a 체틴카야-룬델, 미네, ▼e 저 |
| 900 | 1 0 | ▼a 그롤먼드, 개럿, ▼e 저 |
| 945 | ▼a ITMT |
소장정보
| No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
|---|---|---|---|---|---|---|---|
| No. 1 | 소장처 중앙도서관/제2자료실(3층)/ | 청구기호 006.312 2026z1 | 등록번호 111921499 | 도서상태 정리중 | 반납예정일 | 예약 예약가능 | 서비스 |
컨텐츠정보
책소개
예비 데이터 과학자를 위해 R과 RStudio를 활용한 데이터 분석 방법을 설명하는 실용서다. 데이터 과학을 빠르고 효율적이며 재미있게 만들어 주는 R 패키지 모음인 tidyverse를 통해 실제 분석 과정을 익힐 수 있다. 프로그래밍 경험이 전혀 없더라도 이 책과 함께라면 빠르게 데이터 과학을 시작할 수 있다.
데이터를 불러오고 변형하고 시각화하며 결과를 바탕으로 의사소통하는 방법을 단계적으로 다룬다. 개정판에서는 최신 tidyverse 기능과 우수 사례를 반영하고, 스프레드시트·데이터베이스·웹사이트에서 데이터를 가져오는 새로운 장을 추가했다. 연습문제를 통해 데이터 과학 프로세스 전반을 큰 흐름 속에서 이해하도록 돕는다.
전면 개정되어 돌아온, 데이터 과학 분야의 바이블
이 책은 예비 데이터 과학자를 위해 R과 RStudio를 활용한 데이터 분석 방법을 설명하는 실용서입니다. 데이터 과학을 빠르고 효율적이며 재미있게 만들어 주는 R 패키지 모음인 tidyverse를 통해 실제 분석 과정을 익힐 수 있습니다. 따라서 프로그래밍 경험이 전혀 없더라도, 이 책과 함께라면 빠르게 데이터 과학을 시작할 수 있습니다.
독자들은 이 책을 통해 데이터를 불러오고, 변형하고, 시각화하고, 결과를 바탕으로 의사소통하는 방법을 익힐 수 있습니다. 또한 데이터 과학 프로세스 전체를 큰 그림으로 이해하고 세부 요소를 다루는 데 필요한 기본 도구도 폭넓게 이해할 수 있습니다.
이번 개정판에서는 최신 tidyverse 기능과 우수 사례들이 업데이트되었으며, 스프레드시트, 데이터베이스, 웹사이트에서 데이터를 가져오는 방법을 익히는 새로운 장도 추가되었습니다. 연습문제를 풀면서 책에서 익힌 내용을 복습할 수도 있습니다.
이 책에서 다루는 내용
? 시각화하기: 데이터를 탐색하고 분석 결과를 전달하는 데 필요한 그래프를 만듭니다.
? 변형하기: 변수 타입과 이를 다루는 도구를 익힙니다.
? 불러오기: 데이터를 R로 가져오고 분석하기 편한 형태로 만듭니다.
? 프로그래밍하기: 더 명확하고 쉽게 데이터 문제를 해결하는 R 도구를 익힙니다.
? 의사소통하기: Quarto를 이용해 글, 코드, 분석 결과를 통합한 보고서를 만듭니다.
정보제공 :
저자소개
해들리 위컴(지은이)
Posit, PBC의 수석 과학자이며, 2019년 COPSS 상 수상자이자 R 파운데이션 회원이다. 데이터 과학을 더 쉽고 빠르고 재미있게 만들기 위해 프로그래밍 도구와 개념적 도구를 만들고 있으며, 데이터 과학용 패키지(ggplot2, dplyr, tidyr을 포함하는 tidyverse)와 체계적인 소프트웨어 개발 도구(roxygen2, testthat, pkgdown 등)를 개발하였다. R을 이용한 데이터 과학 활동을 장려하기 위해 작가, 교육자, 연사로도 활동하고 있다. 자세한 소개는 그의 웹사이트(http://hadley.nz)에서 확인할 수 있다.
개럿 그롤문드(지은이)
통계학자이면서 가르치는 일도 하고 있는 RStudio의 R 개발자다. 그는 데이터과학 분야야말로 산업 분야와 학계 전반에 기여할 큰 가능성이 잠재되어 있다고 말한다. 가렛은 라이스 대학교의 해들리 위크햄 연구실에서 박사학위를 받았다. 인식론적 과정을 통해 데이터과학의 근원적인 부분에 대해 연구했고, 주의적이고 인식론적인 관심사가 어떻게 데이터분석에 영향을 주는지 알아보았다. 데이터과학을 공부하면서 그가 맛보았던 좌절감과 불필요한 과정을 다른 사람들이 겪지 않도록 돕는 일에 매우 열심이다. 박사학위 논문을 마치기도 전에 벌써 레볼루션 애널리틱스에서 잘나가는 기업들을 대상으로 R과 데이터분석을 교육하는 일을 시작했다. 그는 구글, 이베이, 로슈를 비롯한 다른 많은 기업에서 교육을 진행해왔고, 현재 RStudio를 사용하는 유용한 노하우를 더 이해하기 쉽도록 교육 커리큘럼을 개발하는 일을 한다. 교육과 관련된 일 외에도, 가렛은 임상 실험 연구, 법률 연구, 재무 분석을 하며 시간을 보낸다. 물론 R 소프트웨어도 개발 중이다. 날짜/시간 값을 파싱하고, 쉽게 다루고, 산술 연산까지 가능하게 하는 R 패키지 lubridate를 공동 개발했다. 그리고 ggplot2의 확장 패키지인 ggsubplot을 개발했다.
미네 체틴카야-룬델(지은이)
듀크대학교 통계과학과 실무 교수이자 Posit, PBC의 개발자 교육 담당자이다. 주요 연구 분야는 통계학과 데이터 과학 교육학이며, 특히 컴퓨팅, 재현 가능한 연구, 학생 중심 학습, 오픈 소스 교육에 역점을 두고 있다. OpenIntro 프로젝트의 일환으로 통계학 입문 교과서를 집필하였고, Data Science in a Box를 만들어 관리하고 있다. 또한 코세라의 인기 과정인 Statistics with R specialization을 개설해 운영하고 있다. 그녀는 2021년 Hogg 어워드의 입문 통계학 교육 부문 우수상, 2018년 하버드 피카드 상, 2016년 ASA 월러 교육상을 받았다. 자세한 소개는 그녀의 웹사이트(https://mine-cr.com)에서 확인할 수 있다.
김영우(옮긴이)
데이터로 세상을 이해하는 일을 하는 데이터 분석가이다. 기업, 대학, 연구 기관, 시민 단체 등 다양한 조직의 데이터 분석 프로젝트를 진행하고 있다. 측정, 실험, 데이터를 좋아하고, 혈액형 성격론, 타로 카드, 자기계발서를 싫어한다. 데이터에 기반을 둔 대화를 추구하므로 지인들로부터 신뢰할 만하다는 평을 듣지만 친구는 별로 없다. 현재 초보자도 어깨춤을 추며 데이터를 분석하게 만드는 강의를 진행하고 있으며, SKT, KT, 삼성금융연수원, LG인화원, 멀티캠퍼스, 패스트캠퍼스 등에서 강의했다. 데이터 관련 분야의 다양한 소식과 실무 노하우를 전하는 유튜브 채널 ‘데이터홀릭’을 운영하고 있다. 레어템을 좋아하는 여인에게 수집돼 함께 살고 있으며, 가장 효율적으로 아무것도 안 하는 고양이 두 마리를 모시고 있다.
목차
옮긴이의 글
지은이의 글
1부 전체 흐름
1장 데이터 시각화하기
들어가며
첫 단계
ggplot2 호출하기
분포 시각화하기
변수의 관계 시각화하기
그래프 저장하기
자주 겪는 문제들
요약
2장 워크플로우: 기초
코딩 기초
주석
이름을 어떻게 지을까?
함수 호출하기
연습문제
요약
3장 데이터 변형하기
들어가며
행
열
파이프
그룹화
사례 연구: 집계와 샘플 크기
요약
4장 워크플로우: 코드 스타일
이름 짓기
공백 넣기
파이프
ggplot2
구획 나누기 주석
연습문제
요약
5장 데이터 정돈하기
들어가며
정돈된 데이터
데이터를 세로로 늘이기
데이터를 가로로 넓히기
요약 97
6장 워크플로우: 스크립트와 프로젝트
스크립트
프로젝트
연습문제
요약
7장 데이터 불러오기
들어가며
파일에서 데이터 불러오기
열 타입 다루기
여러 파일에서 데이터 불러오기
데이터를 파일로 저장하기
데이터 입력하기
요약
8장 워크플로우: 도움 구하기
구글은 우리의 친구
reprex 만들기
자신에게 투자하기
요약
2부 시각화하기
9장 레이어
들어가며
시각적 속성 매핑
기하학 객체
패싯
통계적 변환
위치 조정
좌표계
그래픽 문법의 레이어 구조
요약
10장 탐색적 자료 분석
들어가며
질문
변동
특이한 값
공변동
패턴과 모델
요약
11장 의사소통
들어가며
레이블
주석
스케일
테마
레이아웃
요약
3부 변형하기
12장 논리형 벡터
들어가며
비교하기
불 대수
요약하기
조건부 변형
요약
13장 수치형 벡터
들어가며
숫자 만들기
개수 세기
수치 변환
일반적인 변형 방법들
수치 요약
요약
14장 문자열
들어가며
문자열 만들기
데이터를 이용해 여러 문자열 만들기
문자열에서 데이터 추출하기
글자 다루기
비영어 텍스트
요약
15장 정규 표현식
들어가며
기본적인 패턴
핵심 함수
패턴 세부 사항
패턴 제어하기
연습해 보기
다른 곳에서 정규 표현식 사용하기
요약
16장 팩터
들어가며
팩터 기초
종합사회조사
팩터 순서 바꾸기
팩터 레벨 수정하기
순서형 팩터
요약
17장 날짜와 시간
들어가며
날짜-시간형 변수 만들기
개별 구성 요소로 만들기
날짜-시간 구성 요소
시간 범위
시간대
요약
18장 결측치
들어가며
명시적 결측치
암묵적 결측치
팩터와 빈 그룹
요약
19장 조인
들어가며
키
기본적인 조인
조인은 어떻게 작동할까?
비등가 조인
요약
4부 데이터 불러오기
20장 스프레드시트
들어가며
엑셀
구글 시트
요약
21장 데이터베이스
들어가며
데이터베이스 기초
데이터베이스 연결하기
dbplyr 기초
SQL
함수 번역
요약
22장 Arrow
들어가며
데이터 가져오기
데이터셋 열기
파케이 포맷
dplyr을 arrow와 함께 사용하기
요약
23장 계층형 데이터
들어가며
리스트
펼치기
사례 연구
JSON
요약
24장 웹 스크래핑
들어가며
스크래핑의 윤리성과 합법성
HTML 기초
데이터 추출하기
올바른 선택자 찾기
모두 함께 사용하기
동적 사이트
요약
5부 프로그래밍
25장 함수
들어가며
벡터 함수
데이터 프레임 함수
그래프 함수
스타일
요약
26장 반복
들어가며
여러 열 수정하기
여러 파일 불러오기
여러 출력물 저장하기
요약
27장 base R 현장 가이드
들어가며
[로 여러 요소 선택하기
$와 [[로 단일 요소 선택하기
Apply 계열 함수
for 반복문
그래프
요약
6부 의사소통하기
28장 Quarto
들어가며
Quarto 기초
비주얼 에디터
소스 에디터
코드 청크
그림
표
캐싱
문제 해결하기
YAML 헤더
작업 흐름
요약
29장 Quarto 문서 포맷
들어가며
출력 옵션
다양한 문서 포맷
프레젠테이션
상호작용 문서
웹사이트와 책 만들기
기타 포맷
요약
정보제공 :



