| 000 | 00000cam c2200205 c 4500 | |
| 001 | 000046044259 | |
| 005 | 20220701100208 | |
| 007 | ta | |
| 008 | 200824s2020 ulkad 001c kor | |
| 020 | ▼a 9791161754321 ▼g 93000 | |
| 035 | ▼a (KERIS)BIB000015638730 | |
| 040 | ▼a 221010 ▼c 211009 ▼d 211009 | |
| 041 | 1 | ▼a kor ▼h eng |
| 082 | 0 4 | ▼a 006.31 ▼2 23 |
| 085 | ▼a 006.31 ▼2 DDCK | |
| 090 | ▼a 006.31 ▼b 2020z25 | |
| 100 | 1 | ▼a Jansen, Stefan |
| 245 | 1 0 | ▼a 핸즈온 머신러닝·딥러닝 알고리즘 트레이딩 : ▼b 파이썬, Pandas, NumPy, Scikit-learn, 케라스를 활용한 효과적인 거래 전략 / ▼d 스테판 젠슨 지음 ; ▼e 홍창수, ▼e 이기홍 옮김 |
| 246 | 1 9 | ▼a Hands-on machine learning for algorithmic trading : ▼b design and implement investment strategies based on smart algorithms that learn from data using Python |
| 260 | ▼a 서울 : ▼b 에이콘, ▼c 2020 | |
| 300 | ▼a 787 p. : ▼b 천연색삽화, 도표 ; ▼c 24 cm | |
| 440 | 0 0 | ▼a 에이콘 데이터 과학 시리즈 |
| 500 | ▼a 색인수록 | |
| 650 | 0 | ▼a Machine learning |
| 650 | 0 | ▼a Python (Computer program language) |
| 700 | 1 | ▼a 홍창수, ▼e 역 |
| 700 | 1 | ▼a 이기홍, ▼e 역 ▼0 AUTH(211009)146121 |
| 900 | 1 | ▼a 젠슨, 스테판, ▼e 저 |
| 945 | ▼a KLPA |
Holdings Information
| No. | Location | Call Number | Accession No. | Availability | Due Date | Make a Reservation | Service |
|---|---|---|---|---|---|---|---|
| No. 1 | Location Main Library/Monographs(3F)/ | Call Number 006.31 2020z25 | Accession No. 111851648 (6회 대출) | Availability Available | Due Date | Make a Reservation | Service |
| No. 2 | Location Science & Engineering Library/Sci-Info(Stacks1)/ | Call Number 006.31 2020z25 | Accession No. 121254105 (14회 대출) | Availability Available | Due Date | Make a Reservation | Service |
| No. 3 | Location Sejong Academic Information Center/Science & Technology/ | Call Number 006.31 2020z25 | Accession No. 151351192 (5회 대출) | Availability Loan can not(reference room) | Due Date | Make a Reservation | Service |
| No. | Location | Call Number | Accession No. | Availability | Due Date | Make a Reservation | Service |
|---|---|---|---|---|---|---|---|
| No. 1 | Location Main Library/Monographs(3F)/ | Call Number 006.31 2020z25 | Accession No. 111851648 (6회 대출) | Availability Available | Due Date | Make a Reservation | Service |
| No. | Location | Call Number | Accession No. | Availability | Due Date | Make a Reservation | Service |
|---|---|---|---|---|---|---|---|
| No. 1 | Location Science & Engineering Library/Sci-Info(Stacks1)/ | Call Number 006.31 2020z25 | Accession No. 121254105 (14회 대출) | Availability Available | Due Date | Make a Reservation | Service |
| No. | Location | Call Number | Accession No. | Availability | Due Date | Make a Reservation | Service |
|---|---|---|---|---|---|---|---|
| No. 1 | Location Sejong Academic Information Center/Science & Technology/ | Call Number 006.31 2020z25 | Accession No. 151351192 (5회 대출) | Availability Loan can not(reference room) | Due Date | Make a Reservation | Service |
Contents information
Book Introduction
디지털 데이터의 폭발적인 증가로 머신러닝을 사용하는 거래 전략의 전문지식에 대한 요구가 높아졌다. 이 책은 지도학습과 비지도학습 알고리즘으로 다양한 데이터 원천에서 신호를 추출해 효과적인 투자 전략을 만들 수 있도록 안내한다.
또한 API와 웹 스크래핑을 통해 시장, 기본, 대체 데이터에 접근하는 방법을 보여준다. 최신의 머신러닝, 딥러닝 알고리즘과 더불어 알고리즘 트레이딩을 위한 아이디어 창출부터 백테스팅까지의 과정, Pandas, NumPy, Statsmodel, Scikit-learn 등과 같은 라이브러리를 학습한다. 알고리즘 트레이딩의 과정을 학습하면서 머신러닝과 딥러닝의 기본을 다질 수 있는 유용한 예제가 포함돼 있다.
★ 이 책에서 다루는 내용 ★
■ 투자와 트레이딩 문제를 푸는 머신러닝 기법 구현
■ 시장 데이터, 기본 데이터, 대체 데이터를 활용한 알파 팩터
■ 지도학습, 비지도학습, 강화학습 모델 설계와 세부 조정
■ Pandas, NumPy, Scikit-learn을 이용한 포트폴리오 위험과 성과 최적화
■ 퀀토피안 플랫폼에서 머신러닝 모델을 실전 트레이딩 전략에 통합하기
■ 신뢰성 있는 시계열 백테스트 방법을 사용한 전략 평가
■ 케라스, 파이토치, 텐서플로를 사용해 딥신경망 설계 및 평가
■ OpenAI Gym에서 강화학습을 이용한 트레이딩 전략
★ 이 책의 대상 독자 ★
금융 및 투자 산업에서 일하는 투자 분석가, 포트폴리오 매니저와 함께 데이터 분석가, 데이터 과학자와 파이썬 개발자를 위한 책이다. ML 알고리즘으로 현명한 투자 전략을 개발해 효율적 트레이딩을 실행하고 싶다면 반드시 필요한 책이다. 파이썬과 ML 기법에 대한 어느 정도의 지식은 필수다.
★ 이 책의 구성 ★
머신러닝이 어떻게 거래 전략의 설계와 실행에 가치를 부가할 수 있는지를 포괄적으로 소개한다. 다양한 머신러닝 과제에 다른 솔루션뿐만 아니라 데이터 소싱과 전략 개발 과정의 다른 측면을 다루는 4개의 부로 구성돼 있다.
1부, '프레임워크: 데이터에서 전략 설계까지'에서는 알고리즘 트레이딩 전략 개발을 위한 프레임워크를 소개한다. 이 책에서 논의된 머신러닝 알고리즘과 전략을 지원하는 데이터에 중점을 두고 머신러닝이 거래신호를 유도하는 데 어떻게 사용될 수 있는지, 포트폴리오의 부분으로서 전략을 어떻게 이용하고 평가하는지 설명한다.
1장, '트레이딩을 위한 머신러닝'에서는 머신러닝이 거래전략의 설계와 실행을 위한 신호생성과 평가에서 어떻게 중요한지를 개략적으로 설명함으로써 이 책의 핵심을 확인한다. 여기에는 가설 생성, 모델링, 데이터 선택, 백테스팅부터 위험 관리를 포함한 포트폴리오 관점의 평가, 실행에 이르는 전략 프로세스가 요약돼 있다.
2장, '시장 데이터와 기본적 요인 데이터'에서는 이 책 전체에서 신뢰할 수 있는 수많은 오픈 소스 데이터 제공업체에 접근하는 방법뿐만 아니라 원천 거래소가 제공한 원본 틱(tick) 데이터, 재무 보고 데이터를 사용한 소스와 작업을 설명한다.
3장, '금융을 위한 대체 데이터'에서는 폭발적으로 증가하는 제공업체를 평가하는 범주와 기준을 제시한다. 또한 이 책의 2부에서 다룰 자연어 처리와 감성 분석 알고리즘과 함께 사용하는 데 필요한 어닝 콜 음성 녹취록(earning call transcripts)을 수집하려고 웹사이트를 스크랩해 대체 데이터셋을 작성하는 방법을 보여 준다.
4장, '알파 팩터 리서치'에서는 정보 계수(IC)를 사용해 팩터가 작동하는 방식과 성과를 측정하는 방법을 이해하기 위한 프레임 워크를 제공한다. 퀀토피안(Quantopian) 플랫폼에 대한 오프라인, 온라인 파이썬 라이브러리를 사용해 데이터에서 알파 팩터를 추출하는 것을 보여 준다. 또한 팩터를 백테스팅하기 위한 집라인(zipline)과 예측력을 평가하기 위한 알파렌즈(alphalens)를 소개한다.
5장, '전략 평가'에서는 집라인 오프라인, 퀀토피안 플랫폼으로 역사적 데이터를 사용해 거래전략을 테스트하고 평가하는 법을 소개한다. 파이폴리오(pyfolio) 라이브러리를 사용해 포트폴리오의 성과, 위험지표를 계산하는 방법을 보여 준다. 또한, 전략 백테스팅의 방법론적 과제를 관리하는 방법을 기술하고, 포트폴리오 위험 측면에서 전략을 최적화하는 방법을 알아본다.
6장, '머신러닝 프로세스'에서는 어떻게 형성하고, 훈련하고, 조정해서 체계적인 워크플로(workflow)로서 머신러닝 모형의 예측 성능을 평가하는지 개략적으로 설명한다.
2부, '머신러닝 기초'에서는 기본적인 지도학습, 비지도학습 알고리즘을 다루고 거래 전략에 적용하는 방법을 보여 준다. 또한 이 책에서 개발한 머신러닝 기법과 데이터를 활용하고 결합할 수 있는 퀀토피안 플랫폼을 소개해 실제 시장에서 거래를 수행하는 알고리즘 전략을 구현한다
7장, '선형 모형'에서는 추론과 예측을 위해 선형 및 로지스틱 회귀 분석을 사용하는 방법과 과적합(overfitting) 위험을 관리하기 위한 규제화(regularization) 방법을 보여 준다. 퀀토피안 트레이딩 플랫폼을 보여 주고, 요인 모델을 구축하고 자산 가격을 예측하는 방법을 알아본다.
8장, '시계열 모형'에서는 벡터자기회귀 모형과 공적분 검증을 포함하는 단변량과 다변량 시계열을 설명하고, 페어 트레이딩 전략에 어떻게 적용할 수 있는지를 다룬다.
9장, '베이지안 머신러닝'에서는 확률 모형을 공식화하는 방법, 마르코프체인 몬테카를로(MCMC) 샘플링, 변형 베이즈가 근사 추론을 용이하게 하는 방법을 제시한다. 또한 파라미터와 모형 불확실성에 대한 더 깊은 인사이트를 얻고자 확률적 프로그래밍을 위해 PyMC3를 사용하는 방법을 설명한다.
10장, '결정 트리와 랜덤 포레스트'에서는 통찰력과 예측을 위해 비선형 모형을 구축하고, 훈련하고, 조정하는 방법을 보여 준다. 트리 기반 앙상블 모형을 소개하고, 랜덤 포레스트가 의사결정 트리의 약점을 극복하고자 부트스트랩 수집(bootstrap aggregation)을 사용하는 방법도 소개한다.
11장, '경사 부스팅 머신'에서는 고성능 훈련과 예측을 위해 xgboost, lightgbm, catboost 라이브러리를 사용하는 방법과 수많은 하이퍼파라미터를 조정하는 방법을 심층적으로 검토한다.
12장, '비지도학습'에서는 알고리즘 트레이딩을 위한 차원 감소와 군집을 사용하는 방법을 소개한다. 데이터 기반 위험요소를 추출하고자 주요인 분석(PCA), 독립 요인 분석(ICA)을 사용한다. 여러 군집 분석 기법을 제시하고, 자산 분배를 위한 계층적 군집을 사용하는 방법을 보여 준다.
3부, '자연어 처리'에서는 텍스트 데이터에 초점을 맞추고 핵심 대체 데이터에서 고품질 신호를 추출하기 위한 최신의 비지도학습 기법을 소개한다.
13장, '텍스트 데이터로 작업하기'에서는 텍스트 데이터를 수치형식으로 전환하는 방법을 보여 주고, 감성 분석을 위해 2부에서 소개한 분류 알고리즘 기법을 대규모 데이터셋에 적용한다.
14장, '토픽 모델링'에서는 많은 수의 문서를 요약할 수 있는 잠재적인 토픽을 추출하는 베이지안 비지도 학습을 적용한다. 또한, 텍스트 데이터를 탐색하는 효과적인 방법과 특징으로서 토픽을 분류 모형에 사용하는 것을 설명한다. 이 기법은 '제3장, 금융을 위한 대체데이터'에서 본 어닝 콜 녹취록과 미국 증권거래위원회(SEC)에 제출한 연례보고서에 적용하는 방법을 보여 준다.
15장, '단어 임베딩'에서는 신경망을 사용해 기존 텍스트 특징보다 훨씬 나은 의미 맥락을 훨씬 잘 포착하고 텍스트 데이터에서 거래 신호를 추출할 수 있는 매우 유망한 방법인 단어 벡터(word vector) 형태의 최첨단 언어 특징을 학습한다.
4부는 딥러닝과 강화학습을 소개한다.
16장, '딥러닝'에서는 4부 전체에 걸쳐 사용할 가장 인기 있는 딥러닝 프레임워크인 케라스(Keras), 텐서플로(TensorFlow), 파이토치(Pytorch)를 소개한다. 또한 규제화와 공통 아키텍처의 개요를 포함한 훈련과 튜닝 기법을 제시한다.
17장, '합성곱 신경망'에서는 비정형 데이터로 분류 작업에 매우 강력한 CNN을 다룬다. 성공적인 아키텍처 디자인을 소개하고, 경제 활동을 예측하고자 위성 데이터를 훈련시키며, 훈련 속도를 높이기 위한 전이학습(transfer learning)을 사용하는 것을 설명한다.
18장, '순환 신경망'에서는 RNN이 시계열을 포함해 시퀀스-투-시퀀스(Seq2Seq) 모델링에 어떻게 유용한지를 보여 준다. RNN이 어떻게 장기에 걸쳐 비선형 패턴을 포착하는지 보여 준다.
19장, '오토인코더와 적대적 생성망'에서는 고차원 데이터의 비선형 압축을 위한 오토인코더와 합성 데이터를 생성하는 가장 중요한 혁신 중 하나인 GAN을 포함한 비지도 딥러닝에 대해 설명한다.
20장, '강화학습'에서는 시간에 따라 자신의 환경에 대응해 의사결정을 최적화하는 방법을 배우는 에이전트(agent)의 설계와 훈련을 허용하는 강화학습을 제시한다. 오픈 AI gym을 이용해 시장 신호에 대응하는 에이전트를 어떻게 구축하는지 알 수 있게 된다.
21장, '다음 단계'에서는 1~20장의 내용을 요약한다.
Information Provided By: :
Author Introduction
스테판 젠슨(지은이)
어플라이드 에이아이(Applied AI)의 창립자이자 CEO다. 포춘지 선정 500대 기업, 투자 기업 및 업계 전반에서 데이터와 AI 전략에 대해 조언하고, 데이터 과학 팀을 구성하고, 광범위한 비즈니스 문제에 대한 엔드투엔드 머신 학습 솔루션을 개발하고 있다. 이전에는 국제 투자회사의 파트너이자 상무이사를 역임하며 예측 분석 및 투자 연구 업무를 구축했다. 15개 시장에서 영업을 하는 글로벌 핀테크 기업의 고위 임원으로 신흥국 중앙은행에 자문, 세계은행과 상담하기도 했다. 조지아 공대에서 컴퓨터 공학 석사 학위를, 하버드 및 자유 대학교 베를린에서 경제학 석사 학위를 취득했고 CFA 자격증을 보유하고 있다. 유럽, 아시아, 미주 지역에서 6개 언어로 근무했으며 제너럴 어셈블리(General Assembly)와 데이터캠프(Datacamp)에서 데이터 과학을 가르쳤다.
홍창수(옮긴이)
경북대학교에서 재무 전공으로 경영학 석사학위를 받고, 한국외국어대학교에서 「장외개별주식옵션의 내재변동성 실증분석」으로 경영학 박사학위를 받았다. 2000년 ㈜ 외환선물 투자공학팀 애널리스트로 첫 직장생활을 시작한 이후 리딩투자증권 파생상품운용 팀 옵션딜러, 한국투자증권 리스크관리부 리스크 퀀트로 근무했다. 한화투자증권에서 장외파생상품 겸영 인가 취득에 참여한 이후 금융공학 팀, OTC파생 팀에서 장외파생상품 설계 및 마케팅 담당 차장으로 근무했다. 이후 금융자산평가회사인 ㈜ NICE P&I 금융공학연구소 실장으로 근무했으며, 현재는 정보사업본부에서 금융공학 컨설팅 업무를 수행하고 있다. 저서로는 『장외파생상품 실무입문』(서울경제경영, 2014)이 있으며, 번역서로는 『퀀트 투자를 위한 머신러닝·딥러닝 알고리듬 트레이딩 2/e』(에이콘, 2021)가 있다. SCI급 저널인 「PLOS ONE」을 비롯 국내 유수의 재무금융 및 경영 학술지인 증권학회지, 재무관리연구, 금융공학연구, 경영연구 등에 재무 및 파생상품 관련 논문을 게재했다. 중앙대학교에서 강사로 'R을 활용한 금융공학 실습' 과목을 강의했으며, 한국금융공학회 산학협력위원으로 활동하고 있다.
이기홍(옮긴이)
카네기멜론대학교에서 석사 학위를 받았고, 피츠버그대학교의 Finance Ph.D, CFA, FRM이자 금융, 투자, 경제분석전문가다. 삼성생명, HSBC, 새마을금고중앙회, 한국투자공사 등과 같은 국내 유수의 금융기관, 금융 공기업에서 자산 운용 포트폴리오 매니저로 근무했으며 현재 딥러닝과 강화학습을 금융에 접목시켜 이를 전파하고 저변을 확대하는 것을 보람으로 삼고 있다. 저서로는 『엑셀 VBA로 쉽게 배우는 금융공학 프로그래밍』(한빛미디어, 2009)이 있으며, 번역서로는 『포트폴리오 성공 운용』(미래에셋투자교육연구소, 2010), 『딥러닝 부트캠프 with 케라스』(길벗, 2017), 『프로그래머를 위한 기초 해석학』(길벗, 2018)과 에이콘출판사에서 출간한 『실용 최적화 알고리즘』(2020), 『초과 수익을 찾아서 2/e』(2020), 『자산운용을 위한 금융 머신러닝』(2021), 『실전 알고리즘 트레이딩 배우기』(2021), 『존 헐의 비즈니스 금융 머신러닝 2/e』(2021), 『퀀트 투자를 위한 머신러닝o딥러닝 알고리듬 트레이딩 2/e』(2021), 『자동머신러닝』(2021), 『금융 머신러닝』(2022) 등이 있다. 누구나 자유롭게 머신러닝과 딥러닝을 자신의 연구나 업무에 적용해 활용하는 그날이 오기를 바라며 매진하고 있다.
Table of Contents
지은이 소개 기술 감수자 소개 옮긴이 소개 옮긴이의 말 들어가며 1부. 프레임워크: 데이터에서 전략 설계까지 1장. 트레이딩을 위한 머신러닝 __이 책을 읽는 법 ____기대하는 것 ____이 책을 읽어야 하는 독자 ____이 책의 구성 ____성공하기 위해 필요한 것 __투자업계에서 머신러닝의 부상 ____전자거래에서 고빈도 매매까지 ____팩터 투자와 스마트 베타 펀드 ____알고리즘 개척자는 규모에 있어 인간보다 우위에 있다 ____머신러닝과 대체 데이터 __거래 전략의 설계와 실행 ____데이터의 소싱 및 관리 ____알파 팩터 리서치 및 평가 ____포트폴리오 최적화와 리스크관리 ____전략 백테스팅 __머신러닝과 알고리즘 트레이딩 전략 ____거래를 위한 머신러닝의 사용 사례 __요약 2장. 시장 데이터와 기본적 요인 데이터 __시장 데이터 사용 방법 ____시장 미시구조 ____주문 호가창 데이터의 사용 ____틱 데이터의 규제 ____시장 데이터에 대한 API접근 ____pandas를 이용한 원거리 데이터 접근 ____기타 시장 데이터 공급자 __기본적 데이터 작업 방법 ____재무제표 데이터 ____기타 기본적 데이터 소스 __판다스를 이용한 효율적 데이터 저장 __요약 3장. 금융을 위한 대체 데이터 __대체 데이터 혁명 ____대체 데이터의 원천 __대체 데이터셋 평가 ____평가 기준 ____데이터의 질 __대체 데이터 시장 ____데이터 제공업체와 사용 사례 __대체 데이터로 작업하기 ____오픈테이블 데이터 스크레이핑 ____어닝 콜 녹취록 __요약 4장. 알파 팩터 리서치 __알파 팩터 엔지니어링 ____중요한 팩터 분류 ____팩터로의 데이터 변환 __시그널 찾기 - zipline 사용법 ____구조-이벤트 주도형 트레이딩 시뮬레이션 ____시장 데이터로부터 산출한 단일 알파 팩터 ____다양한 데이터 소스의 팩터 결합 ____시그널과 잡음의 분리-alphalens의 사용법 ____미래 수익률과 팩터 분위수의 생성 ____팩터 분위수에 의한 예측 성과 ____정보 계수 ____팩터 회전율 ____알파 팩터 리소스 ____기타 알고리즘 트레이딩 라이브러리 __요약 5장. 전략 평가 __zipline으로 포트폴리오 구축과 테스트 ____예정된 거래와 포트폴리오 리밸런싱 __pyfolio로 성과를 측정하는 방법 ____샤프 비율 ____적극적 운용의 기본 법칙 ____파이폴리오를 통한 표본 내 및 표본 외 성과 __백테스팅의 함정을 피하는 방법 ____데이터 도전 ____구현 이슈 ____데이터 스누핑과 백테스트 과적합 __포트폴리오 위험과 수익률 관리 방법 ____평균 분산 최적화 ____평균 분산 최적화의 대안 ____리스크 패리티 ____리스크 팩터 투자 ____계층적 리스크 패리티 __요약 2부. 머신러닝 기초 6장. 머신러닝 프로세스 __데이터로부터 학습 ____지도학습 ____비지도학습 ____강화학습 __기계학습 작업 흐름 ____기본 작업 개요-k-최근접 이웃 ____문제의 구성-목적과 성과 측정 ____데이터의 수집과 준비 ____특성 탐험, 추출과 공학 ____ML 알고리즘 선택 ____모델 설계와 조정 ____모델 선택을 위한 교차 검증의 활용 ____사이킷런을 이용한 파라미터 조정 ____금융에서 교차 검증의 문제점 __요약 7장. 선형 모형 __추론과 예측을 위한 선형 회귀 __다중 선형 회귀 모형 ____모형을 만드는 방법 ____모형을 훈련하는 방법 ____가우스 마르코프 정리 ____통계적 추론을 수행하는 방법 ____문제를 진단하고 해결하는 방법 ____실제로 선형 회귀를 실행하는 방법 __선형 요인 모델을 구축하는 방법 ____자본자산 가격결정 모형부터 파마-프렌치 5요인 모델까지 ____위험 요인 입수하기 ____파마-맥베스 회귀 분석 __수축 방법-선형 회귀에 대한 규제화 ____과적합을 방지하는 방법 ____리지 회귀 분석의 작동 방식 ____라쏘 회귀 분석의 작동 방식 __선형 회귀를 사용해 수익률을 예측하는 방법 ____데이터 준비 ____statsmodels를 사용한 선형 OLS 회귀 ____sklearn을 이용한 선형 OLS 회귀 ____sklearn을 이용한 리지 회귀 분석 ____sklearn을 이용한 라쏘 회귀 분석 __선형 분류 ____로지스틱 회귀 모델 ____statsmodels로 추론을 수행하는 방법 ____예측에 로지스틱 회귀를 사용하는 방법 __요약 8장. 시계열 모델 __진단과 특성 추출을 위한 분석 도구 ____시계열 패턴 분해 ____롤링 윈도우 통계량 계산 ____자기상관계수 계산 ____정상성 진단 및 회복 ____시계열 변환의 적용 __일변수 시계열 모델 ____자기 회귀 모델의 구축 ____이동 평균 모델의 구축 ____ARIMA 모델 구축 및 확장 ____매크로 펀더멘털 예측 ____시계열 모델을 활용한 변동성 예측 __다변수 시계열 모델 ____방정식 체계 ____벡터 자기회귀 모델 ____VAR 모델을 활용한 매크로 펀더멘털 예측 ____공적분-공통 추세를 가진 시계열 ____페어트레이딩 전략의 공적분 활용 __요약 9장. 베이지안 머신러닝 __베이지안 머신러닝 작동 방식 ____경험적 증거로부터 가정을 업데이트하는 방법 ____정확한 추론: 최대 사후확률 추정 ____근사적 추론: 확률론적 접근법과 결정론적 접근법 __PyMC3를 사용한 확률적 프로그래밍 ____테아노를 이용한 베이지안 머신러닝 ____PyMC3 워크플로 ____실무적 응용 __요약 10장. 결정 트리와 랜덤 포레스트 __결정 트리 ____트리의 결정 규칙규칙 학습과 적용 ____결정 트리 실용적 사용법 ____과대적합과 규제화 ____하이퍼파라미터의 조정 __랜덤 포레스트 ____앙상블 모델들 ____어떻게 배깅이 모델 분산을 낮추는가 ____배깅 결정 트리 ____어떻게 랜덤 포레스트를 구현하는가 ____랜덤 포레스트의 학습과 조정 ____랜덤 포레스트의 장점과 단점 __요약 11장. 그래디언트 부스팅 머신 __적응형 부스팅 ____에이다부스트 알고리즘 ____사이킷런으로 에이다부스트 구현 __그래디언트 부스팅 머신 ____GBM 모형을 훈련하고 조정하는 방법 ____사이킷런으로 그래디언트 부스팅을 사용하는 방법 __빠르고 확장 가능한 GBM 구현 ____알고리즘 혁신이 성능을 향상시키는 방법 ____XGBoost, LightGBM, CatBoost 사용법 __GBM 결과를 해석하는 방법 ____특성의 중요성 ____부분 의존도 ____SHapley 첨가 설명 __요약 12장. 비지도학습 __차원 축소 ____선형과 비선형 알고리즘 ____차원의 저주 ____매니폴드 학습 __군집화 ____k-평균 군집화 __요약 3부. 자연어 처리 13장. 텍스트 데이터로 작업하기 __텍스트 데이터에서 특성을 추출하는 방법 ____자연어 처리의 도전 ____자연어 처리 워크플로 ____사용 사례 __텍스트에서 토큰으로-NLP 파이프라인 ____spaCy와 textacy를 이용한 NLP 파이프라인 ____TextBlob을 사용한 자연어 처리 __토큰에서 숫자로-문서 단어 행렬 ____단어 주머니 모형 ____sklearn을 사용해 문서 단어 행렬 처리 __텍스트 분류와 감성 분석 ____나이브 베이즈 분류기 ____뉴스 기사 분류 ____감성 분석 __요약 14장. 토픽 모델링 __잠재 토픽의 학습: 목적과 방법 ____선형대수에서 계층적 확률 모델로 __잠재 의미 인덱싱 ____sklearn을 이용한 LSI의 구현법 ____장점과 단점 __확률적 잠재 의미 분석 ____sklearn을 이용한 pLSA의 구현법 __잠재 디리클레 할당 ____LDA의 원리 ____LDA 토픽 평가 ____sklearn을 이용한 LDA의 구현법 ____pyLDAvis를 이용한 LDA 결과의 시각화 ____gensim을 이용한 LDA의 구현법 ____실적발표를 위한 토픽 모델링 ____옐프 사업보고서를 위한 토픽 모델링 __요약 15장. 단어 임베딩 __단어 임베딩은 어떻게 의미를 인코딩하는가 ____신경 언어 모델이 문맥에서 사용법을 배우는 방법 ____Word2vec 모델-규모에 따른 임베딩 학습 ____임베딩을 평가하는 방법-벡터 산술과 유추 ____사전 훈련된 단어 벡터를 사용하는 방법 ____자신의 단어 벡터 임베딩을 훈련시키는 방법 ____케라스의 Skip-Gram 아키텍처 __젠심을 사용해 증권거래위원회 재무신고 단어 벡터 ____전처리 ____모델 훈련 __Doc2vec을 사용해 감성 분석 ____옐프 감성 데이터에 대한 Doc2vec 훈련 __보너스-번역을 위한 Word2vec __요약 4부. 딥러닝과 강화학습 16장. 딥러닝 __딥러닝과 AI ____고차원 데이터의 문제점 __신경망의 설계 ____신경망 작동법 ____주요 설계 선택 ____심층 신경망의 규제화 ____DL을 위한 최적화 기법 __파이썬을 이용한 신경망 구축법 ____입력층 ____은닉층 ____출력층 __신경망 학습법 ____파이썬을 이용한 역전파 구현법 ____종합 ____신경망 학습 __DL 라이브러리 사용법 ____케라스 사용법 ____텐서보드 사용법 ____파이토치 1.0 사용법 ____텐서플로 2.0 사용법 __신경망 구조 최적화 ____자산 가격 움직임을 예측하기 위한 주식 수익률 시계열 생성 ____플레이스홀더를 사용한 신경망 구조의 정의 ____조기 종료를 위한 손실 척도의 맞춤형 정의 ____신경망 구조의 조정을 위한 GirdSearchCV의 실행 ____결과를 더욱 개선하는 법 __요약 17장. 합성곱 신경망 __컨브넷 작동 방식 ____합성곱 층 작동 방식 ____신경과학에서의 영감 ____참고할 만한 컨브넷 아키텍처 ____분류 이상의 컴퓨터 비전-탐지와 분할 __파이썬을 이용해 CNN을 설계하고 훈련시키는 방법 ____케라스를 이용해 LeNet5와 MNIST 구현 ____케라스를 사용한 알렉스넷과 CIFAR10 ____시계열 데이터와 함께 CNN을 사용하는 방법 __전이학습-적은 데이터로 더 빠른 훈련 ____사전 학습된 CNN을 구축하는 방법 __물체를 탐지하는 방법 ____구글 스트리트 뷰 주택 번호(SVHN) 데이터셋 ____다중 출력으로 CNN을 정의하는 방법 __최근 발전 ____위성 이미지에서 물체를 빠르게 감지 ____캡슐 네트워크 캡처 방법 __요약 18장. 순환 신경망 __RNN의 원리 ____순환주기로 펼친 계산 그래프 ____시간을 통한 역전파 ____대안적 순환 신경망 구조 ____심층 순환 신경망 설계 ____장기 의존성 학습 시 문제점 ____GRU __파이썬을 이용한 RNN의 구축과 학습 ____일변수 시계열 회귀 ____시계열 분류를 위한 적층 LSTM ____다변수 시계열 회귀 ____감성 분류를 위한 LSTM과 단어 임베딩 ____사전학습된 단어벡터를 이용한 감성 분석 ____텍스트 데이터의 전처리 ____사전학습된 GloVe 임베딩 __요약 19장. 오토인코더와 적대적 생성망 __오토인코더의 작동 방식 ____비선형 차원 축소 ____합성곱 오토인코더 ____규제화된 오토인코더를 사용한 희소성 제약 ____노이즈 제거 오토인코더로 손상된 데이터 수정 ____시퀀스-투-시퀀스 오토인코더 ____변분 오토인코더 __파이썬을 사용한 오토인코더 설계와 훈련 ____데이터 준비 ____단층 피드포워드 오토인코더 ____희소성 제약 조건이 있는 피드포워드 오토인코더 ____심층 피드포워드 오토인코더 ____합성곱 오토인코더 ____오토인코더 노이즈 제거 __GAN 작동 방식 ____생성 모델과 판별 모델이 어떻게 다른가 ____적대적 훈련의 작동 방식 ____GAN 아키텍처의 진화 ____성공적이고 새로운 GAN 애플리케이션 ____파이썬을 사용해 GAN을 빌드하는 방법 __요약 20장. 강화학습 __강화학습의 주요 구성 요소 ____상호작용 강화학습 시스템의 구성 요소 __강화학습 문제의 해법 ____강화학습 문제 풀이의 주요 문제점 ____강화학습 문제를 푸는 근본적 방법 __동적 계획-가치와 정책 반복 ____유한 MDP ____정책 반복 ____가치 반복 ____일반화 정책 반복 ____파이썬을 이용한 동적계획 __큐러닝 ____큐러닝 알고리즘 ____파이썬을 이용한 큐러닝 에이전트 훈련 __딥 강화학습 ____신경망을 이용한 가치 함수의 근사 ____딥큐러닝 알고리즘과 확장 ____오픈에이아이 짐-달착륙선 게임 환경 ____텐서플로를 이용한 이중 딥큐러닝 __트레이딩을 위한 강화학습 ____오픈에이아이 트레이딩 환경 설계 ____기본 트레이딩 에이전트 ____주식 시장을 위한 딥큐러닝 에이전트 구축 __요약 21장. 다음 단계 __학습에서 얻은 주요 요점과 교훈 ____데이터가 가장 중요한 단일 재료 ____도메인 전문 지식이 데이터 가치 창출에 도움을 준다 ____특성 공학과 알파 팩터 리서치 ____머신러닝은 데이터로 문제를 풀기 위한 도구 ____모델 진단은 최적화를 가속화한다 ____백테스트의 과대적합을 주의한다 ____블랙박스 모델로부터 인사이트를 얻는 법 __머신러닝 실전 트레이딩 ____데이터 관리 테크놀로지 ____머신러닝 도구들 ____온라인 트레이딩 플랫폼 __결론 찾아보기



