고려대학교 세종학술정보원

이전 결과로 돌아가기 검색화면

MARC

(프로그래머를 위한) 강화학습 : 강화학습 기초부터 대표 알고리즘의 원리와 코드 구현 및 튜닝까지 (36회 대출)

자료유형

단행본

개인저자

멀티코어 김남준, 저 윤철희, 저

서명 / 저자사항

(프로그래머를 위한) 강화학습 : 강화학습 기초부터 대표 알고리즘의 원리와 코드 구현 및 튜닝까지 / 멀티코어, 김남준, 윤철희 공저

발행사항

부천 : 프리렉, 2021

형태사항

334 p. : 천연색삽화, 도표 ; 24 cm

ISBN

9788965402930

일반주기

색인수록

000		00000nam c2200205 c 4500
001		000046077046
005		20210409174022
007		ta
008		210409s2021 ggkad 001c kor
020		▼a 9788965402930 ▼g 93000
040		▼a 211009 ▼c 211009 ▼d 211009
082	0 4	▼a 006.31 ▼2 23
085		▼a 006.31 ▼2 DDCK
090		▼a 006.31 ▼b 2021z7
100	0	▼a 멀티코어
245	2 0	▼a (프로그래머를 위한) 강화학습 : ▼b 강화학습 기초부터 대표 알고리즘의 원리와 코드 구현 및 튜닝까지 / ▼d 멀티코어, ▼e 김남준, ▼e 윤철희 공저
260		▼a 부천 : ▼b 프리렉, ▼c 2021
300		▼a 334 p. : ▼b 천연색삽화, 도표 ; ▼c 24 cm
500		▼a 색인수록
700	1	▼a 김남준, ▼e 저
700	1	▼a 윤철희, ▼e 저
945		▼a KLPA

소장정보

No.	소장처	청구기호	등록번호	도서상태	반납예정일	예약	서비스
No. 1	소장처 중앙도서관/제2자료실(3층)/	청구기호 006.31 2021z7	등록번호 111848966 (7회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M
No. 2	소장처 중앙도서관/제2자료실(3층)/	청구기호 006.31 2021z7	등록번호 511054300 (2회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M
No. 3	소장처 과학도서관/Sci-Info(1층서고)/	청구기호 006.31 2021z7	등록번호 121256968 (18회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M
No. 4	소장처 과학도서관/Sci-Info(1층서고)/	청구기호 006.31 2021z7	등록번호 521006776 (9회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M

No.	소장처	청구기호	등록번호	도서상태	반납예정일	예약	서비스
No. 1	소장처 중앙도서관/제2자료실(3층)/	청구기호 006.31 2021z7	등록번호 111848966 (7회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M
No. 2	소장처 중앙도서관/제2자료실(3층)/	청구기호 006.31 2021z7	등록번호 511054300 (2회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M

No.	소장처	청구기호	등록번호	도서상태	반납예정일	예약	서비스
No. 1	소장처 과학도서관/Sci-Info(1층서고)/	청구기호 006.31 2021z7	등록번호 121256968 (18회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M
No. 2	소장처 과학도서관/Sci-Info(1층서고)/	청구기호 006.31 2021z7	등록번호 521006776 (9회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M

컨텐츠정보

책소개

IF 프로그래머 THEN 강화학습. 인공지능이 온갖 기회를 창출하는 시대! 프로그래머라면, 아니 프로그래머가 아니어도 이제 인공지능은 필수다. 그중에서도 인공지능의 최전선에 강화학습이 있다. 강화학습은 알파고를 통해 세상에 널리 알려졌지만 실제로는 다양한 곳에서 현실적인 문제를 해결하는데 활용되고 있다. 이 책에서는 이러한 강화학습의 기본 개념을 살펴보고 대표 알고리즘의 원리를 알아본다. 더불어 파이썬 코드로 구현하고 최적화 기법을 통한 튜닝까지 전 과정을 한눈에 살펴본다.

인공지능의 최전선, 강화학습
이제 인공지능은 IT 업계를 넘어 다양한 분야와 비즈니스로 활용 폭을 넓히고 있습니다. 인공지능을 공부하다 보면 머신러닝과 딥러닝부터 시작해서 결국에는 강화학습을 마주하게 됩니다. 강화학습은 시행착오를 거쳐 해결책을 찾아나가는 기법으로, 인공지능 기술 중에서 가장 난이도가 높습니다. 그래서 원리를 이해하려면 상당한 수준의 수학과 통계 이론을 알아야 합니다.
이 책에서는 강화학습의 기초가 되는 수식을 하나하나 자세히 유도하기보다는 수식이 이어지는 흐름을 따라가면서 다양한 알고리즘의 원리를 한눈에 살펴보고, 코드로 구현해가며 활용법을 익히도록 구성했습니다. 이 책을 출발점으로 삼아, 인공지능의 최전선에 있는 강화학습을 제대로 이해하고 활용할 수 있는 발판을 마련해 봅시다.

이 책의 특징
· 강화학습 이해에 필요한 통계와 수학 이론을 기초부터 다룬다.
· 알고리즘의 기본 개념을 그림으로 표현하여 이해를 돕는다.
· 하나의 예제를 통해 일관성 있게 개념과 이론을 설명해 나간다.
· 파이썬 코드 구현과 튜닝, 최적화까지 실무에 적용할 수 있는 수준까지 다룬다.

이 책의 구성
이 책은 강화학습의 기초 개념과 인공지능 개념, 가치 기반 강화학습, 정책 기반 강화학습, 튜닝 문제, 이렇게 모두 다섯 부분으로 구성됩니다.
· 강화학습의 기초 개념: 강화학습에 필요한 통계 및 수학 이론과 MDP에 대한 설명
· 인공지능 개념: 머신러닝부터 강화학습 내부에서 사용하는 인공신경망으로 이르는 과정을 선형 회귀부터 차근차근 설명
· 가치 기반 강화학습: 상대적으로 이해하기 쉬운 DQN 알고리즘을 코드 중심으로 설명
· 정책 기반 강화학습: REINFORCE, A2C, PPO 알고리즘에 대한 설명과 실행 안내
· 튜닝 문제: 알고리즘의 파라미터 튜닝을 효율적으로 돕는 그리드 서치와 베이지안 최적화 기법

정보제공 :

펼치기

저자소개

김남준(지은이)

프로그램 개발자이자 데이터 전문가. 인공지능 학습 데이터와 데이터 보안을 담당하고 있다. 최근에는 공학용 데이터 분석을 위한 알고리즘 연구와 시각화를 진행하고 있다.

멀티코어(지은이)

프로그래머이자 인공지능 전문가이다. 프로그래머로서 다양한 분야에서 활동했으며 현재는 기업에서 데이터분석과 강화학습을 활용한 비즈니스 환경 개선 업무를 담당하고 있다. 인공지능이 학위를 받은 소수의 전문가만을 위한 영역이 아니라 프로그래머도 충분히 도전할 수 있음을 후배들에게 보여주기 위해 부단히 노력하고 있다.

윤철희(지은이)

인공지능 및 정보시스템 전문가이다. 인공지능 어플리케이션 개발 업무를 담당하고 있으며, 서울디지털대학교와 동국대 국제정보대학원 및 다수의 대학에서 관련 강의를 하고 있다. 최신 인공지능 기술의 저변 확대를 위해 클라우드 환경에서 쉽게 활용 가능한 인공지능과 도메인별 LLM기반 Agent 적용에 많은 고민을 하고 있다.