| 000 | 00000cam c2200205 c 4500 | |
| 001 | 000046012545 | |
| 005 | 20250811102625 | |
| 007 | ta | |
| 008 | 200108s2019 ulka b 001c kor | |
| 020 | ▼a 9791156006855 ▼g 93000 | |
| 035 | ▼a (KERIS)BIB000015354401 | |
| 040 | ▼a 211046 ▼c 211046 ▼d 211009 | |
| 041 | 1 | ▼a kor ▼h eng |
| 082 | 0 4 | ▼a 006.31 ▼2 23 |
| 085 | ▼a 006.31 ▼2 DDCK | |
| 090 | ▼a 006.31 ▼b 2019z37 | |
| 100 | 1 | ▼a Ravichandiran, Sudharsan ▼0 AUTH(211009)172182 |
| 245 | 1 0 | ▼a 강화학습 입문 : ▼b 파이썬 예제와 함께하는 : ▼b OpenAI Gym과 TensorFlow 실습 가이드 / ▼d Sudharsan Ravichandiran 지음 ; ▼e 김승현 [외]옮김 |
| 246 | 1 9 | ▼a Hands-on reinforcement learning with Python : ▼b master reinforcement and deep reinforcement learning using OpenAI Gym and TensorFlow |
| 260 | ▼a 서울 : ▼b 홍릉과학출판사, ▼c 2019 | |
| 300 | ▼a xiv, 296 p. : ▼b 삽화 ; ▼c 26 cm | |
| 500 | ▼a 공역자: 김태우, 이정원, 이주행 | |
| 504 | ▼a 참고문헌과 색인수록 | |
| 700 | 1 | ▼a 김승현, ▼e 역 |
| 700 | 1 | ▼a 김태우, ▼e 역 |
| 700 | 1 | ▼a 이정원, ▼e 역 |
| 700 | 1 | ▼a 이주행, ▼e 역 |
| 945 | ▼a KLPA |
소장정보
| No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
|---|---|---|---|---|---|---|---|
| No. 1 | 소장처 과학도서관/Sci-Info(1층서고)/ | 청구기호 006.31 2019z37 | 등록번호 121251808 (14회 대출) | 도서상태 대출가능 | 반납예정일 | 예약 | 서비스 |
컨텐츠정보
목차
1장. 강화학습 소개 2장. OpenAI와 TensorFlow 시작하기 3장. MDP와 다이내믹 프로그래밍 4장. 몬테카를로 방법으로 게임하기 5장. 시간차 학습 6장. 다중 밴딧 문제 7장. 딥러닝 기초 8장. Deep Q Network로 Atari 게임하기 9장. DRQN으로 둠 게임 플레이 10장. A3C 네트워크 11장. 폴리시 그래디언트와 최적화 12장. 캡스톤 프로젝트-DQN을 이용한 카레이싱 13장. 최신 기술과 앞으로의 방향
