고려대학교 세종학술정보원

이전 결과로 돌아가기 검색화면

MARC

단단한 강화학습 : 강화학습 기본 개념을 제대로 정리한 인공지능 교과서 (102회 대출)

자료유형

단행본

개인저자

Sutton, Richard S. Barto, Andrew G., 저 김성우, 역

서명 / 저자사항

단단한 강화학습 : 강화학습 기본 개념을 제대로 정리한 인공지능 교과서 / 리처드 서튼, 앤드류 바르토 지음 ; 김성우 옮김

발행사항

파주 : 제이펍, 2020

형태사항

xxix, 633 p. : 삽화, 도표 ; 25 cm

총서사항

제이펍의 인공지능 시리즈 = Jpub's A.I. series ; 27

원표제

Reinforcement learning : an introduction (2nd ed.)

ISBN

9791190665179

서지주기

참고문헌(p. 588-624)과 색인수록

일반주제명

Reinforcement learning

000		00000cam c2200205 c 4500
001		000046023165
005		20200407172843
007		ta
008		200407s2020 ggkad b 001c kor
020		▼a 9791190665179 ▼g 93000
035		▼a (KERIS)BIB000015547270
040		▼a 241026 ▼c 241026 ▼d 211009
041	1	▼a kor ▼h eng
082	0 0	▼a 006.3/1 ▼2 23
085		▼a 006.31 ▼2 DDCK
090		▼a 006.31 ▼b 2020z7
100	1	▼a Sutton, Richard S.
245	1 0	▼a 단단한 강화학습 : ▼b 강화학습 기본 개념을 제대로 정리한 인공지능 교과서 / ▼d 리처드 서튼, ▼e 앤드류 바르토 지음 ; ▼e 김성우 옮김
246	1 9	▼a Reinforcement learning : ▼b an introduction ▼g (2nd ed.)
260		▼a 파주 : ▼b 제이펍, ▼c 2020
300		▼a xxix, 633 p. : ▼b 삽화, 도표 ; ▼c 25 cm
440	0 0	▼a 제이펍의 인공지능 시리즈 = ▼x Jpub's A.I. series ; ▼v 27
504		▼a 참고문헌(p. 588-624)과 색인수록
650	0	▼a Reinforcement learning
700	1	▼a Barto, Andrew G., ▼e 저
700	1	▼a 김성우, ▼e 역
900	1 0	▼a 서튼, 리처드, ▼e 저
900	1 0	▼a 바르토, 앤드류, ▼e 저
945		▼a KLPA

소장정보

No.	소장처	청구기호	등록번호	도서상태	반납예정일	예약	서비스
No. 1	소장처 중앙도서관/제2자료실(3층)/	청구기호 006.31 2020z7	등록번호 511049317 (15회 대출)	도서상태 대출중	반납예정일 2026-02-14	예약 예약가능(1명 예약중) R	서비스 M
No. 2	소장처 과학도서관/Sci-Info(1층서고)/	청구기호 006.31 2020z7	등록번호 121252898 (29회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M
No. 3	소장처 과학도서관/Sci-Info(1층서고)/	청구기호 006.31 2020z7	등록번호 121254394 (22회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M
No. 4	소장처 과학도서관/Sci-Info(1층서고)/	청구기호 006.31 2020z7	등록번호 121257989 (17회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M
No. 5	소장처 세종학술정보원/과학기술실(5층)/	청구기호 006.31 2020z7	등록번호 151350238 (14회 대출)	도서상태 대출중	반납예정일 2026-03-23	예약	서비스 M ?
No. 6	소장처 세종학술정보원/과학기술실(5층)/	청구기호 006.31 2020z7	등록번호 151358616 (5회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M ?

No.	소장처	청구기호	등록번호	도서상태	반납예정일	예약	서비스
No. 1	소장처 중앙도서관/제2자료실(3층)/	청구기호 006.31 2020z7	등록번호 511049317 (15회 대출)	도서상태 대출중	반납예정일 2026-02-14	예약 예약가능(1명 예약중) R	서비스 M

No.	소장처	청구기호	등록번호	도서상태	반납예정일	예약	서비스
No. 1	소장처 과학도서관/Sci-Info(1층서고)/	청구기호 006.31 2020z7	등록번호 121252898 (29회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M
No. 2	소장처 과학도서관/Sci-Info(1층서고)/	청구기호 006.31 2020z7	등록번호 121254394 (22회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M
No. 3	소장처 과학도서관/Sci-Info(1층서고)/	청구기호 006.31 2020z7	등록번호 121257989 (17회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M

No.	소장처	청구기호	등록번호	도서상태	반납예정일	예약	서비스
No. 1	소장처 세종학술정보원/과학기술실(5층)/	청구기호 006.31 2020z7	등록번호 151350238 (14회 대출)	도서상태 대출중	반납예정일 2026-03-23	예약	서비스 M ?
No. 2	소장처 세종학술정보원/과학기술실(5층)/	청구기호 006.31 2020z7	등록번호 151358616 (5회 대출)	도서상태 대출가능	반납예정일	예약	서비스 B M ?

컨텐츠정보

책소개

내용을 대폭 보강하여 20년 만에 개정된 강화학습 분야의 절대 바이블. 인공지능 분야에서 가장 활발하게 연구되고 있는 분야 중 하나인 강화학습은 복잡하고 불확실한 환경과 상호작용하는 학습자에게 주어지는 보상을 최대화하는 수치 계산적 학습 방법이다.

리처드 서튼과 앤드류 바르토는 이 책 《단단한 강화학습》을 통해 강화학습의 핵심적인 개념과 알고리즘을 분명하고 이해하기 쉽게 설명한다. 1판이 출간된 이후 새롭게 부각된 주제들을 추가하였고, 이미 다루었던 주제들도 최신 내용으로 업데이트하였다.

내용을 대폭 보강하여 20년 만에 개정된 강화학습 분야의 절대 바이블!
강화학습의 핵심 개념과 최신 알고리즘을 쉽고 명료하게 이해한다!

인공지능 분야에서 가장 활발하게 연구되고 있는 분야 중 하나인 강화학습은 복잡하고 불확실한 환경과 상호작용하는 학습자에게 주어지는 보상을 최대화하는 수치 계산적 학습 방법이다. 리처드 서튼과 앤드류 바르토는 이 책 《단단한 강화학습》을 통해 강화학습의 핵심적인 개념과 알고리즘을 분명하고 이해하기 쉽게 설명한다. 1판이 출간된 이후 새롭게 부각된 주제들을 추가하였고, 이미 다루었던 주제들도 최신 내용으로 업데이트하였다.

1판과 마찬가지로 2판에서도 핵심적인 온라인 학습 알고리즘을 집중적으로 다루었는데, 보다 많은 수학적 내용을 별도의 글 상자 안에 추가하였다. 이 책은 크게 다음과 같은 세 부분으로 나누어진다.

■ 첫 번째 부분에서는 정확한 해법을 찾을 수 있는 표 기반 방법만을 적용하여 가능한 한 많은 강화학습 방법을 다루었다. 첫 번째 부분에 제시되는 많은 알고리즘은 2판에서 새롭게 추가된 것인데, 여기에는 UCB, 기댓값 살사, 이중 학습이 포함된다.
■ 두 번째 부분에서는 인공 신경망이나 푸리에 기반과 같은 주제를 다루는 절이 새롭게 추가되면서 첫 번째 부분에서 제시된 방법들이 함수 근사 기반의 방법으로 확장되었고, 비활성 정책 학습과 정책 경사도 방법에 대한 내용이 더욱 풍부해졌다.
■ 세 번째 부분에서는 강화학습이 심리학 및 신경 과학과 어떤 관계인지를 다루는 새로운 장들이 추가되었고, 알파고와 알파고 제로, 아타리 게임, IBM 왓슨의 내기 전략과 같은 사례 연구를 다루는 장이 업데이트되었다. 마지막 장에서는 강화학습이 미래 사회에 미칠 영향에 대해 논의하였다.

정보제공 :

펼치기

저자소개

리처드 서튼(지은이)

앨버타 대학교의 컴퓨터 과학과 교수이자 같은 대학에서 강화학습 및 인공지능 분과의 AITF(Alberta Innovates Technology Future) 의장을 맡고 있다. 또한, 딥마인드의 우수 과학자(Distinguished Research Scientist)이기도 하다.

앤드류 바르토(지은이)

매사추세츠 대학교 애머스트 캠퍼스의 컴퓨터 및 정보과학 대학에서 명예 교수로 재직 중이다.

김성우(옮긴이)

인공위성 제어에 지도학습을 적용한 연구로 박사학위를 받았다. 지금은 인공위성 개발 업체에서 위성 충돌 회피 및 위성 영상 분석을 위한 기계학습 방법을 연구하고 있다.