| 000 | 00000cam c2200205 c 4500 | |
| 001 | 000046146149 | |
| 005 | 20251106094711 | |
| 007 | ta | |
| 008 | 230406s2023 ulkad 001c kor | |
| 020 | ▼a 9791169210850 ▼g 93000 | |
| 035 | ▼a (KERIS)BIB000016681501 | |
| 040 | ▼a 247009 ▼c 247009 ▼d 211009 | |
| 041 | 1 | ▼a kor ▼h eng |
| 082 | 0 4 | ▼a 006.31 ▼2 23 |
| 085 | ▼a 006.31 ▼2 DDCK | |
| 090 | ▼a 006.31 ▼b 2023z4 | |
| 100 | 1 | ▼a Huyen, Chip ▼0 AUTH(211009)175100 |
| 245 | 1 0 | ▼a 머신러닝 시스템 설계 / ▼d 칩 후옌 지음 ; ▼e 김대근, ▼e 김영민 옮김 |
| 246 | 1 9 | ▼a Designing machine learning systems : ▼b an iterative process for production-ready applications |
| 246 | 1 | ▼i 판권기표제: ▼a 머신러닝 시스템 설계 : ▼b 프로젝트 범위 산정부터 프로덕션 배포 후 모니터링까지, MLOps 완벽 해부하기 |
| 260 | ▼a 서울 : ▼b 한빛미디어, ▼c 2023 | |
| 300 | ▼a 436 p. : ▼b 삽화, 도표 ; ▼c 24 cm | |
| 500 | ▼a 색인수록 | |
| 650 | 0 | ▼a Machine learning |
| 650 | 0 | ▼a Application software ▼x Design |
| 700 | 1 | ▼a 김대근, ▼e 역 |
| 700 | 1 | ▼a 김영민, ▼e 역 |
| 900 | 1 0 | ▼a 후옌, 칩, ▼e 저 |
| 945 | ▼a ITMT |
소장정보
| No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
|---|---|---|---|---|---|---|---|
| No. 1 | 소장처 중앙도서관/제2자료실(3층)/ | 청구기호 006.31 2023z4 | 등록번호 111879014 (9회 대출) | 도서상태 대출중 | 반납예정일 2026-04-09 | 예약 예약가능 | 서비스 |
| No. 2 | 소장처 세종학술정보원/과학기술실(5층)/ | 청구기호 006.31 2023z4 | 등록번호 151366430 (2회 대출) | 도서상태 대출중 | 반납예정일 2026-03-31 | 예약 예약가능 | 서비스 |
| No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
|---|---|---|---|---|---|---|---|
| No. 1 | 소장처 중앙도서관/제2자료실(3층)/ | 청구기호 006.31 2023z4 | 등록번호 111879014 (9회 대출) | 도서상태 대출중 | 반납예정일 2026-04-09 | 예약 예약가능 | 서비스 |
| No. | 소장처 | 청구기호 | 등록번호 | 도서상태 | 반납예정일 | 예약 | 서비스 |
|---|---|---|---|---|---|---|---|
| No. 1 | 소장처 세종학술정보원/과학기술실(5층)/ | 청구기호 006.31 2023z4 | 등록번호 151366430 (2회 대출) | 도서상태 대출중 | 반납예정일 2026-03-31 | 예약 예약가능 | 서비스 |
컨텐츠정보
책소개
프로덕션 환경에서 머신러닝을 다룰 때 무수히 생겨나는 물음표를 해결해줄 MLOps 지침서. 머신러닝 시스템 개발은 선형이 아닌 순환 프로세스다. 모델을 개발해 배포하고 나서도 끊임없는 모니터링과 업데이트가 필요하다.
이 책은 비즈니스 관점에서 머신러닝 시스템을 설계하고 운영할 때 맞닥뜨리는 모든 단계를 다룬다. 책에서 소개하는 다양한 접근법과 사례 연구는 머신러닝 시스템을 성공으로 이끌기 위한 인사이트를 제공한다. 저자가 수많은 기업과 협업한 경험을 기반으로 제시하는 실무 중심 접근법은 시스템이 안고 있는 난제를 해결하는 데 발판이 되어줄 것이다.
현업에서 필요했던 ‘진짜’ 머신러닝 이야기
머신러닝이라고 하면 보통 모델 개발과 알고리즘을 떠올리지만 실제로 프로덕션 환경에서 머신러닝을 운영할 때는 그 외에도 고려할 것이 많습니다. 머신러닝 시스템을 이루고 있는 데이터, 피처, 모델 개발·평가·배포, 모니터링, 인프라 등을 전체적인 관점에서 고려해야 합니다. 프로덕션용 머신러닝은 대부분 비즈니스를 중심으로 하는 만큼 비즈니스 문제에 따른 요구 사항과 이해관계자 또한 중요합니다.
이 책은 떠오르는 MLOps 분야의 대표 강의인 스탠퍼드 ‘CS329S: 머신러닝 시스템 설계(Machine Learning Systems Design)’를 기반으로 합니다. 저자인 칩 후옌은 넷플릭스부터 스타트업까지 다양한 기업에서 머신러닝을 배포하고 운영한 경험을 바탕으로, 여러분이 그동안 궁금했지만 답을 찾기 어려웠을 법한 질문에 대해 여러 가지 접근법을 제시합니다. 특정 도구 사용법보다는 각 머신러닝 기법의 개념 및 장단점과 트레이드오프에 집중하며, 더 필요한 정보는 바로 찾아볼 수 있도록 풍부한 참고 자료 링크를 제공합니다.
대상 독자
머신러닝 관련 실무자: 머신러닝 엔지니어, 데이터 과학자, 머신러닝 플랫폼 엔지니어, 엔지니어링 관리자 등
도구 개발자: 머신러닝 프로덕션에서 서비스가 부족한 영역을 찾아내 생태계에 맞는 도구를 만들어 넣을 방안을 파악하려는 경우
구직자 및 학생: 머신러닝 관련 직무로 취업하려는 경우
기술 및 비즈니스 리더: 제품 및 비즈니스 프로세스를 개선하기 위해 머신러닝 솔루션 채택을 고려하는 경우
장별 주요 내용
[1장 머신러닝 시스템 개요]
다양한 머신러닝 유스 케이스를 살펴보면서 머신러닝을 적용하기에 적합한 경우와 그렇지 않은 경우를 논의합니다. 프로덕션용 머신러닝을 연구용 머신러닝 및 전통적인 소프트웨어와 비교해봅니다.
[2장 머신러닝 시스템 설계 소개]
비즈니스 목적에 따라 시스템 요구 사항을 정하고, 이를 만족하는 머신러닝 시스템을 설계하기 위한 반복 프로세스를 살펴봅니다. 머신러닝 문제를 구조화하는 방법을 논의합니다.
[3장 데이터 엔지니어링 기초]
머신러닝 프로젝트에서 사용하는 다양한 데이터의 소스와 데이터를 저장하는 포맷을 살펴봅니다. 데이터 스토리지 엔진과 주요 처리 유형, 프로세스 간에 데이터를 전달하는 다양한 모드를 알아봅니다.
[4장 훈련 데이터]
양질의 훈련 데이터를 얻는 기술을 살펴봅니다. 다양한 샘플링 기술을 알아본 뒤 레이블 다중성과 클래스 불균형을 비롯해 훈련 데이터를 생성할 때 흔히 맞닥뜨리는 문제를 논의합니다.
[5장 피처 엔지니어링]
피처 엔지니어링 기법과 주요 고려 사항을 살펴봅니다. 데이터 누수를 감지하고 방지하는 방법을 알아보고 좋은 피처를 설계하는 방법을 논의합니다.
[6장 모델 개발과 오프라인 평가]
작업에 가장 적합한 알고리즘을 선택할 때 유용한 팁을 살펴본 뒤 디버깅, 실험 추적과 버전 관리, 분산 학습, 오토ML 등 모델 개발의 다양한 측면을 알아봅니다.
[7장 모델 배포와 예측 서비스]
머신러닝 배포를 둘러싼 통념을 살펴봅니다. 온라인 예측과 배치 예측을 알아본 뒤 다양한 모델 압축 기술을 살펴봅니다. 에지 디바이스와 클라우드에서 모델을 배포하는 방법을 논의합니다.
[8장 데이터 분포 시프트와 모니터링]
프로덕션에 배포한 머신러닝 모델이 실패하는 이유를 논의합니다. 연구와 실무 양쪽에서 많은 논의가 이루어지고 있는 데이터 분포 시프트 문제를 살펴봅니다.
[9장 연속 학습과 프로덕션 테스트]
데이터 분포 시프트에 적응하기 위해 머신러닝 모델을 업데이트하는 방법을 살펴봅니다. 연속 학습이 무엇이며 어떤 어려움이 있는지 알아보고, 모델 재훈련 빈도와 프로덕션 테스트를 논의합니다.
[10장 MLOps를 위한 인프라와 도구]
프로덕션 규모와 상황에 따라 머신러닝 시스템에 적합한 인프라를 설정하는 방법을 알아봅니다. 인프라를 구성하는 네 가지 레이어인 스토리지와 컴퓨팅, 자원 관리 도구, 머신러닝 플랫폼, 개발 환경을 논의합니다.
[11장 머신러닝의 인간적 측면]
머신러닝 모델의 확률론적 특성에 따라 사용자 경험이 어떻게 영향받는지 논의합니다. 한 시스템을 개발하는 구성원들이 효과적으로 협업하기 위한 조직 구조를 알아보고, 머신러닝 시스템이 사회 전체에 미치는 영향을 들여다봅니다.
정보제공 :
저자소개
칩 후옌(지은이)
머신러닝 시스템의 전문 작가이자 컴퓨터 과학자. 엔비디아와 스노클 AI에서 재직했으며, AI 인프라 스타트업을 창업 후 매각하였다. 스탠퍼드에서 머신러닝 시스템을 강의하기도 했다. 2022년에 출간된 저서 『Designing Machine Learning Systems』는 아마존 인공지능 분야 베스트셀러로, 10개 이상의 언어로 번역되었다(한국어판: 『머신러닝 시스템 설계』(한빛미디어, 2023)). 베트남에서는 『Xach ba lo len va Di 』(배낭을 메고 떠나라) 시리즈를 비롯해 다양한 도서를 집필했다.
김대근(옮긴이)
머신러닝을 공부하기 시작했을 때 접한 톰 M. 미첼(Tom M. Mitchell)의 명언, “머신러닝으로 문제를 해결하려면 그 문제를 명확히 정의해야 한다”라는 말을 상기하며 항상 초심을 잃지 않으려 합니다. 학부 과정에서 컴퓨터 과학과 수학을 복수 전공하고 석사 과정에서 머신러닝을 전공했습니다. 여러 해 동안 스타트업, 제조 및 금융 업계를 거치며 컴퓨터 비전 엔지니어로서 다수의 1저자 특허를 등록하고 제품 양산에 기여했으며, 데이터 과학자로서 다양한 PoC와 현업 프로젝트를 수행했습니다. 현재는 클라우드 업계에서 고객의 비즈니스 요구 사항을 이해하고 문제를 해결하는 AI/ML 전문가로서 기술적인 도움을 주고 있습니다. 『머신러닝 시스템 설계』(한빛미디어, 2023)를 우리말로 옮겼습니다.
김영민(옮긴이)
금융공학으로 파생상품 가치를 평가하는 증권사 퀀트로 일했습니다. 2015년 커리어를 바꾸어 IT와 금융 업계에서 데이터 과학자 및 ML 엔지니어로 일하면서 다양한 ML 서비스 론칭에 기여했습니다. 현재 AWS에서 엔터프라이즈의 비즈니스 문제를 머신러닝으로 해결하면서 고객 성공을 지원합니다. _현) 아마존 웹 서비스 데이터 과학자 _전) 현대카드 ML 엔지니어 _전) 넷마블 게임즈 데이터 과학자 _전) 신영증권 리스크 퀀트, CFA 저역서 _《머신러닝 시스템 설계》 공역
목차
1장 머신러닝 시스템 개요 1.1 머신러닝을 사용해야 하는 경우 1.2 머신러닝 시스템 이해하기 1.3 정리 2장 머신러닝 시스템 설계 소개 2.1 비즈니스와 머신러닝의 목적 2.2 머신러닝 시스템 요구 사항 2.3 반복 프로세스 2.4 머신러닝 문제 구조화하기 2.5 지성 vs. 데이터 2.6 정리 3장 데이터 엔지니어링 기초 3.1 데이터 소스 3.2 데이터 포맷 3.3 데이터 모델 3.4 데이터 스토리지 엔진 및 처리 3.5 데이터플로 모드 3.6 배치 처리 vs. 스트림 처리 3.7 정리 4장 훈련 데이터 4.1 샘플링 4.2 레이블링 4.3 클래스 불균형 문제 4.4 데이터 증강 4.5 정리 5장 피처 엔지니어링 5.1 학습된 피처 vs. 엔지니어링된 피처 5.2 피처 엔지니어링 기법 5.3 데이터 누수 5.4 좋은 피처를 설계하는 방법 5.5 정리 6장 모델 개발과 오프라인 평가 6.1 모델 개발과 훈련 6.2 모델 오프라인 평가 6.3 정리 7장 모델 배포와 예측 서비스 7.1 머신러닝 배포에 대한 통념 7.2 배치 예측 vs. 온라인 예측 7.3 모델 압축 7.4 클라우드와 에지에서의 머신러닝 7.5 정리 8장 데이터 분포 시프트와 모니터링 8.1 머신러닝 시스템 장애 원인 8.2 데이터 분포 시프트 8.3 모니터링과 관찰 가능성 8.4 정리 9장 연속 학습과 프로덕션 테스트 9.1 연속 학습 9.2 프로덕션에서 테스트하기 9.3 정리 10장 MLOps를 위한 인프라와 도구 10.1 스토리지와 컴퓨팅 10.2 개발 환경 10.3 자원 관리 10.4 머신러닝 플랫폼 10.5 구축 vs. 구매 10.6 정리 11장 머신러닝의 인간적 측면 11.1 사용자 경험 11.2 팀 구조 11.3 책임 있는 AI 11.4 정리



