碁峰資訊 -

圖書分類工程/3D繪圖辦公軟體應用作業系統 / 伺服器程式設計/APP開發電腦硬體/創客網頁開發設計影像編修繪圖影音多媒體數位攝影數位生活資料庫/大數據網路/架站人文科普商業管理統計數學檢定認證概論/科技趨勢 Apple

Deep Learning 4｜用Python進行強化學習的開發實作

作者：斎藤康毅
譯者：吳嘉芳
書號： A720
出版日： 2023/09/12
ISBN：9786263246119
附件：線上下載
定價： 680
電子書：未出版

購買紙本書

內容特色

本暢銷系列作品的第4本書，這次的主題是強化學習。書中延續此系列的一貫風格，顯示實際的程式碼，讓讀者邊執行邊學習，不依賴外部程式庫，從零開始建置、學習支撐強化學習的基本技術與概念。

從「理論」與「實踐」兩方面著手，仔細解說強化學習這個複雜主題的構成要素，讓讀者確實掌握強化學習的獨特理論。有別於只用公式說明理論的書籍，讀者可以從書中的程式碼，獲得許多意想不到的領悟。

作者介紹

斎藤康毅
1984年生於長崎縣對馬，畢業於東京工業大學工學院，東京大學研究所學際情報學府學士課程修畢。現在於企業內從事與電腦視覺、機器學習有關的研究開發工作。1984年生於長崎縣對馬，畢業於東京工業大學工學院，東京大學研究所學際情報學府學士課程修畢。現在於企業內從事與電腦視覺、機器學習有關的研究開發工作。

章節目錄

第 1 章吃角子老虎機問題
第 2 章馬可夫決策過程
第 3 章貝爾曼方程式
第 4 章動態規劃法
第 5 章蒙地卡羅法
第 6 章 TD 法
第 7 章類神經網路與 Q 學習
第 8 章 DQN
第 9 章策略梯度法
第 10 章進階內容
附錄 A 離線策略蒙地卡羅法
附錄 B n 步 TD 法
附錄 C 理解 Double DQN
附錄 D 驗證策略梯度法

延伸閱讀

金融風險管理的機器學習應用｜使用Python
機器學習模擬應用｜將合成資料運用於AI
建構機器學習管道｜運用TensorFlow實現模型生命週期自動化

Deep Learning 4｜用Python進行強化學習的開發實作分享

作者：斎藤康毅

書號：A720

ISBN：9786263246119

出版日：2023/09/12

定價：$ 680

電子書：已出版

購買紙本書

金石堂 MOMO 天瓏博客來

內容特色

本暢銷系列作品的第4本書，這次的主題是強化學習。書中延續此系列的一貫風格，顯示實際的程式碼，讓讀者邊執行邊學習，不依賴外部程式庫，從零開始建置、學習支撐強化學習的基本技術與概念。

從「理論」與「實踐」兩方面著手，仔細解說強化學習這個複雜主題的構成要素，讓讀者確實掌握強化學習的獨特理論。有別於只用公式說明理論的書籍，讀者可以從書中的程式碼，獲得許多意想不到的領悟。

作者介紹

斎藤康毅
1984年生於長崎縣對馬，畢業於東京工業大學工學院，東京大學研究所學際情報學府學士課程修畢。現在於企業內從事與電腦視覺、機器學習有關的研究開發工作。1984年生於長崎縣對馬，畢業於東京工業大學工學院，東京大學研究所學際情報學府學士課程修畢。現在於企業內從事與電腦視覺、機器學習有關的研究開發工作。

章節目錄

第 1 章吃角子老虎機問題
第 2 章馬可夫決策過程
第 3 章貝爾曼方程式
第 4 章動態規劃法
第 5 章蒙地卡羅法
第 6 章 TD 法
第 7 章類神經網路與 Q 學習
第 8 章 DQN
第 9 章策略梯度法
第 10 章進階內容
附錄 A 離線策略蒙地卡羅法
附錄 B n 步 TD 法
附錄 C 理解 Double DQN
附錄 D 驗證策略梯度法

延伸閱讀

金融風險管理的機器學習應用｜使用Python

機器學習模擬應用｜將合成資料運用於AI

建構機器學習管道｜運用TensorFlow實現模型生命週期自動化

購買紙本書

內容特色

作者介紹

章節目錄

延伸閱讀

金融風險管理的機器學習應用｜使用Python 機器學習模擬應用｜將合成資料運用於AI 建構機器學習管道｜運用TensorFlow實現模型生命週期自動化

Deep Learning 4｜用Python進行強化學習的開發實作 分享

內容特色

作者介紹

章節目錄

延伸閱讀

金融風險管理的機器學習應用｜使用Python
機器學習模擬應用｜將合成資料運用於AI
建構機器學習管道｜運用TensorFlow實現模型生命週期自動化

Deep Learning 4｜用Python進行強化學習的開發實作分享