×
Deep Learning 4|用Python進行強化學習的開發實作
作者: 斎藤康毅
譯者:吳嘉芳
書號: A720
出版日: 2023/09/12
ISBN:9786263246119
附件: 線上下載
定價: 680
電子書: 未出版
內容特色
本暢銷系列作品的第4本書,這次的主題是強化學習。書中延續此系列的一貫風格,顯示實際的程式碼,讓讀者邊執行邊學習,不依賴外部程式庫,從零開始建置、學習支撐強化學習的基本技術與概念。

從「理論」與「實踐」兩方面著手,仔細解說強化學習這個複雜主題的構成要素,讓讀者確實掌握強化學習的獨特理論。有別於只用公式說明理論的書籍,讀者可以從書中的程式碼,獲得許多意想不到的領悟。
作者介紹
斎藤康毅
1984年生於長崎縣對馬,畢業於東京工業大學工學院,東京大學研究所學際情報學府學士課程修畢。現在於企業內從事與電腦視覺、機器學習有關的研究開發工作。1984年生於長崎縣對馬,畢業於東京工業大學工學院,東京大學研究所學際情報學府學士課程修畢。現在於企業內從事與電腦視覺、機器學習有關的研究開發工作。
章節目錄
第 1 章 吃角子老虎機問題
第 2 章 馬可夫決策過程
第 3 章 貝爾曼方程式
第 4 章 動態規劃法
第 5 章 蒙地卡羅法
第 6 章 TD 法
第 7 章 類神經網路與 Q 學習
第 8 章 DQN
第 9 章 策略梯度法
第 10 章 進階內容
附錄 A 離線策略蒙地卡羅法
附錄 B n 步 TD 法
附錄 C 理解 Double DQN
附錄 D 驗證策略梯度法
Deep Learning 4|用Python進行強化學習的開發實作 分享
  • 作者: 斎藤康毅
  • 書號:A720
  • ISBN:9786263246119
  • 出版日:2023/09/12
  • 定價:$ 680
  • 電子書:已出版
  • 購買紙本書

    內容特色
    本暢銷系列作品的第4本書,這次的主題是強化學習。書中延續此系列的一貫風格,顯示實際的程式碼,讓讀者邊執行邊學習,不依賴外部程式庫,從零開始建置、學習支撐強化學習的基本技術與概念。

    從「理論」與「實踐」兩方面著手,仔細解說強化學習這個複雜主題的構成要素,讓讀者確實掌握強化學習的獨特理論。有別於只用公式說明理論的書籍,讀者可以從書中的程式碼,獲得許多意想不到的領悟。
    作者介紹
    斎藤康毅
    1984年生於長崎縣對馬,畢業於東京工業大學工學院,東京大學研究所學際情報學府學士課程修畢。現在於企業內從事與電腦視覺、機器學習有關的研究開發工作。1984年生於長崎縣對馬,畢業於東京工業大學工學院,東京大學研究所學際情報學府學士課程修畢。現在於企業內從事與電腦視覺、機器學習有關的研究開發工作。
    章節目錄
    第 1 章 吃角子老虎機問題
    第 2 章 馬可夫決策過程
    第 3 章 貝爾曼方程式
    第 4 章 動態規劃法
    第 5 章 蒙地卡羅法
    第 6 章 TD 法
    第 7 章 類神經網路與 Q 學習
    第 8 章 DQN
    第 9 章 策略梯度法
    第 10 章 進階內容
    附錄 A 離線策略蒙地卡羅法
    附錄 B n 步 TD 法
    附錄 C 理解 Double DQN
    附錄 D 驗證策略梯度法