深度強化學(xué)習(xí)圖解
我們在與環(huán)境交互的過程中進行學(xué)習(xí),經(jīng)歷的獎勵
或懲罰將指導(dǎo)我們未來的行為。深度強化學(xué)習(xí)將該過程
引入人工智能領(lǐng)域,通過分析結(jié)果來尋找最有效的前進
方式。DRL智能體可提升營銷效果、預(yù)測股票漲跌,甚
至擊敗頂尖圍棋高手和國際象棋大師。
《深度強化學(xué)習(xí)圖解》呈現(xiàn)生動示例,指導(dǎo)你構(gòu)建
深度學(xué)習(xí)體系。Python代碼包含詳明、直觀的注釋,助
你深刻理解DRL技術(shù)。你將學(xué)習(xí)算法的運行方式,并學(xué)
會用評估性反饋來開發(fā)自己的DRL智能體。
本書主要內(nèi)容包括:
●強化學(xué)習(xí)入門
●行為與人類似的DRL智能體
●在復(fù)雜情況下應(yīng)用DRL
本書適用于具有基礎(chǔ)深度學(xué)習(xí)經(jīng)驗的開發(fā)者。
Miguel Morales在洛克希德●馬丁(Lockheed Martin)公 司從事強化學(xué)習(xí)工作,在佐治亞理工學(xué)院擔(dān)任強化學(xué)習(xí)與決策課程的講師。
評論
圖片
表情
