本篇主要提供深度强化学习算法与实践:基于PyTorch的实现电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
1. 理论结合实践,从最基础的知识开始,深入算法本质
2. 介绍各种强化学习环境及其使用方法
3. 利用PyTorch动态计算图的特点构造深度学习算法
4. 涵盖各种强化学习算法,包括基于价值函数和基于策略的强化学习算法
5. 介绍强化学习在不同领域的应用,如何根据具体情况选择不同的强化学习算法
本书从强化学习的基础知识出发,结合PyTorch深度学习框架,介绍深度强化学习算法各种模型的相关算法原理和基于PyTorch的代码实现。作为一本介绍深度强化学习知识的相关图书,本书介绍了常用的强化学习环境,基于价值网络的强化学习算法和基于策略梯度的强化学习算法,以及一些常用的比较流行的深度强化学习算法(如蒙特卡洛树搜索)等。另外,还介绍了深度强化学习算法在实际问题中的一些应用。
张校捷,Shopee资深机器学习工程师,负责推荐系统的算法实现和优化。目前主要使用的技术栈是深度学习框架后端的C/C++/CUDA,以及深度学习框架前端的Python。熟悉主流的深度学习框架,如PyTorch和TensorFlow,同时熟悉计算机视觉、自然语言处理和推荐系统方面的深度学习算法。作者曾多次作为专题演讲嘉宾,受邀参加Google、PyCon和CSDN主办的技术大会。
该书由浅入深,详细介绍了强化学习的基本结构和原理,并给出了许多强化学习算法的PyTorch实现,具有很高的参考价值,是一本值得阅读的佳作。
——谷歌开发者机器学习专家(Google Developer Expert in Machine Learning) 孔晓泉
大众耳熟能详的AlphaGo、AlphaStar等都是利用了深度强化学习(DRL)方法战胜了人类的顶级选手,所以DRL被学术界认为是通向通用人工智能的主要方法,也是目前学术界最热的研究领域之一。由于相关工作过于前沿, 学术论文分布广泛,对希望快速上手DRL的读者来说,校捷的这本《PyTorch深度强化学习实践》刚好填补了这块空白,该书深入浅出,理论结合实践,从简单的Atari游戏上手扩展到基于DRL的推荐算法和股票交易系统等,涵盖了非常丰富的DRL算法和基于PyTorch的参考代码,是希望进入DRL领域读者扩大知识面的必备读物。
——谷歌云AI/ML专家 王顺
强化学习(Reinforcement Learning,RL)在AlphaGo于2016年击败李世石后走入大众视野,并且随后被MLCommon组织采用作为MLPerf的一项基准测试,可见强化学习的重要性。关于强化学习的各种文献与总结数不胜数,让想要探究一二的入门者无从下手。喜闻张校捷师弟再出佳作,经过拜读之后,发现本文总结了强化学习的各个主要方向,并且配以代码示例,实为一本强化学习入门的启发性读物。
——英特尔IAGS软件工程师 石元坤