当前位置: 首页 > 资源下载  > 电子书 > 计算机

揭秘深度强化学习人工智能机器学习技术丛书

12/18/2018 11:15:04 PM 人评论

《揭秘深度强化学习 人工智能机器学习技术丛书》是一本详细介绍深度强化学习算法的入门类图书,涉及深度学习和强化学习的相关内容,是人工智能前沿的研究方向。非常适合想在下一代技术领域立足的人工智能和机器学习算法从业者学习和参考。 机器学习的一个分支是神经网络;

揭秘深度强化学习人工智能机器学习技术丛书

揭秘深度强化学习人工智能机器学习技术丛书

编辑推荐

《揭秘深度强化学习 人工智能机器学习技术丛书》是一本详细介绍深度强化学习算法的入门类图书,涉及深度学习和强化学习的相关内容,是人工智能前沿的研究方向。非常适合想在下一代技术领域立足的人工智能和机器学习算法从业者学习和参考。

机器学习的一个分支是神经网络;神经网络模拟人的大脑,形成神经网络模型,它可以包括很多层次,一般来讲层次越深学习效果越好,很多层的神经网络就是深度学习。

在传统的机器学习中,主要分为非监督学习(unsupervised learning)、监督学习(supervised leaning)和强化学习。强化学习是对决策的学习,简单来讲,强化学习就是用奖励机制,自己调节参数,让算法越来越聪明。

深度强化学习,研究的是如何通过深度学习的方法来解决强化学习的问题。也就是深度学习和强化学习的结合。

《揭秘深度强化学习 人工智能机器学习技术丛书》一书囊括了强化学习基础知识、马尔科夫决策过程、无模型强化学习、模仿学习、深度学习基础知识、神经网络基本组成、反向传播算法、功能神经网络层、循环神经网络、卷积神经网络(CNN)的基础和结构、循环神经网络(RNN)、深度强化学习基础、蒙特卡洛搜索树、策略梯度算法、深度强化学习算法框架、深度Q学习、双Q学习、异步优越性策略子-评价算法、深度强化学习应用实例等。

深度强化学习算法可应用于量化投资、游戏智能、机器人决策、自动驾驶、无人机等。


内容简介

深度强化学习(Deep Reinforcement Learning,DRL)是深度学习算法和强化学习算法的巧妙结合,它是一种新兴的通用人工智能算法技术,也是机器学习的前沿技术,DRL 算法潜力无限,AlphaGo 是目前该算法相当成功的使用案例。DRL 算法以马尔科夫决策过程为基础,是在深度学习强大的非线性函数的拟合能力下构成的一种增强算法。深度强化学习算法主要包括基于动态规划(DP)的算法以及基于策略优化的算法,本书的目的就是要把这两种主要的算法(及设计技巧)讲解清楚,使算法研究人员能够熟练地掌握。

《揭秘深度强化学习人工智能机器学习技术丛书》共10 章,首先以AlphaGo 在围棋大战的伟大事迹开始,引起对人工智能发展和现状的介绍,进而介绍深度强化学习的基本知识。然后分别介绍了强化学习(重点介绍蒙特卡洛算法和时序差分算法)和深度学习的基础知识、功能神经网络层、卷积神经网络(CNN)、循环神经网络(RNN),以及深度强化学习的理论基础和当前主流的算法框架。最后介绍了深度强化学习在不同领域的几个应用实例。引例、基础知识和实例相结合,方便读者理解和学习。

《揭秘深度强化学习 人工智能机器学习技术丛书》内容丰富,讲解全面、语言描述通俗易懂,是深度强化学习算法入门的优选。本书适合计算机专业本科相关学生、人工智能领域的研究人员以及所有对机器学习和人工智能算法感兴趣的人员。


附件下载

  • 下载

    百度网盘下载

    下载: 所需积分:90

  • 积分获取方法:先给账户进行充值,然后进行积分兑换,积分兑换比例:1元可兑换10个积分.
    具体可参考帮助如何获取积分说明

相关资源

  • MATLAB量化金融分析基础与实战

    《MATLAB量化金融分析基础与实战》是一本侧重于阐述MATLAB在量化金融分析领域功能的工具书。书中精选了量化金融分析领域常见的重要函数和模型加以介绍并配有示例,以方便读者学习。本书涵盖了MATLAB基本知识、数据处理、Python交互、金融建模、高效并发程序设计和报告生成…

    5/12/2025 9:33:45 PM
  • Fortran程序设计(第四版)

    本书介绍了Fortran语言基础知识,以及结构化程序设计思想,该设计思想使得大型Fortran程序的维护更易于实现。本书面向的读者是科学/工程类学生,意在对他们进行相应领域的实践训练。本书是一本理想的Fortran语言资料。 本书在讲述Fortran知识过程中,按适用于大型项目开

    4/13/2025 1:24:25 PM
  • 人机交互基础教程(第3版)

    Delphi是面向对象的可视化软件开发平台,它提供了大量VCL组件,具有强大的数据库开发和网络编程能力,极大地提高了应用系统的开发速度,是目前软件开发工具之一。  《人机交互基础教程(第3版)》以DelphiXE8为开发平台进行修订,增加基于Android应用程序设计和基于

    3/23/2025 11:44:42 PM
  • C++面向对象程序设计(第三版)/“十三五”高校计算机应用技术系列规划教材

    《C++面向对象程序设计(第三版)/“十三五”高校计算机应用技术系列规划教材》是为具有C语言基础的读者编写的,主要介绍C什面向对象程序设计的基本知识和编程方法,全面讲述了C++面向对象的基本特征。内容包括类、对象、继承、派生类、多态性、虚函数、运算符重载、

    2/23/2025 12:55:51 PM