高等教育 > 计算机类
机器学习方法及应用
书号:9787113268183 套系名称:人工智能应用丛书全国高等院校人工智能系列“十三五”规划教材
作者:袁景凌 贲可荣 魏娜 出版日期:2020-06-01
定价:48.00 页码 / 开本:236 /16
策划编辑:周海燕 责任编辑:周海燕 卢笛 刘丽丽
适用专业:其他 适用层次:本科
最新印刷时间:2022-07-29
资源下载
教学课件
教学素材
习题答案(暂无)
教学案例(暂无)
教学设计(暂无)
教学视频(暂无)
内容简介
前言
目录
作者介绍
图书特色
数据是载体,智能是目标,而机器学习则是从数据通往智能的技术途径。机器学习是数据科学的核心,是现代人工智能的本质。本书内容包括机器学习概述、决策树学习、多层感知器、维度约简、支持向量机、无监督学习、概率图模型、强化学习、深度学习。本书除介绍常用的机器学习方法外,还综述各主要方法的应用现状。通过各章案例的详细描述,读者可以系统地掌握机器学习方法。本书应用案例采用Python语言编写,并提供下载网址。 本书适合作为高等院校人工智能、数据科学与大数据、计算机科学与技术、软件工程等计算机类专业的本科生及研究生“机器学习”课程教材,也适合作为机器学习爱好者的参考读物。
机器学习方法分类 机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 1按照有无监督分类 有监督学习(Supervised Learning):从给定的有标注的训练数据集中学习出一个函数(模型参数),当新的数据到来时可以根据这个函数预测结果。常见任务包括分类与回归。 无监督学习(Unsupervised Learning):没有标注的训练数据集,需要根据样本间的统计规律对样本集进行分析,常见任务如聚类等。 半监督学习(Semisupervised Learning):结合(少量的)标注训练数据和(大量的)未标注数据来进行数据的分类学习。 增强学习(Reinforcement Learning):外部环境对输出只给出评价信息而非正确答案,学习机通过强化受奖励的动作来改善自身的性能。 多任务学习(Multitask Learning):把多个相关(Related)的任务放在一起同时学习。 2按照解决问题分类 按照解决问题可分为:分类问题、回归问题、聚类问题和其他问题。 隐马尔可夫模型是一个关于时序的概率模型,描述由隐马尔可夫链随机生成观测序列的过程,属于生成模型。隐马尔可夫模型在语音识别、自然语言处理、生物信息等领域有着广泛的应用。 条件随机场是一个序列标注模型,其优点在于为一个位置进行标注的过程中可以利用丰富的内部及上下文特征信息。 LDA主题模型是一种文档主题生成模型,是一种非监督机器学习技术。通过模拟文档生成过程,可以用来识别大规模文档集或语料库中潜藏的主题信息。 机器学习面临的难题与挑战 (1)数据稀疏性:训练一个模型,需要大量(标注)数据,但是数据往往比较稀疏。例如:想训练一个模型表征某人“购物兴趣”,但是这个人在网站上浏览行为很少,购物历史很少,很难训练出一个“有意义模型”来预测应该给这个人推荐什么商品等。 (2)高数量和高质量标注数据需求:获取标定数据需要耗费大量人力和财力。而且,人会出错,有主观性。如何获取高数量和高质量标定数据,或者用机器学习方法只标注“关键”数据(主动学习)值得深入研究。 (3)冷启动问题:一个好互联网产品,用的人越多,得到的数据越多;得到的数据越多,模型训练得越好,产品会变得更好用,用的人就会更多……进入良性循环(涟漪效益)。对于一个新产品,在初期要面临数据不足的冷启动问题。 (4)泛化能力问题:训练数据不能全面、均衡地代表真实数据。 (5)模型抽象困难:总结归纳实际问题中的数学表示非常困难。 (6)模型评估困难:在很多实际问题中,很难形式化地、定量地评估一个模型的结果是好还是不好。 (7)寻找最优解困难:要解决的实际问题非常复杂,将其形式化后的目标函数也非常复杂,往往在目前还不存在一个有效的算法能找到目标函数的最优值。 (8)可扩展性是互联网的核心问题之一。搜索引擎索引的重要网页超过100亿:如果1台机器每秒处理1 000个网页,需要至少100天。所以出现了MapReduce、MPI、Spark、Pegasus、Pregel、Hama等分布式计算构架。选择什么样的计算平台,与算法设计紧密相关。 (9)速度是互联网核心的用户体验。线下模型训练可以花费很长时间,如Google某个模型更新一次需要几千台机器,大约训练半年时间。但是,线上使用模型时要求一定要“快,并且实时”。 (10)在线学习:互联网每时每刻都在产生大量新数据,要求模型随之不停更新,所以在线学习是机器学习的一个重要研究方向。 机器学习发展的启示 “机器学习”在其十年的黄金发展期,机器学习界并没有过多地炒作“智能”或者“认知”,而是关注于引入统计学等来建立学科的理论基础,面向数据分析与处理,以无监督学习和有监督学习为两大主要的研究问题,提出和开发了一系列模型、方法和计算算法等,切实地解决了工业界所面临的一些实际问题。因为大数据的驱动和计算能力的极大提升,一批面向机器学习的底层架构先后被开发出来。神经网络其实在20世纪80年代末或90年代初就被广泛研究,但后来沉寂了。而基于深度学习的神经网络强势崛起,给工业界带来了深刻的变革和机遇。深度学习的成功不是源自脑科学或认知科学的进展,而是因为大数据的驱动和计算能力的极大提升。 机器学习的发展诠释了多学科交叉的重要性和必要性。然而这种交叉不是简单地彼此知道几个名词或概念就可以的,是需要真正融会贯通。统计学家弗莱德曼早期从事物理学研究,他是优化算法大师,而且他的编程能力同样令人赞叹。乔丹教授既是一流的计算机学家,又是一流的统计学家,而他的博士专业为心理学,他能够承担起建立统计机器学习的重任。辛顿教授是世界最著名的认知心理学家和计算机科学家。虽然他很早就成就斐然,在学术界久负盛名,但他依然始终活跃在一线,自己写代码。他提出的许多想法简单、可行又非常有效,被称为伟大的思想家。正是由于他的睿智和身体力行,深度学习技术迎来了革命性的突破。这些学者非常务实,从不提那些空洞无物的概念和框架。他们遵循自下而上的方式,从具体问题、模型、方法、算法等着手,一步一步实现系统化。 可以说机器学习是由学术界、工业界、创业界(或竞赛界)等合力造就的。学术界是引擎,工业界是驱动,创业界是活力和未来。学术界和工业界应该有各自的职责和分工。学术界的职责在于建立和发展机器学习学科,培养机器学习领域的专门人才;而大项目、大工程更应该由市场来驱动,由工业界来实施和完成。 本书内容包括机器学习概述、决策树学习、多层感知器、维度约简、支持向量机、无监督学习、概率图模型、强化学习、深度学习。除包括基本概念、基本知识外,每章均包括相关技术的应用概述及典型应用案例。 本书适合作为高等院校人工智能、数据科学与大数据、计算机科学与技术、软件工程等计算机类专业的本科生及研究生“机器学习”课程的教材,也可作为机器学习各类培训用书和爱好者的参考书。 贲可荣、魏娜撰写第1、2、3、5、9章及第66节,张献参与第9章的撰写。其余章节(含第25节)由袁景凌老师撰写,董建升、丁远远、曹阳、肖嵩参加了部分案例编写。贲可荣组织了本书编写,并撰写前言。南京大学徐洁磐教授审阅了全书,并提出宝贵意见,特此致谢。最后感谢参考文献的所有作者。 由于时间仓促及编者水平所限,必定存在许多不足,恳请读者批评指正,将不胜感谢。 编者2019年11月
第1章 机器学习概述1 11学习中的元素2 12目标函数的表示4 13机器学习系统的基本结构6 14学习任务的类型7 15机器学习的定义和发展史9 16机器学习可完成的事11 17机器学习的成功案例13 习题16 第2章 决策树学习17 21决策树的组成及分类17 22决策树的构造算法CLS18 23基本的决策树算法ID320 24信息熵和信息增益及其案例21 25随机森林及其应用案例24 251随机森林概述24 252随机森林应用案例27 26决策树和随机森林应用概述29 261决策树的应用概述29 262随机森林的应用概述30 小结32 习题32 第3章 多层感知器34 31神经元模型34 32感知器及其学习规则35 33多层感知器38 34反向传播算法39 目录 35反向传播网络的应用概述45 36案例:基于反向传播网络拟合曲线46 小结52 习题53 第4章 维度约简55 41主成分分析55 42独立成分分析58 43线性判别分析59 44局部线性嵌入62 45维度约简算法应用概述65 46案例分析66 461利用PCA对半导体制造数据降维66 462LDA降维——应用于Wine葡萄酒数据集67 小结69 习题69 第5章 支持向量机71 51线性可分模式的最优超平面71 52不可分离模式的最优超平面75 53用于模式识别的支持向量机的潜在思想78 54使用核方法的支持向量机78 55支持向量机的设计80 56支持向量机的应用概述81 57支持向量机的示例83 小结86 习题87 第6章 无监督学习89 61聚类概述89 62Kmeans算法90 63DBSCAN算法92 64EM算法94 65关联分析97 66竞争网络99 661Hamming网络100 662竞争学习及案例101 663自组织特征图104 664学习向量量化107 67无监督学习应用概述109 68案例分析111 681使用K-means算法对用户购物行为聚类和推荐111 682使用DBSCAN清洗GPS轨迹数据111 683高斯混合模型的EM聚类113 684学习向量量化解决分类问题114 小结116 习题116 第7章 概率图模型118 71贝叶斯网络118 711贝叶斯基本公式119 712朴素贝叶斯分类器120 713贝叶斯网络的拓扑结构121 714条件独立性假设121 715先验概率的确定和网络推理算法122 72马尔可夫随机场124 721马尔可夫随机场概念125 722马尔可夫随机场的因式分解126 73隐马尔可夫模型128 74马尔可夫链蒙特卡罗131 741蒙特卡罗积分131 742马尔可夫链132 743马尔可夫链蒙特卡罗132 75LDA主题提取模型136 76概率图模型应用概述138 77案例分析141 771朴素贝叶斯进行垃圾邮件过滤141 772前向后向算法求观测序列概率142 773马尔可夫链蒙特卡罗方法预测睡眠质量144 774利用LDA对文本进行主题提取148 小结149 习题150 第8章 强化学习151 81强化学习过程151 82马尔可夫决策过程152 83Q-Learning156 84强化学习应用概述159 85案例分析161 851使用马尔可夫决策过程求解最优策略162 852寻宝游戏163 小结164 习题165 第9章 深度学习166 91深度学习概述166 92卷积神经网络169 921卷积层169 922池化层171 923卷积神经网络结构172 93循环神经网络172 931给网络增加记忆能力173 932简单循环网络174 933应用到机器学习175 934参数学习177 935基于门控的循环神经网络179 94深度信念网络181 941玻尔兹曼机181 942受限玻尔兹曼机182 943深度信念网络183 95深度生成模型185 951概率生成模型185 952变分自编码器186 953生成对抗网络188 954生成对抗网络的应用190 96深度学习应用概述193 961文本194 962语音195 963计算机视觉196 97机器学习系统199 971主流机器学习系统的分类与介绍200 972主流深度学习框架系统介绍201 973新兴机器学习系统203 98案例:深度学习在计算机视觉中的应用204 小结210 习题210 附录 机器学习工具及资源推荐212 参考文献 217
袁景凌:教授、博士/博导,现担任武汉理工大学计算机科学与技术学院副院长、中国计算机学会高级会员,CCF教育专委会委员并任湖北省计算机学会理事,武汉软件工程学会会员等。主要研究方向包括机器学习、绿色计算、智能方法应用等。 贲可荣: 海军工程大学电子工程学院教授、博导,在软件工程和人工智能等方向,先后主持和参加了国家自然科学基金、军队科研等20余个项目。中国计算机学会理论计算机科学专委副主任、软件工程专委委员。评为教育部骨干教师、首届湖北省优秀研究生导师,第三届大学教学名师,获军队院校育才奖金奖。研究方向:人工智能、软件工程。出版教材、译著15部,主编的《人工智能(第二版)》获评普通高等教育“十二五”国家级规划教材。 魏娜:博士,讲师,海军工程大学电子工程学院,人工智能、模式识别,主讲课程《人工智能导论》。
本书介绍常用机器学习方法,综述各主要方法的应用现状,通过各章的案例详细描述,让读者系统掌握机器学习方法。本书应用案例采用Python语言编写,并提供下载网址。