作 者:范波,张雷 著
定 价:88
出 版 社:科学出版社
出版日期:2015年07月01日
页 数:188
装 帧:平装
ISBN:9787030447623
●《智能科学技术著作丛书》序
前言
第1章绪论1
1.1引言1
1.2多机器人系统中的信息融合2
1.2.1机器人传感器系统2
1.2.2机器人多传感器信息融合2
1.3多机器人协调与合作研究现状4
1.4多Agent信息融合与协调的研究现状6
1.4.1多Agent信息融合7
1.4.2多Agent协调与合作7
1.5机器人足球及其研究进展9
1.5.1机器人足球的发展概况9
1.5.2FIRA机器人足球比赛系统10
1.5.3机器人足球的关键技术和研究热点11
1.6本书的结构和内容安排13
参考文献14
第2章多Agent的信息融合模型与方法16
2.1引言16
2.2Agent与MAS的概念及特性17
2.2.1Agent的由来及定义17
2.2.2Agent的特性18
2.2.3MAS的概念与特性21
2.2.4MAS与复杂系统21
2.2.5MAS与智能系统23
2.3信息融合技术概述25
2.3.1信息融合的概念与定义26
2.3.2信息融合的模型27
2.3.3信息融合应用与发展现状31
2.4多Agent信息融合模型33
2.4.1Agent体系结构33
2.4.2MAS体系结构35
2.4.3基于多Agent的信息融合模型36
2.5小结37
参考文献38
第3章多Agent协调的学习与对策41
3.1引言41
3.2多Agent协调的理论与方法42
3.2.1协调的基本概念42
3.2.2MAS协调及其理论43
3.3Agent的学习模型与方法46
3.3.1强化学习47
3.3.2Markov决策过程49
3.3.3Q学习算法50
3.4多Agent的协调模型52
3.4.1黑板模型52
3.4.2合同网53
3.4.3通用部分全局规划55
3.5多Agent协调的对策与学习方法55
3.5.1Markov对策概述56
3.5.2冲突博弈59
3.5.3多Agent强化学习60
3.6小结61
参考文献61
第4章基于证据推理的多Agent分布式决策63
4.1引言63
4.2证据推理理论64
4.2.1概率的几种解释及其性质64
4.2.2证据理论的数学基础64
4.2.3证据推理的基本概念67
4.2.4Dempster组合规则68
4.2.5证据决策规则71
4.2.6Dempster组合规则存在的问题72
4.3Agent信息模型73
4.3.1单支置信函数73
4.3.2基于证据推理的Agent信息模型73
4.4可传递置信模型74
4.4.1可传递置信模型的基本结构74
4.4.2辨识框架的粗分和细化75
4.4.3Pignistic概率转换75
4.5基于多Agent的分布式决策融合框架及算法76
4.5.1系统框架76
4.5.2融合中心77
4.5.3决策中心78
4.6仿真算例79
4.6.1赛场状态信息79
4.6.2对手的策略81
4.7多Agent分布式决策融合策略83
4.7.1异构融合83
4.7.2可靠性分配84
4.7.3融合处理84
4.7.4在机器人足球中的应用84
4.8小结88
参考文献89
第5章强化函数设计方法及其在学习系统的应用91
5.1引言91
5.2强化学习应用中的关键问题92
5.2.1泛化方法92
5.2.2探索与利用的权衡94
5.2.3强化函数与算法结构设计95
5.3强化学习的奖惩函数95
5.4基于平均报酬模型的强化学习算法98
5.4.1报酬模型98
5.4.2很优策略99
5.4.3基于平均报酬模型的强化学习主要算法99
5.5一种基于知识的强化函数设计方法101
5.5.1强化函数的基本设计思想101
5.5.2基于知识的强化函数103
5.5.3仿真实验103
5.6小结107
参考文献107
第6章基于分布式强化学习的多Agent协调方法109
6.1引言109
6.2多Agent强化学习基本理论110
6.2.1基于局部合作的Q学习111
6.2.2基于区域合作的Q学习111
6.2.3算法的收敛性113
6.3多Agent强化学习方法的特性114
6.3.1多Agent强化学习理论及假设的不同114
6.3.2多Agent强化学习模型及框架的差异115
6.3.3多Agent强化学习内容的区别115
6.3.4多Agent强化学习算法设计的迥异116
6.4多Agent强化学习算法的分类与比较116
6.4.1绝对合作型多Agent强化学习算法116
6.4.2绝对竞争型多Agent强化学习算法117
6.4.3混合型多Agent强化学习算法117
6.4.4平衡型多Agent强化学习算法117
6.4.5很好响应型多Agent强化学习算法118
6.4.6分析与比较118
6.5MAS中的分布式强化学习模型及结构118
6.5.1中央强化学习结构119
6.5.2独立强化学习结构119
6.5.3群体强化学习结构120
6.5.4社会强化学习结构120
6.6基于分布式强化学习的多Agent协调模型及算法120
6.6.1协调级121
6.6.2行为级121
6.6.3强化信息的分配121
6.6.4仿真实验122
6.7小结129
参考文献130
第7章基于Markov对策的多Agent协调132
7.1引言132
7.2多Agent交互的协调与博弈分析133
7.2.1多Agent协调与博弈的性质133
7.2.2多Agent协调失败的处理134
7.3多Agent冲突博弈强化学习模型136
7.3.1多Agent冲突博弈136
7.3.2很优策略137
7.3.3基于后悔值的Q学习模型138
7.4Nash-Q学习140
7.5零和Markov对策和团队Markov对策141
7.5.1零和Markov对策141
7.5.2团队Markov对策143
7.6基于Markov对策的多Agent协调策略144
7.6.1对策框架144
7.6.2Team级对策144
7.6.3Member级对策145
7.6.4仿真实验145
7.7小结155
参考文献155
第8章Agent技术在机器人智能控制系统的应用157
8.1引言157
8.2智能机器人系统应用研究158
8.2.1概况158
8.2.2传统研究方法的缺陷160
8.2.3智能机器人系统的共性160
8.3开放式机器人智能控制系统应用研究161
8.3.1开放式控制系统的典型特征161
8.3.2基于PC的开放式控制系统的实现162
8.4多机器人系统应用研究162
8.4.1多机器人队形控制163
8.4.2机器人救援165
8.4.3多机器人追捕问题166
8.5总结与展望168
8.5.1总结168
8.5.2未来工作展望169
参考文献170
多机器人系统是当前机器人技术领域的一个研究热点,具有多学科交叉融合的显著特点。《多智能体机器人系统信息融合与协调》以多机器人系统为研究背景,结合多智能体系统的体系结构以及协调与合作技术,针对多机器人系统中的信息融合,对多机器人协调中的任务分配与规划、对抗环境下的多机器人协调等问题进行了深入研究,为提高多机器人系统的信息融合与协调的技术水平、促进相关技术的发展提供了新的思路与理论依据。