首页 理论教育基于对策论的多Agent协商机制优化

基于对策论的多Agent协商机制优化

【摘要】:本章运用基于对策论的多Agent 协商机制讨论SFGDD 模型中的多智能体间的协商交互问题。目前多Agent 之间的协商方法主要有基于合同网协议的方法、 基于市场机制的方法、 基于对策论的方法。对策论是基于数学模型研究冲突条件下最优决策问题的理论, 针对半导体封装测试过程中的多层次、 多目标等复杂特性, 本研究利用对策论的合作对策和纳什均衡理论研究该模型内部的协商机制。

动态调度与实时订单协同的过程中, 多智能体间信息交互复杂, 需要建立一定的协商机制保证协作的成功完成。 本章运用基于对策论的多Agent 协商机制讨论SFGDD 模型中的多智能体间的协商交互问题。 目前多Agent 之间的协商方法主要有基于合同网协议的方法、 基于市场机制的方法、 基于对策论的方法。 对策论是基于数学模型研究冲突条件下最优决策问题的理论, 针对半导体封装测试过程中的多层次、 多目标等复杂特性, 本研究利用对策论的合作对策和纳什均衡理论研究该模型内部的协商机制。 对策论也称为“博弈论”, 是研究具有竞争或对抗性质的理论和方法, 冯·诺依曼和摩根斯特恩的经典著作Theory of Games and Economic Behavior奠定了对策论的基础, 之后的纳什、 泽尔腾和海萨尼等人对对策论进行了深入的拓展, 并作出了突出的贡献。 由于对策论处理问题的方法具有鲜明的特色, 其思想和方法广泛应用于经济、 生物、 计算机、 管理科学电子等多领域。 近些年来, 随着分布式人工智能多智能体(Multi-Agent)理论的深入开展, 对策论已经成功地应用到多Agent 系统的协商之中, 用来研究Agent 之间是如何相互影响, 以及Agent 在协作中如何选择自己的行为使自己的利益最大化。Rosenschein 等人应用对策论研究多Agent 协作中不一致目标下的交互问题, 建立了理性Agent 的交互模型。 Kazerooni 和Khorasani 应用对策论的多人合作对策理论建立了多智能体成本方程, 并运用纳什均衡理论寻找Pareto 最优解达到最小化个体Agent 成本最低的目的。 张烈平等人分析了基于博弈论的多Agent 协作模型, 并改进了其中的收益函数, 提出了具体的Agent 协商策略和算法流程, 并通过典型的追捕-逃跑问题对给出的Agent 协作机制进行了仿真验证并取得了良好的协作机制。 在以上基于对策论的多Agent 协商研究中, 往往是单纯地研究协商策略, 多Agent 之间只是简单的交换offer 的过程, 协商模型的有效性和实用性有待提高。 在纳什平衡解寻优问题上, 以往研究主要通过理性Agent 之间的协商达到纳什平衡的策略组合, 可是纳什平衡解并不是唯一的, 可能不存在或者存在多个。 如何针对实际应用问题, 建立有效的协商模型, 寻找纳什满意解, 成为近些年来研究的趋势。 本节的研究重点主要在两个方面:

(1)针对半导体封装测试生产过程中调度与订单多Agent 协商问题, 提出Agent 阈值信息录入和补偿触发机制, 嵌入到基于对策论的协商模型中, 通过阈值信息的录入, 较大程度减少了协商通信的次数, 有效地保证了订单Agent 和调度Agent 协商的有效性和快速性。 而补偿触发机制的建立, 保证了调度过程中原材料和在制品补充的实时性, 为整个协商及时有效地完成提供了前提保障。

(2)根据纳什平衡理论, 结合半导体封装测试生产特点, 分析协商稳定性问题。