首页 理论教育基于对策论的多Agent协商六元组概念定义

基于对策论的多Agent协商六元组概念定义

【摘要】:多Agent 的协商过程可以看作是由某个Agent 发起的与一个或者多个Agent 之间协作的生产过程, 多Agent 的协商机制可以定义为一个六元组的形式:{Ag, Tk, S, U, Action, Time, Protocol}。协作Agent 任务集合:Tk ={Tk1, Tk2, …, Tkn}, 在半导体封装测试生产调度与订单满足过程中, 存在多目标现象, 如完成订单, 投放晶元, 半成品投放等具体任务。 Protocol: 基于对策论的协商协议。

基于对策论的多Agent 协商主要体现在各参与Agent 的行为(策略)相互依存, 相互影响, 各个Agent 在协作或者冲突之后的赢得结果不仅取决于单Agent 的个体行为, 同时也依赖于其他Agent行为方案, 是各参与协商Agent 的组合函数。 多Agent 的协商过程可以看作是由某个Agent 发起的与一个或者多个Agent 之间协作的生产过程, 多Agent 的协商机制可以定义为一个六元组的形式:{Ag, Tk, S, U, Action, Time, Protocol}。

(1)协作Agent 集合(局中人):

Ag ={Ag1, Ag2, …, Agn}, Ag 是针对在模型中完成某一具体任务所需Agent 的集合。

(2)协作Agent 任务集合:Tk ={Tk1, Tk2, …, Tkn}, 在半导体封装测试生产调度与订单满足过程中, 存在多目标现象, 如完成订单, 投放晶元, 半成品投放等具体任务。

(3)协商策略集合(Strategies):S =S1, S2, …, Sn, 协商策略是指在一局对策中, 各个Agent 选择的一个实际可行的, 完整的行动方案。 在一个任务中, 所参与Agent 行动方案的集合成为一个策略集。 如果一个策略中有n 个Agent 参与协商, 则整个局势的策略集可用各局中人的策略集的笛卡儿积表示, 即

(4)协商Agent 的赢得函数U: 在一局对策中, 各个参与的Agent 都有一个结果表示该策略组合下单Agent 的得益, 常用赢得函数U(S), (S∈R)表示, 这个函数表示对任意局势, 局中人Agent 可以得到一个赢得函数, 即表示单Agent 在局势下的行动策略收益。

(5) Time: 以顺序排列的自然数表示Agent 中的各Agent 参与协商的系统时钟。

(6) Protocol: 基于对策论的协商协议。

在本章研究的调度与订单多Agent 协商过程中, 是一个寻求各自任务目标最有利的过程, 但由于利益的有限性和相互制约性, 因此决定了协商的过程是一个相互制约和竞争的过程。 在动态调度与实时订单协商的过程中, 可以理解为每次协商都是调度与订单两个Agent 之间的行为, 而对于每一个局势, 两个局中人的赢得之和不一定等于零, 映射到对策论之中, 属于二人非零和合作对策问题,本文的协商机制将在合作对策论的基础上研究多Agent 之间的协商交互问题。