本章运用基于对策论的多Agent 协商机制讨论SFGDD 模型中的多智能体间的协商交互问题。目前多Agent 之间的协商方法主要有基于合同网协议的方法、 基于市场机制的方法、 基于对策论的方法。对策论是基于数学模型研究冲突条件下最优决策问题的理论, 针对半导体封装测试过程中的多层次、 多目标等复杂特性, 本研究利用对策论的合作对策和纳什均衡理论研究该模型内部的协商机制。......
2023-06-20
基于对策论的多Agent 协商主要体现在各参与Agent 的行为(策略)相互依存, 相互影响, 各个Agent 在协作或者冲突之后的赢得结果不仅取决于单Agent 的个体行为, 同时也依赖于其他Agent行为方案, 是各参与协商Agent 的组合函数。 多Agent 的协商过程可以看作是由某个Agent 发起的与一个或者多个Agent 之间协作的生产过程, 多Agent 的协商机制可以定义为一个六元组的形式:{Ag, Tk, S, U, Action, Time, Protocol}。
(1)协作Agent 集合(局中人):
Ag ={Ag1, Ag2, …, Agn}, Ag 是针对在模型中完成某一具体任务所需Agent 的集合。
(2)协作Agent 任务集合:Tk ={Tk1, Tk2, …, Tkn}, 在半导体封装测试生产调度与订单满足过程中, 存在多目标现象, 如完成订单, 投放晶元, 半成品投放等具体任务。
(3)协商策略集合(Strategies):S =S1, S2, …, Sn, 协商策略是指在一局对策中, 各个Agent 选择的一个实际可行的, 完整的行动方案。 在一个任务中, 所参与Agent 行动方案的集合成为一个策略集。 如果一个策略中有n 个Agent 参与协商, 则整个局势的策略集可用各局中人的策略集的笛卡儿积表示, 即
(4)协商Agent 的赢得函数U: 在一局对策中, 各个参与的Agent 都有一个结果表示该策略组合下单Agent 的得益, 常用赢得函数U(S), (S∈R)表示, 这个函数表示对任意局势, 局中人Agent 可以得到一个赢得函数, 即表示单Agent 在局势下的行动策略收益。
(5) Time: 以顺序排列的自然数表示Agent 中的各Agent 参与协商的系统时钟。
(6) Protocol: 基于对策论的协商协议。
在本章研究的调度与订单多Agent 协商过程中, 是一个寻求各自任务目标最有利的过程, 但由于利益的有限性和相互制约性, 因此决定了协商的过程是一个相互制约和竞争的过程。 在动态调度与实时订单协商的过程中, 可以理解为每次协商都是调度与订单两个Agent 之间的行为, 而对于每一个局势, 两个局中人的赢得之和不一定等于零, 映射到对策论之中, 属于二人非零和合作对策问题,本文的协商机制将在合作对策论的基础上研究多Agent 之间的协商交互问题。
有关半导体封装测试制造系统运行优化理论与技术的文章
本章运用基于对策论的多Agent 协商机制讨论SFGDD 模型中的多智能体间的协商交互问题。目前多Agent 之间的协商方法主要有基于合同网协议的方法、 基于市场机制的方法、 基于对策论的方法。对策论是基于数学模型研究冲突条件下最优决策问题的理论, 针对半导体封装测试过程中的多层次、 多目标等复杂特性, 本研究利用对策论的合作对策和纳什均衡理论研究该模型内部的协商机制。......
2023-06-20
基于对策论的多Agent 协商就是研究行为上相互影响、 利益有所冲突的单Agent 之间如何优化决策使各个Agent 利益最大化的协商过程。“阈值保证”有效地减少了协商循环次数, 并且对Agent 提供了阈值保护, 确保某些可能导致较差结果的策略不被采用, 而且协商结果是在阈值定义范围之内的。而“触发补偿”机制结合了生产调度的特点, 当Agent 低于阈值范围时, 及时进行原材料, 在制品或半成品的补偿, 保证协商顺利进行。......
2023-06-20
本节我们在了解逻辑学概念定义方式的前提下,重点提炼和讨论小学科学概念的定义方式。第二类科学概念属于成年人也不能准确理解的科学概念。一般说来,科学上的特征实体概念,由于其具有可以指向的实体,又是以呈现的特征为识别标识,很多会用到实指定义方式。列举太阳系的具体成员,理解太阳系概念,这是列举定义。......
2023-11-20
本节针对半导体企业的多工厂的特点对计划分配进行研究, 在传统合同网协议的基础上, 嵌入了车间“产能注册矩阵”的模式, 对生产计划进行了初分配, 较大程度上减少了协商和通信次数。根据封装测试多车间的性质, 本研究提出了改进的合同网协商模型, 改进后的协商模型步骤如下:初始化, t=0。图4-3改进的合同网智能体间协商模型②在生产任务分配阶段, 为了减少管理Ag......
2023-06-20
无论是哪种类型的资源受限项目调度问题,都需要将调度方案转化为有效的调度计划以便安排活动任务。调度计划是满足一系列优先级限制和资源限制的前提下制定的连续方法,主要有并行调度产生方案和串行调度产生方案两种。对于小规模和强资源限制的项目,并行调度计算结果优于串行调度,而大规模和适当资源限制的项目更适合串行调度方案。图3.5广义优先关系串行调度产生方案的目标流程初始化值及参数。......
2023-10-05
而潘绥铭在中国进行的调查也显示,超过10个性伙伴的,只占总人口的0.7%。本项研究中,主要关注的是自我控制与非正式控制对当事人的影响。美国的研究显示,直接影响着美国社会性观念与性行为的两个重要组织是宗教和家庭,害怕被制裁是组织成员遵纪守法的一个重要原因。同样的,在月经期、怀孕期,以及绝经后的性行为也是被禁止的。......
2024-01-22
[1]本文所阐释的服装流行是指“服装的文化倾向,通过具体服装款式的普及、风行一时而形成潮流。这种流行倾向一旦确定,就会在一定的范围内被较多的人所接受。”本文所阐释的文化具有广义和狭义双重含义。文化影响力产生的前提是文化的被感知和被认可。文化影响力产生的表现是文化的凝聚、鼓舞、感召、推动作用。文化影响力可通过文化关联事物的作用力得到壮大、提升。......
2023-06-22
【主要内容】1.函数微分的定义设函数y=f(x)在点x0的某个邻域内有定义.如果y在点x0处的增量Δy=f(x0+Δx)-f(x0) (其中,Δx是自变量x在点x0处的增量)可表示为Δy=AΔx+o(Δx)(其中,A与Δx无关,o(Δx)表示Δx→0时比Δx高阶的无穷小),则称y=f(x)在点x0处可微,称Δy的线性主部AΔx为y=f(x)在点x0处的微分,记为dy|x=x0(注意:函数y=f(x......
2023-10-27
相关推荐