V&V是从整体上不断考察建模与仿真的活动,剖析其构成特点和运动方式,判断其认识世界的能力,在这一点上与科学认识论与方法论是相通的。这一点便是模型V&V的科学逻辑基础。本章的目的不是介绍使模型V&V变得更为轻松的技术方法,而是介绍、分析现今与模型V&V问题相关的主要西方科学哲学流派,以期从认识论、方法论的角度来把握模型V&V的问题本质,并拓展视野。......
2023-08-15
1.V&V的概念
过去,V&V活动通常发生在M&S完成后的测试阶段,如果V&V贯穿于整个M&S的全生命周期中,我们将获益更多。总的来说,虽然V&V包含的校核(Veri-fication)与验证(Validation)均是一个做出决定的过程(Process of Determining),但它们是两个完全不同的概念,包含完全不同的活动集。
校核(Verification)的五个主要不同定义如下:
1)决定在软件开发的全生命周期的某个阶段,得到的产品是否完成了所建立的需求规范的一个过程。
2)决定模型的详细设计及其相关的数据是否精确代表了开发者的概念模型描述与详细的规范设计过程。
3)决定一个计算机软件系统的实现是否正确地表征了现实物理过程中的一个过程。
4)证实为了特定的应用,通过建模,系统从一种形态转变到另一种形态具有足够的精确性。
5)决定所列方程得到了正确的解算过程。
虽然校核的概念在不同的研究领域有不同的表述,但在本质上它们之间没有区别。从M&S的角度来讲,它关心的问题为:是否正确建立了模型(Building the model right)?即设计人员是否按照仿真系统特定应用的目标和功能需求正确地设计出系统的模型,仿真软件开发人员是否按照设计人员提供的仿真模型正确实现了模型。
验证(Validation)的四个主要不同的定义如下:
1)在软件开发周期的末段,对软件进行评估,以保证其与软件需求一致的过程。
2)从模型的特定应用目的来看,决定模型及其相关数据表征所研究的真实世界程度的过程。
3)证实在模型的特定应用中,其输出得到相关领域专家的一致认可。从特定应用的角度看,与实际系统的输出比较,有令人满意的精确度。
4)决定所列方程是否正确的过程。
在不同领域,验证的概念亦不尽相同,但它们之间没有本质区别。从M&S的角度来讲,它关心的问题为:是否建立了正确的模型(Building the right model)?更详细地说,验证关心的是模型在具体的应用中多大程度地反映了真实世界的情况。
表2.1列出了重要的V&V政策和指南,表2.2列出了在DOD和美国军队中V&V的不同定义,但需要指出的是,它们之间没有本质区别。
表2.1 重要的V&V政策和指南
表2.2 美国国防部内V&V的定义
2.A与可信性的概念
A即确认(Accreditation),指权威机构(官方)对于一个特定的M&S应用于特定问题的可接受性和有效性做出正式的认可。它反映的是M&S的发起者和用户对应用该模型解决特定问题时是否具有足够信心。简而言之,确认关心的问题是:该M&S应该被使用吗(Should it be used)?
确认的内涵指不断增进的V&V,即不断对产品进行测试和评估的动态过程。本书所说的“A”,指对V&V活动进行控制、评估等一系列相关活动的基本原则、管理机构和机制等。其内涵不仅体现在技术上,还体现在管理上。表2.3列出了在DOD和美国军队中确认的不同定义。
表2.3 美国国防部内确认的定义
可信性(Credibility)指用户对使用特定M&S解决其所关心问题的信心。可信性关心的问题是:应该信任它吗(Should it be trusted)?而权威机构(官方)对于M&S的确认,是获取M&S可信性的必要条件。
我们关于可信性的基本观点有三个:
1)实践中,由于资源(时间、财力、物力和人力)的约束,以及M&S自身不确定性(所研究问题的复杂性、随机性等)所带来的风险,M&S的可信性必须来源于正确、高效且约减风险的V&V活动,即通过一系列V&V活动的执行来获得相应的可信性。
2)可信性的需求与M&S特定应用的目的密切相关,与M&S在决策中所占的地位(权重)密切相关,与基于M&S的决策失误所导致的后果密切相关。
3)可信性的评估必须采用定性与定量相结合的方法。
总而言之,有关VV&A的概念在相关文献中非常多,如Osman Balci、Sargent等人的论文中均有论及,除DOD外,其他专业团体,如IEEE、NASA、AIAA、SCS、DOE和DND等,也对VV&A的概念在各自领域的内涵做了表述,可以参考其官方网站和相关报告。
3.V&V概念的演化
自20世纪90年代以来,散见于各类有关M&S的文献之中的VV&A概念越来越多。VV&A的概念已经在ALSP、DIS和FEDEP中得到了使用。随着VV&A相关研究工作的深入,与之相关的概念也在逐步提炼、演化,如保真度、概念模型、交互性和可信性等。
这些变化说明我们不仅要处理技术问题,还要处理日益模糊的与VV&A相关的技术和运筹分析等问题。实际上,VV&A的本质,已经逐渐从校核转向验证与确认,且一些重要的论点显示VV&A越来越专注于人们如何做出决策(Decision Mak-ing),这些都表明决不能将VV&A看作一个永不改变的概念。
M&S始于真实世界(Real World),其最终产品(Final Product)由V&V过程同真实世界有机地联系起来。V&V过程及其中间结果是验证和确认过程中所做决策最为本质的依据,因此V&V概念的演化更多体现于验证概念的演化,本节内容主要讨论验证概念的演化。
(1)M&S过程与V&V过程
自20世纪70年代以来,SCS刊物、WCS、美国军事运筹年会和IEEE计算机仿真学会刊物等均有相当多的文献论及M&S的过程。如S.Schlesinger(1979年)、R.G.Sargent(1987年和2001年)、P.L.Knepell和D.C.Arangno(1993年)和B.P.Zeigler(2000年)等人均提出了对M&S过程的理解。
简而言之,经典的M&S过程至少包括三个要素:真实世界(Real World)、概念模型(Conceptual Model)和仿真(Simulation,即过程的结果)。这样的一个过程可用图2.1表示。
图2.1 一般M&S过程与V&V
为进一步理解和把握来自于真实世界的知识,Hone和Moulding根据基本的M&S过程导出了更为复杂的VV&A元过程(Meta-process)的观点,即Y-过程(Y-process),它强调知识并行来源于应用域(Application Domain)和问题域(Problem Domain),如图2.2所示。
应用域定义了特定应用的目标集和约束。问题可以看作是真实世界的数据集,它代表了我们所要模拟的任务空间或环境,是所要研究的问题存在的上下“语境”。Y-过程暗示,如果应用域与问题域能够共同“收敛”于清晰明了的目的,那么这样的一个M&S产品将是有用的。
实际中,应用域受到应用M&S的特定目的(Intended Purpose)的影响,而问题域则源于真实世界,有时也称为参考世界(Referent World)。由问题域和应用域共同决定了概念模型,经由概念模型所得到的仿真模型则通过验证这一关键步骤来同参考世界联系。修改后的Y-过程如图2.3所示。
图2.2 Y-过程
图2.3 修改后的Y-过程
(2)模型验证的讨论
前文中多次提到“真实世界”“参考世界”等表示客观世界或真实系统的词,很多情况下,作为客观参考的真实世界在M&S活动中因费用、复杂性等原因是不可触及的。特别是在研究未来的情况下,客观真实世界更是无法谈及。
20世纪70年代,Zeigler提出的“基模型(Base Model)”“集总模型(Lumped Model)”“实验框架(Experiment Frame)”等概念,可以用来讨论模型验证的概念,进而为模型验证的量化评估提供思路。
Zeigler认为,基模型是对事物属性假定的、抽象的表征。基模型表达了事物(系统)的所有方面,其行为(Behavior)模式能在“任何”情况下得到验证;基模型在现实中永远不可能构建,它的存在与否是一个哲学问题。集总模型则是在给出的实验框架内对系统的准确描述,其中包括了系统结构的属性,反映了对系统行为的精度要求。当人们在真实世界里研究一个系统时,实验框架定义了系统或模型运行的所有外部条件,反映了实验者的客观目标。实验框架一般由两部分组成:输入变量集和输出变量集。通过考察输入和输出集内在的属性,人们可以判断系统或模型是否与实验框架相合,这就是实验者的目标。Zeigler的M&S过程同前一节所描述的过程之间的联系可用图2.4来表示。
图2.4 Zeigler的M&S过程与一般M&S过程的联系
图2.4分别把基模型、集总模型与客观世界、概念模型等同起来,并把实验框架引入M&S的全过程空间。当人们使用模型研究实际系统时,必须考察它与实验框架上下“语境”的相容性。在整个M&S过程中,实验框架也要不断开发。
由实验框架的含义,Zeigler精确定义了三类模型的验证。
首先假定基模型是唯一存在的,它表征了真实系统的所有行为模式,在任何情况下,基模型都能得到验证,即分别来自真实系统和基模型的数据是相等的:
DRealSystem≡DBaseModel
基模型区别于集总模型是因为后者受到特定实验框架上下“语境”的制约。在该实验框架内,集总模型在某种精度程度上表征了真实系统,因此,对给定的实验框架E,模型得到验证的条件是:
DLumpedModel||E≡DRealSystem||E(在某种程度上)
由上式可知,模型验证不是绝对的,真实系统和模型的比较必须受制于某种实验框架和某种准则。三类验证可以分别表述如下:
1)复现验证(Replicative Validation):考察集总模型复现真实系统的输入、输出集的能力。根据基模型的定义,集总模型在实验框架内能得到复现验证的条件是:
DLumpedModel||E≡DBaseModel||E
2)预测验证(Predictive Validation):考察的是辨识、设定模型状态的能力,以期对真实系统在某些输入下的状态和行为进行预测。在实验框架内,集总模型得到了复现验证,且FLumpedModel||E⊆FBaseModel||E,则该模型得到预测验证。其中,F是系统在实验框架E下的输入、输出函数。
3)结构验证(Structural Validation):考察集总模型与真实系统的结构关系,即摹式(morphism)。如果集总模型得到预测验证,且在实验框架内,从基模型到集总模型的摹式相等,即,则该模型得到结构验证。
结合前文所描述的一般M&S过程及其V&V与Zeigler关于模型验证的类别,可认为模型的校核、验证有其规定的阶段性和层次性,具体划分如图2.5所示。
图2.5 V&V的阶段与层次
不难看出,复现验证和预测验证属于模型结果验证的层次。
根据三类模型验证所考察的内容,在进行模型验证时通常要重点关注的三类错误为:
1)不适当的实验框架的定义(Improperly Defined Experimental Frame)。
2)不适当的模型结构特征刻画(Improperly Characterized Model Structure)。
3)不精确的模型参数估计(Inaccurate Estimates of Model Parameters)。
(3)评论
研究VV&A概念的演化,特别是模型验证概念的演化,包括概念的内涵和外延,是深入进行VV&A研究的前提和基础。从VV&A概念的演化过程研究中,我们可以洞察VV&A的本质属性,为更深入的研究提供理论指导并开拓思路。
V&V是从整体上不断考察建模与仿真的活动,剖析其构成特点和运动方式,判断其认识世界的能力,在这一点上与科学认识论与方法论是相通的。这一点便是模型V&V的科学逻辑基础。本章的目的不是介绍使模型V&V变得更为轻松的技术方法,而是介绍、分析现今与模型V&V问题相关的主要西方科学哲学流派,以期从认识论、方法论的角度来把握模型V&V的问题本质,并拓展视野。......
2023-08-15
图2.19 模型与仿真的映射关系建模V&V与仿真V&V的区别还表现在考察的对象(内容)上,所实施的技术方法也存在较大差异。建模及其V&V必须以领域专家为主体,仿真及其V&V则是以仿真专家为主体。此外,在思维特点上,建模及其V&V活动具有明显的艺术性、智慧性和创新性,而仿真及其V&V活动则具有相对的标准性或带有一定的技巧性。......
2023-08-15
表2.1 重要的V&V政策和指南表2.2 美国国防部内V&V的定义2.A与可信性的概念A即确认,指权威机构(官方)对于一个特定的M&S应用于特定问题的可接受性和有效性做出正式的认可。VV&A的概念已经在ALSP、DIS和FEDEP中得到了使用。图2.1 一般M&S过程与V&V为进一步理解和把握来自于真实世界的知识,Hone和Moulding根据基本的M&S过程导出了更为复杂的VV&A元过程的观点,即Y-过程(Y......
2023-08-15
同时,模型的解释功能也具有唯物性,因为模型解释的本质是基于客观基础的。科学理论的评价和检验是很复杂的。[1]本节主要内容摘自:夏甄陶.中国认识论思想史稿(下卷)[M].北京:中国人民大学出版社,1996:487-488。[3]认识、理论的“诚妄”,不是“口舌之争”的问题,而是一个“事实”问题。[5]国家教委社会科学研究与艺术教育司.自然辩证法概论[M].北京:高教出版社,2000。......
2023-08-15
V&V活动的风险不是指V&V活动自身的危险性或对第三方造成的某种伤害和损失。从这个意义上讲,这正是V&V活动的风险含义之所在。不同的V&V策略决定了不同V&V活动的深度,由于全生命周期某个阶段V&V活动部分执行或完全未执行,最终产生了风险。某个风险源Si是某项特定的V&V活动Ai。如果该项活动的APL=1,则认为不完全执行该项活动所引起的风险可能完全被约简,因此该风险源也被称为零风险源。指假设V&V活动Ai未完全执行而可能发生的所有不利事件。......
2023-08-15
V&V策略之广度分量的制定通常分为两个步骤:1)对活动进行初步定性过滤;2)对活动进行定性与定量相结合的排序和过滤,以确定最终的活动。再次,对每项V&V活动的所有风险事件的风险层级进行聚合,得到最终的V&V活动风险层级。如前所述,V&V活动广度的制定,即V&V活动的剪裁,通常是在诸多专家,即SMEs,共同参与下完成的。......
2023-08-15
从中可得到如下结论:1)目标期望风险值与极限期望风险值的比率是60.4519/489.5345≈0.1235,优化的效果不错。得到的结果见附录D。从中可得到如下结论:1)目标费用值与全序列V&V活动费用的比率是41.5594/78.5526≈0.5291。3)遗传算法的设置:初始种群数量30,交叉概率0.3,变异概率0.2,进化代数1000。......
2023-08-15
西方哲学可谓学派林立,理论观点丰富多样,交替更迭。表3.1给出了西方哲学不同学派的总结简表。下文将逐一简单论述模型验证问题中的科学哲学问题。表3.1 科学哲学的不同学派简表①笛卡尔,法国著名哲学家、数学家。③马赫,奥地利著名物理学家、哲学家。④波普尔,奥地利当代著名哲学家,创立了批判理性主义哲学。......
2023-08-15
相关推荐