国际观察|解读《自然》刊登文章:《模型发展宣言》

引言

受新冠肺炎疫情影响,模型在预测疫情走势,支撑政策制定等方面发挥举足轻重作用,模型开发的社会责任进一步凸显。为此,《自然》隆重推出基于数学建模的宣言,特地刊登了一篇名为《确保模型为社会服务的五个原则宣言》文章,向全球发布基于模型发展和应用的最佳实践方法。深圳市城市交通规划设计研究中心(简称“深圳交通中心”)特对文章进行了解读与转载,文章对引导交通模型师、数据分析师乃至交通规划师成为合格、负责的社会服务型人才具有一定参考价值。

《自然》除了刊登传统的研究型文章以外,还提供了包括“书籍与艺术”、“新闻与观点”、“技术特色”、“评论”等板块内容,多以“约稿”的形式刊登,本篇文章则发表在《自然》“评论”板块。该板块文章一般是关于议程设置,权威且具有挑战性的专家文章,呼吁国际社会就有关科学研究及其政治、伦理和社会影响的热点问题采取行动。目的是解决全球性的重要问题,制定路线图。

 

 

 

一、为了保证模型客观透明,有必要建立一套社会规范

 

COVID-19流行病充分说明了非常态下,当紧迫性、风险、价值和不确定性问题相互冲突时,科学的运作将如何发生变化。在新冠状病毒大流行之前,统计学家正在辩论如何预防诸如黑客攻击之类的不当行为,尤其是这些行为已经严重影响到政策制定。如今,计算机建模备受瞩目,政客们宣称基于“科学”提出政策,利用一些数学模型预测感染、住院及死亡人数等。然而,残酷的现实是人类对COVID-19的感染传播,季节性以及免疫的了解甚少,更不用说理解在复杂社会中各种干预措施的作用影响了。

为了确保模型不会成为政治原因的附属品,防止将预测结果作为支撑预定议程的政治工具,模型师、决策者和公民们都需要建立新的社会规范。《自然》于2020年6月25日隆重推出基于数学建模的宣言,向全球推荐关于模型发展和应用的五个基本原则,确保模型质量为历史和社会负责:不允许建模者提供超出其模型确定性以外的结论,而且绝不允许政客们将其过失归咎到他们选择的模型上。

 

二、模型发展应遵循的五个原则

 

数学模型如果使用得当,可以很好地服务于社会。天气预报中使用的计算机模型就是最好的一个例证,它基于对现实中数百万个预测进行测试而百炼成钢,贡献着巨大的社会经济发展效益。尽管如此,天气预报结果还是存在很多不确定性,我们大家都清楚并能理性对待。

《自然》宣言是为数学建模推出的最佳实践的宣言,提供了确保模型应用于政策的最佳方法。五个简单原则的发表将帮助社会从建模中获取其真正所需的质量和价值。

 

1.Mind the assumptions:重视模型前提假设

 

模型的输入通常基于其他实践,而忽略了前提假设。这些前提假设在一些情景下适用,而在其他情景不适用,比如适用于民用核风险的模型可能无法充分评估地震风险。基于不合理假设前提的输入会导致模型出现结果错误,而且通常模型预测中的不确定性远大于最初确定的不确定性。解决这些问题的一种方法是执行全局不确定性和敏感性分析。模型师在建模时必须对这些全局不确定性和敏感性进行分析,并且充分描述模型结果并使其可查,因为所有不确定因素(变量,数学关系和边界条件等)都会影响模型的预测结果。

总之,防止模型隐藏其假设(包括政治倾向)的最好方法是制定一套社会规范。

 

2.Mind the hubris:避免盲目追求模型复杂度

 

大多数模型师都知道,需要在模型的有效性和它试图捕捉的广度之间要进行权衡。但是,一些研究者被“模型越复杂越好”的想法所吸引,复杂性本身常常被视为目的。模型参数的增加导致不确定性的增加(不确定性级联效应),误差的累积甚至会发展到模型结果完全无法使用的程度。如果灾难性的预测是错误的,模型师和应用者是应追究其责任的。

模型并非越复杂越好,过于复杂的模型则毫无意义。在艾滋病毒感染的情况下,相关研究表明,基于性行为频率的一种更简单的针对滥交的模型比更复杂的模型更为可靠。一个极端复杂的案例是美国能源部使用的一种模型,用于评估在尤卡山处置库处置放射性废物的风险。它被称为总体系统性能评估,包括286个子模型以及数千个参数,监管机构要求它预测“一百万年”的安全性。然而,一个关键变量(水渗透到地下储藏层所需的时间)的不确定性达到了三个数量级,它使得这个极度复杂的放射模型变得毫无意义。

因此,模型的发展不可一味追求其复杂度,应寻求复杂度与有效性间的有误差的最佳平衡。

 

3.Mind the framing:明确模型的系统框架

 

模型的结果将至少部分反映开发人员的兴趣,学科方向和偏见。没有任何一种模型可以满足所有目的。模型师都知道选择不同的模型工具会影响预测结果,所以每个模型不可能是中立的。因此,需要一套公开透明的共同承诺,模型师不可隐瞒构建每个模型的构建初衷。承诺应涵盖如何搭建模型,公开模型参数的内在逻辑,评估模型的不确定性以及输出结果。目前国际社会已针对多个学科制定了规范方针,要求流程要考虑利益相关者,容纳多种观点并促进透明度,以及敏感性和不确定性的分析。每当有新的利益相关者将模型用于新的领域时,都必须重新进行校验和验证。

当模型不再是黑匣子时,使用它的人必须做出反应以评估各个参数及其之间的关系。这样就可以传达不同的框架和假设如何映射到不同的推论,而不仅仅是从过于复杂的模型中获得一个简单的数字。

 

4.Mind the consequences:正确理解模型结果

 

过于看重量化可能会产生适得其反的结果,对数字的极度关注甚至会把一门学科从基本正确推向完全错误。不加选择地使用统计测试方法可以颠覆合理的判断。例如,通过帮助高风险的金融产品看起来安全,模型在2007-2008年度促成了全球经济脱轨。一旦片面关注于模型结果,其他可能的解释和评估便会从视野中消失。当其他选择被边缘化时,可能会引起模型师的自满与政治化。就像COVID-19的建模预测,重症监护病床的可用性,经济、就业和公民自由等等问题都在发挥作用,尽管这些无法简单的量化并被输入到模型中。

虚假的精准度会诱发错误的判断,尽管模型师的思考实验很重要,但现实中必须正确理解模型结果。模型的不透明会损害结果的公信力,而量化社会学领域的一个关键即确保社会对模型数字的信任。

 

5.Mind the unknowns:承认“无知”是一种美德

 

在西方哲学史上的大多数时间里,无知的自我意识被认为是一种美德,库萨的哲学家尼古拉斯(Nicholas)称其为博学的“无知”。即使在今天,讨论不确定的与交流已知的同样重要。

不承认“无知”会人为地限制政策选择,并会导致意外结果的发生。例如当主管经济学家承认他们的模型无法预测最后一次经济衰退时,责任将降临到政府官员头上。忽略模型不确定性可能会给政客提供放弃问责的机会。针对无法实现的问题,模型师应该有勇气回答“您的问题没有数字答案”,就像美国政府的流行病学家安东尼·福西在受到政客调查时所做的那样。承认“无知”是一种美德,也是人类对自然的敬畏。

 

 

三、模型挖掘问题比回答问题更重要

 

数学模型是人类探索未知而广泛应用的一种好方法,但它们同时也是导致错误结论的一种危险方式。因此,模型的假设前提和局限性必须公开,模型的开发应用必须诚实地评估,尤其是模型的不确定性。透明的模型构建过程和职业道德与知识能力同样重要。好的模型建设不能仅由建模人员来完成,因为这是一项社会活动,需要其它人员的参与和反馈。我们呼吁的不是结束量化、非政治性的模型发展,而是要求模型全面而坦率的公开。严格遵循上述五原则有助于将数学模型作为有价值的利用工具,帮助我们实现模型发展的总体目标。忽略这些原则而不能充分认识其优势和局限性,模型预测就成为了特洛伊木马,也彻底失去了其应用效益和社会价值。

 

 

参考文献

[1] Saltelli A , Bammer G , Bruno I , et al. Five ways to ensure that models serve society: a manifesto[J]. Nature, 2020, 582(7813):482-484.

 

撰写:郑健  
审定:向燕陵  

返回列表