专业知识服务提供商
杂志订阅
投稿咨询

机器人评标:现状、困境及建议

2024年01月02日 作者:刘闻博 打印 收藏

在多数招投标从业者的印象里,项目评标往往是由评标委员会牵头完成的,评标专家的打分在这一过程中起到了决定性的作用。如果有一天,评标不再依赖人力,评标专家群体完全被人工智能取代会怎样?

近年来,我国许多地方已经开始陆续出现了“评标机器人”。这些评标机器人距离真正的人工智能还有多远?“机器人评标”的基本原理是怎样的?“机器人评标”在未来会有怎样的发展趋势?笔者基于对各地公共资源交易中心的实地调研以及对人工智能技术应用的了解,试图对以上问题进行分析。

我国机器人评标现状

一般情况下,只有具备自主学习能力,可被机器学习算法驱动,可独立完成预测、判别、分类、打分等任务,拥有类人智慧的机器人才能被称为智能机器人。从这个标准来看,我国目前的评标机器人大致可以分为三类:无法打分的评标机器人、只能打客观分的评标机器人以及可以打主观分的评标机器人。

第一类评标机器人属于传统机器人。这类评标机器人起到的作用主要是在评标现场部分代替人类工作,在人类的操作和辅助下,对评标专家进行监督。这类评标机器人在评标过程中无法打分,也就无法独立完成整个评标过程。从本质上来说,这类评标机器人和目前居家的扫地机器人,或是饭店中的传菜机器人没有什么本质区别,基本上不具有学习能力和创造能力,只是在外观上和人类有相似性而已。例如,湖南省公共资源交易中心使用评标机器人代替人力值守评标现场,机器人主要起到视频监控和录音作用,从而防止评标专家在评标区出现串通行为。安阳市公共资源交易中心以及宁波市海曙区公共资源交易中心所使用的机器人,主要起到在评标区迎宾、派遣、送物、为评标专家提供服务等作用,同时避免专家在评标区与他人发生接触。

第二类评标机器人已经参与到了评标打分过程,但机器的属性仍然大于类人的属性。虽然这类评标机器人在评标时已经可以打出客观分,但因其智能程度及学习能力不足,所以仍然无法给出主观评分,只能根据设定好的量化指标进行自动评标。这类机器人可以完成判别、分类、打分任务,但由于没有经过严谨的训练和测试过程,没有人工智能算法的介入,仍然无法进一步学习、进化。以海南省公共资源交易中心的评标机器人为例。在使用最低价中标法和简易评估法的招投标项目中,海南省公共资源交易中心使用的“机器管招投标”系统,全流程由评标机器人自动评标,而评标委员会仅负责对评标机器人的打分结果进行复核,且非特殊情况一般不得修改评标机器人的打分结果。

第三类评标机器人建立在机器学习算法之上,已经初步具有了智能和学习能力。这类机器人不但可以参与评标的客观分打分,而且可以对评标专家打出的主观分进行监督和修正,在一定程度上具有了参与主观评分过程的能力。通过后台人工智能系统的训练与测试,第三类评标机器人可以打出主观分供评标专家参考,也能主动发现评标专家在打主观分过程中的异常行为。例如,襄阳市公共资源交易中心和枣阳市公共资源交易中心使用了一种能够辅助评标的智能机器人,这种机器人可以自动识别投标文件中的评分点并进行打分,并将打分结果反馈给评标专家进行参考。合肥市公共资源交易中心使用了类似的人工智能技术,通过运用过往的招采大数据训练人工智能模型,一旦评标专家打出的主观分出现异常,人工智能系统就会介入,对评标专家进行警告。从技术层面来看,只有第三类评标机器人属于人工智能在招投标过程中的应用,前两类评标机器人只属于一种机器或是一种评标模型。

随着人工智能技术的迅猛发展,美国和英国已经开始大力发展第三类评标机器人技术。美国国防部和国土安全部在采购中已经引入了人工智能技术,英国也已经发布了《人工智能采购指南》,由此可见,将人工智能技术引入招标采购已势不可当,如果机器人评标技术发展得当,未来或许可引领招采行业巨大变革。

机器人评标面临的困境

不可问责性

无论是人还是机器,都存在出错的可能,评标机器人也会犯错。当人类犯错误的时候,可以通过预先设定好的制度进行问责。那么,当机器出错的时候,如何对其问责?

编写机器评标系统的算法工程师应该负责吗?决定使用评标机器人的管理者应该负责吗?评标机器人的日常维护者应该负责吗?编写机器评标系统的算法工程师就算技术水平再高超,也无法设计出打分准确率100%的评标机器人。同样,将评标机器人的日常维护做到极致,也不能保证评标机器人的正确率不波动。因此,让以上任何一个群体为评标机器人出错负责似乎都不合理,而人工智能算法作为一个没有生命的客体,同样难以被问责。不可问责性是机器人评标面临的最大困境之一。在实践中,相关管理者可能会把一切错误的责任都归于人工智能系统。

数据安全

数据安全是评标机器人所面临的另一个重要问题。在训练评标机器人的过程中,算法工程师需要使用过往的招投标数据,这些数据同时也存在其他用途,具有极高的价值。例如,数据分析师可以通过这些数据来预测哪种类型的公司更容易中标,或者分析如何串通投标更难被监管部门发现等。一旦这些数据被不法分子利用,就会带来不可挽回的重大损失。然而,现阶段公共资源交易中心不具备自主训练评标机器人的条件,公共资源交易中心只能把评标机器人的训练、测试、代码编写、数据运算等一系列任务外包给第三方。这意味着公共资源交易中心需要额外的监管力量来保证这些数据不被转移和泄露,或者不被用于其他用途的运算,将产生极高的隐性成本。这似乎使公共资源交易中心陷入了监管循环的陷阱中:由于缺乏算法专业人才而不得不将评标机器人训练外包给第三方,而对第三方进行监管同样需要算法专业人才。

基于深度学习算法的评标机器人训练需要耗费大量的算力。如果有不法分子在这一过程中出于个人利益的需要,提前在算法中夹带“私货”,便可以使评标机器人对某一公司的投标文件自动打出高分。由于黑箱算法的不可解释性,侦测这种不法行为需要付出极高的成本,甚至可能超过训练一个新的评标机器人所需的成本。这就意味着,编写算法成为一种特殊权力,谁掌握了算法,谁就掌握了权力,出现“算法官僚”的现象。“算法官僚”可能会使评标过程出现技术垄断,即谁掌握了最新的技术,谁就能够操纵招投标而不被发现,这些因素都会导致人们不再信任评标机器人。如果各地争先发展人工智能评标技术时,无法拟定算法规制细则,进行算法公开、评估和审计,促进算法的信息透明;无法重视“阳光下的算法”,保证算法训练、建模、测试、决策过程中的全透明;无法有效利用去中心化联盟的区块链技术等,就无法缓解评标机器人训练过程中的数据安全问题。

建议

尽管目前机器人评标还面临着诸多困难,但考虑到评标机器人可以降低招投标成本,减轻行政负担,促进招采公平,减少腐败机会等,笔者认为,在人工智能技术迅猛发展的当下,机器人评标必然大势所趋。针对机器人评标面临的困境,笔者提出以下三个方面的建议。

一是要不断提升评标机器人的智能和学习能力。在我国目前的招采环境和实操场景中,各地公共资源交易中心所使用的主要还是第一类和第二类评标机器人,第三类评标机器人极少。在实践中,评标专家所打出的客观分往往区别不大,而决定项目标的去向的主要是专家打出的主观分。如果评标机器人不具有智力、没有打出主观分的能力,那么将失去使用评标机器人的意义。只有不断提升评标机器人的智能和学习能力,使其拥有与类人的智力与学习能力,同时以大模型为知识储备支撑,才能真正实现机器人评标,从而有效降低招投标成本,降低公共资源交易中的行政负担。

二是要使评标机器人的打分接近日常的评标场景。在涉及工程造价之类的复杂标的时,评标专家需要对不同的投标方案进行评估,而不能将价格作为中标的唯一因素,这同时也需要业主单位在组织评标委员会时,吸纳不同背景的专家。在未来,可以考虑使用不同类型的大模型来训练不同类型的评标机器人。例如,可以使用法学知识来训练一个评标机器人,使这个机器人具备法学专业知识;使用建筑学知识来训练另一个评标机器人,使这个机器人在打分时主要从建筑学的角度进行思考。这种使用不同行业知识来训练不同类型评标机器人的操作在理论上是完全可行的,训练出来的评标机器人可以更好应用于招投标活动。

三是不断完善法律体系,提升监管能力。使用既往招投标数据来训练评标机器人,会不可避免地遭遇数据安全风险。目前已经存在使用人工智能技术造成潜在数据泄露、隐私侵犯等风险的情形。在招投标过程中运用评标机器人,必须保持审慎的态度并坚守法律底线,以达到技术服务大众的目的。相关部门应制定严格的数据隐私政策,加强数据匿名化技术的应用以及进行数据审查和监管合规。此外,公共资源交易中心需要重视人工智能技术人才的培养,提升算法监管能力,将安全的底线牢牢握在自己手里。

基金项目:本文系国家自然科学基金面上项目“统一平台运行下公共资源交易腐败治理机制:模型检验及实现路径”(项目编号:72274199)研究成果。

(作者单位:中国人民大学公共管理学院)

责编:昝妍
京ICP备16068661号-3 ©CopyRight 2018-2024 《中国招标》杂志社有限公司 版权所有