专业知识服务提供商
杂志订阅
投稿咨询

基于数据挖掘技术研究评审专家名单泄露风险

2024年01月02日 作者:汤骏 打印 收藏

政府采购活动中,评审专家名单的保密尤为重要。《政府采购评审专家管理办法》(财库〔2016〕198号,以下简称198号文)规定,评审专家名单在评审结果公告前应当保密。评审活动完成后,采购人或者采购代理机构应当随中标、成交结果一并公告评审专家名单,并对自行选定的评审专家做出标注。从制度设计的初衷来看,评审前专家名单保密是为了防止专家信息被提前泄露而导致评审工作受干扰,评审后专家名单的公开是为了让专家的评审行为置于社会大众的监督之下,从而确保评审工作公平、公正。为了防止信息提前泄露,198号文还进一步细化规定了专家抽取的提前时限,即原则上不得早于评审活动开始前2个工作日。尽管制度设计比较严密,但在实际工作中,仍然存在大量因认识不足、做法疏漏和监督缺失导致的专家信息泄露风险,如利用数据挖掘技术提前“圈定”专家范围,甚至精准预测专家名单等。

专家名单提前泄露的主要原因

总量不足、专业分布不均

评审专家总量不足是专家名单易被提前掌握的主要原因之一。以H省C市为例,该市目前为止共有专家603人,其中,市本级专家429人,县区专家仅174人。从专业分布来看,货物类专家265人,工程类专家270人,服务类专家68人。C市年采购总量超过30亿元,项目总数接近1500个,与政府采购的规模和项目数量相比,专家人数在总量上“捉襟见肘”。个别货物类专家成为“评霸”,一些服务类项目又找不到相应专家。C市政府采购评审专家同时存在总量不足、专业结构不合理和区域性分布不均等三重叠加矛盾。中部某省也普遍存在专家数量不足、专业“冷热不均”的现象,其中法律、商务专家偏少等情况。南部某省2021年度聘任的评审专家总数仅768人。总量不足、专业分布不均极易导致专家被“围猎”,专家间“熟面孔”“小圈子”现象屡见不鲜。

抽取方式不科学、组织工作不严谨

评审专家抽取方式不科学也是导致专家名单泄露的原因之一,尤其是部分地方在抽取稀缺、冷门专业的专家时,因循守旧、死板教条,坚持要求评审专家所在专业与项目属性精准匹配,这种有限的评审专家数量与严格的使用需求之间的矛盾必然导致专家限定在非常小的范围内。还有部分地方在专家抽取的组织工作方面,抽取系统设置的抽签规则不合理,没有对专家抽取的频度和间隔作出限制,导致一些专家“高频抽中”,成为“常委评审专家”。虽然198号文明确规定可以根据评审专家履职情况等因素设置阶梯抽取概率,但是地方实践中能够做到科学设置抽取概率的寥寥无几。

动态更新不及时、考核管理不严格

能够及时补充、调整、完善评审专家库,建立科学、合理的选聘和退出机制,是防范评审专家成为“常委评审专家”的重要手段。然而,在实践中,部分地方长期不更新评审专家库,对专家的日常考核管理也流于形式。从公开数据来看,大部分省市的专家评审专家库调整周期在一年以上,有的调整周期长达三年,甚至还有超过五年不更新的情形。动态更新不及时增加专家信息被泄露的可能性。

防范意识差、应对措施少

近年来,以数据挖掘、网络爬虫等大数据方法为基础的新兴技术迅速涌现,少数不法分子利用这些技术肆意攫取、售卖评审专家信息,严重干扰了正常的政府采购活动秩序。部分政府采购管理部门在思想上没有引起足够重视,在政策的制定、研究方面也未能及时跟进,短期内缺乏有效的防范手段,很难有效遏制这种非法现象的蔓延。

数据挖掘提前获知专家信息的途径

数据挖掘的基本原理和适用场景

数据挖掘是从大量的、不完全的、随机的数据中,提取隐含在其中的、事先无法预知的、但是潜在有用的信息和知识的过程。数据挖掘技术可以用来支持商务智能应用,如顾客分析、定向营销、工作流管理、欺诈检测以及自动化销售等。例如,银行可以通过数据挖掘技术对客户的信用评级进行分析,从而更好地控制风险;商家可以通过数据挖掘技术对客户的购买历史进行分析,从而预测客户的未来购买行为,进而安排相应的促销活动。

数据挖掘的常用算法和应用范围

数据挖掘的算法很多,有异常检测、分类分析、选择建模、神经网络、关联学习等。其中,利用聚类分析、规则归纳和关联学习方法可以较为便捷地预测分析评审专家名单信息。

通过数据挖掘方法提前获取评审专家名单信息基本包括以下三个步骤。一是获取整个专家库的名单;二是根据单个项目的属性拟合专家可能所在的专业范围进而生成专家与专业分类的匹配关系;三是预测待评审项目可能抽取专家的具体名单。

1.聚类分析—获取评审专家库名单

聚类分析是把一组数据按照相似性和差异性分为几个类别,其目的是使属于同一类别的数据间的相似性尽可能大,不同类别数据间的相似性尽可能小。

根据政府采购法律法规规定,评审活动完成后必须公开评审专家名单,这就为专业人员通过聚类分析获取评审专家库名单大开“方便之门”。除非出现个别专家从未被抽取和公开过的特殊情形,否则,只要有足够多的数据积累,很快就能将单个项目公开的评审专家,通过“拼接去重”的方式生成整个专家库名单。笔者曾做过测试,大约只需要“拼接缝合”23次单个项目的公示信息,某市2018年46人的政府采购评审专家库即可全部清晰呈现。

当前,部分地方在完成政府采购评审专家库的征集、培训和考核以后公布所有专家的姓名,这样的做法更是不需要通过任何技术手段就可以直接获取完整的专家库名单。

2.规则归纳—生成专家及对应专业信息

规则归纳是机器学习的一个分支,是从观察集中将形式规则提取出来。提取的规则可能代表了全面的科学数据模型,或者只是代表了数据的本地模式。

使用规则归纳算法的目的主要是为了拟合抽取到的专家与评审项目属性之间存在哪些“一一对应”的关系,通过这种规则的拟合、归纳过程,得到专家可能所在专业的分布及范围,最终生成专家及其所在专业的具体信息。如果引入频度分析方法,还可以知晓专家在一定区域内“抽取中签”的概率。

根据长三角地区S市公共资源交易平台2020年8月—2023年3月公开的政府采购物业管理项目评审专家公示信息(见表1),可以得出以下结论。

表1 S市公共资源交易平台物业管理项目评审专家公示信息统计表

表1 S市公共资源交易平台物业管理项目评审专家公示信息统计表.png

注:以上数据全部来自互联网公开信息;*为采购人评审专家。

第一,专家库名单总量。本次共挖掘了S市2020年8月—2023年3月32个物业管理评审项目,共抽取评审专家148人次,之所以考虑时间跨度约为两年半,是从逻辑上推理认为,超过两年半从未被抽取过的评审专家应当处于某种“冷冻”状态,可以忽略不计。

经过去重处理,获得评审专家总数为93人。其中,涉及采购人评审专家21人。由于采购人评审专家不列入政府采购评审专家库,因此,库内物业管理专家数为72人,共抽取125人次,其中46人仅被抽中过一次,有26人有过2次以上评审记录(见表2)。

表2 S市政府采购物业管理专业评审专家抽取分布情况

表2 S市政府采购物业管理专业评审专家抽取分布情况.png

注:绿色为采购人代表;橘色为有过2次以上抽取记录的专家评审专家。

第二,专家抽取频次分析。从专家抽取频次分布情况来看(见表3),专家被重复抽中的比例较高,呈现出典型的“高频复现”趋势。其中,被抽中3次以上的有14人,约占总人数的19%,占总抽签人次的45%。两年半期间仅被抽中1次的专家为46人,约占总抽签人次数的37%,被抽中两次以上的19人,约占总抽签人次数的54%,频率最高的5位评审专家(1人被抽中5次,4人被抽中4次)共计21次,约占总次数的17%。

表3 S市政府采购物业管理专业评审专家抽取频次分析

表3 S市政府采购物业管理专业评审专家抽取频次分析.png

从抽取间隔来看,出现多次有评审专家连续两次以上无间隔重复评审的现象,可知S市未采取阶梯概率抽取方式。例如,朱某1在2021年3月17日、4月19日、5月24日连续3次参评;姚某兰(既是专家库成员也是采购人评审专家)于2021年9月6日、9月23日、10月13日和12月27日连续4次参评;还有钱某义、陈某祥、邵某琳等评审专家也存在连续2次参评的情况。

3.关联学习—专家抽取范围预测

关联学习是反映一个事物与其他事物之间的相互依存性和关联性,用于从大量数据中挖掘出有价值的数据项之间的相关关系,可从数据库中关联分析出形如“由于某些事件的发生而引起另外一些事件的发生”之类的规则。

利用关联学习算法来预测评审专家名单主要考虑两个因素,一是高频参与评审的专家名单;二是考虑合理的抽取间隔。由于没有设置阶梯抽取方式,因此抽取间隔反而无法预设。但是,我国不少地方对同一时间段内评审专家参与评审有一定的次数限制。例如,烟台市规定,评审专家原则上在一年之内不得连续3次参加政府采购评审工作。

从S市的物业管理专业评审专家参与评审的情况来看,陈某祥、钱某义、邵某琳、姚某兰、张某2、曹某莉、蒋某乾、王某2、朱某2等14位评审专家出场频次均超过3次,属于高频次评审“热门”人选,应当予以重点关注;蔡某、曾某贵、陈某1等12位专家也有2次以上评审经历,亦属于较高频率参评专家。换句话说,这26位专家“出场”评审的频率(56/125)比另外46位只参加过一次评审的专家(46/125)要高很多,是供应商重点“围猎”的对象。从风险防控的角度出发,可根据评审专家被“围猎”的风险分为四个级别,图1展示了专家被“围猎”风险的等级分布情况。

图1 S市政府采购物业管理专业评审专家“围猎”风险等级分布图.png

图1 S市政府采购物业管理专业评审专家“围猎”风险等级分布图

从图1可以看出,只要“围猎”高危、危险和次危三个等级约14位专家,就有接近一半的概率(44%)可以控制整个项目的评审方向;若能“围猎”到轻危等级以上专家,“控标”概率就能超过六成(63%)。尽管物业专业的专家库成员有72人,但是只要控制住这26个轻危等级以上的专家,对评审结果就能“十拿九稳”。

防范专家名单提前泄露的主要举措

评审前不宜公开全体评审专家库名单

我国不少地方在建成政府采购评审专家库以后,一般都会将整个评审专家库名单公开。例如,2022年8月2日,遂宁市公开了82名续聘的政府采购评审专家名单;2023年3月14日,酒泉市公示了在全市征集的209名专家名单。这种公开虽然可以让评审专家最大程度接受社会监督,但是潜在的风险也相伴而生。甚至不需要通过单个项目专家评审专家的名单“拼接”,就可直接获取整个评审专家库名单,极大提升了专家名单泄露风险。尽管198号文规定评审活动完成后要公告评审专家名单,但是现行的政府采购法律法规没有对整个评审专家库必须全部公开的强制要求。所以,评审前不公开全体评审专家库名单,是防范专家名单提前泄露的主要举措之一。

评审后应当严禁公开评审专家的个人信息

评审活动完成后公开评审专家的名单,能起到监督专家评审行为的作用,但是其带来的风险也显而易见。如前文所述,在一些专家资源比较稀缺的地区,公开名单也就意味着将评审专家的信息“敞开式”毫无保留地面向所有交易主体,供应商稍作分析即可“精确制导”摸索出其参与项目的评审专家名单,进而通过一些非法途径影响甚至操控最后的评审结果。198号文在规定专家名单公开的同时也强调,不得泄露评审专家的个人情况,即名单可以公开,但专家的个人情况还是属于保密事项,不得泄露。

随着“零知识证明”技术在隐私计算和匿名投票等领域取得的成效来看,理论上可以实现在不公开专家姓名的前提下,将专家的评审行为置于公众的监督之下。与时俱进改变评审专家名单公开方式,禁止泄露评审专家的个人情况,能有效防止评审专家信息泄露。

强化动态管理、优化抽取方式

加强评审专家库的动态管理,形成“有进有出”的专家队伍遴选机制,可以降低评审专家被“围猎”“腐蚀”的风险。例如,深圳市将评审专家日常采购评审的表现与定期考核结合起来,每两年对所聘评审专家资格进行复审,建立评审专家奖惩淘汰机制,通过告诫、警告、通报、暂停或取消评审资格等方式,建立诚信档案对评审专家库实行动态管理。深圳市对评审专家动态管理的方式值得其他地区借鉴。

此外,优化抽取方式也是防止评审专家信息泄露的有效手段。例如,山东省规定,采购人根据采购内容和品目,在专家库中选择确定1—3个对应评审专业,按照“评价优秀的专家中优先抽取,评价合格的专家中备用抽取”的方式进行;限制评审专家参评次数,每位评审专家在抽取前30日内参加政府采购评审次数原则上不得超过6次。

推行跨区域、跨行业评审专家资源共享互用

政府采购评审专家跨区域共享也是破解“熟面孔”“老关系”“小圈子”问题的有力举措。以某省为例。该省全省专家总数为1631人,区域间分布极不均衡,最多的某市有346人,而另外一个市仅1人(2023年3月补充到了211人),某自治州只有2人,其他地市普遍不足百人。极度匮乏的评审专家资源无法满足评审需要,专家信息保密自然无从谈起。为了解决区域间专家资源的严重不均衡难题,部分地区陆续采取措施、出台政策,实行远程异地评标(评审)。例如,2022年3月,哈尔滨市联合鄂尔多斯市和包头市开展政府采购领域跨省远程异地评标合作,签订了全国首份政府采购跨省远程异地评标合作协议,推动了全国第一例跨省远程异地评标项目落地。2022年12月,郑州市印发《关于常态化开展政府采购项目远程异地评审工作通知》,实施政府采购项目远程异地评审工作常态化,推进跨省远程异地评审。2023年3月,《甘肃省公共资源交易远程异地评标(评审)管理办法(试行)》(甘发改法规〔2023〕132号)明确,依法必须招标的工程建设项目、集中采购目录以内或者采购限额标准以上的政府采购项目,符合条件的应当进行远程异地评标(评审)。其余地区可借鉴相关经验,推行远程异地评审,以实现跨区域、跨行业评审专家资源共享互用。

结语

评审专家名单泄露会对正常评审工作的安全造成严重威胁。同时,一些掌握高科技的犯罪分子利用数据趋势分析、心理变数营销等方法来测度评审专家的评审喜好和打分倾向,最终引导整个评审工作朝着操控者设计好的方向进行,也会使评审工作流于形式,违反公平公正原则。随着大数据和人工智能技术的日益成熟,一些不法分子肆意窃取评审专家名单信息的门槛越来越低,违法犯罪的手段也越发高明,这些都会给政府采购行业健康发展造成不可估量的冲击,亟待引起各方高度重视。

〔作者单位:南通市公共资源交易中心(南通市政府采购中心)〕

责编:辛美玉;编辑:张曼琳
京ICP备16068661号-3 ©CopyRight 2018-2024 《中国招标》杂志社有限公司 版权所有