买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广汽本田汽车有限公司
摘要:本发明涉及围标串标风险识别技术领域,更具体地,涉及一种基于孤立森林和随机森林的围标串标风险识别方法。充分挖掘招投标系统已有的投标、中标数据信息,基于无监督学习的孤立森林算法与有监督学习的随机森林算法相结合的方式,实现即便在数据标签不完善的前提下,也能快速进行功能应用,自动化、高效、准确地识别围标串标的风险行为。
主权项:1.一种基于孤立森林和随机森林的围标串标风险识别方法,其特征在于,包括以下步骤:S1.提取招投标系统数据库中的投标、中标历史数据,提取数据集M={X1,y1,X2,y2,…,Xi,yi,…,Xm,Ym},其中,Xi={xi1,xi2,…,xij…,xik}表示各个样本点即投标记录的k个特征值,xij表示第i个样本点里的第j个字段的值;Yi={y1,y2,…,yi,…,ym},其中yi∈{0,1}表示样本点对应的标签信息,即:表示该投标记录是否存在围标串标的异常行为风险,1为异常,0表示正常,初始阶段,招投标系统中只存在特征值信息,标签信息Yi均为空;并进行初始的数据探索,观察数据的分布情况并对核心字段展开处理,扩增数据集特征;S2.根据数据集的标签Yi的数据量的不同情况,采用无监督孤立森林算法与有监督随机森林算法相结合的方法进行数据模型训练,计算各个投标记录Xi的异常评分;S3.根据异常评分及初始设定阈值,进行异常划分,得出投标记录Xi的异常标签zi,其中,zi∈{0,1},zi=1表示模型判定该投标记录存在围标串标的异常行为风险;S4.进入系统复核,由纪检工作人员对zi标识为1,即标记为异常的投标记录进行核对,确认该投标是否为围标串标风险行为;S5.将系统复核的结果更新至确切标签信息yi,并将确切标签信息yi作为输入更新数据集M,实现正向循环。
全文数据:
权利要求:
百度查询: 广汽本田汽车有限公司 一种基于孤立森林和随机森林的围标串标风险识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。