北京三快在线科技有限公司阮颖颖获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京三快在线科技有限公司申请的专利一种分类模型的训练方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114926687B 。
龙图腾网通过国家知识产权局官网在2025-04-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210589562.9,技术领域涉及:G06V10/764;该发明授权一种分类模型的训练方法及装置是由阮颖颖;马潮;曹佐设计研发完成,并于2022-05-26向国家知识产权局提交的专利申请。
本一种分类模型的训练方法及装置在说明书摘要公布了:本说明书公开了一种分类模型的训练方法及装置,从未标注的样本集中选取第一数量的训练样本进行标注后,分别确定各训练样本中各模态的数据对应的特征向量,并确定表征各训练样本中各模态的数据关联程度的分类难度,按照分类难度从小到大的顺序,分批训练分类模型。若训练该分类模型的样本数量未达到预设数量,则根据该分类模型对未标注的其他样本进行分类,确定其他样本分类结果的不确定性,以从中选择分类困难的其他样本继续进行标注,再次训练分类模型。通过重复上述过程,使得在训练分类模型时可以优先采用训练分类效果明显的样本进行训练,分批训练分类模型,使得一方面可以提高训练效率,另一方面减少训练样本的数量,减轻人工标注的成本。
本发明授权一种分类模型的训练方法及装置在权利要求书中公布了:1.一种分类模型的训练方法,其特征在于,包括:从样本集中选取第一数量的训练样本进行人工标注,确定训练集,其中,各训练样本至少由两种模态的数据组成,所述训练样本包括字符、图片、视频中的两种或两种以上,即为多模态数据;针对所述训练集中的每个训练样本,分别确定该训练样本中各模态的数据对应的特征向量;确定该训练样本的各特征向量之间的相似度,以根据确定出的各相似度,确定表征该训练样本中各模态数据的关联程度的分类难度;按照各训练样本的分类难度从小到大的顺序,对分类模型进行训练;若用于训练所述分类模型的训练样本数量未达到预设数量,则通过训练后的所述分类模型对所述样本集中未进行标注的各其他样本进行分类;根据各其他样本分类结果的不确定性从大到小的顺序,确定第一数量的其他样本作为训练样本进行人工标注,并加入到所述训练集中,重新确定各训练样本的分类难度继续训练所述分类模型,直至采用所述预设数量的训练样本训练所述分类模型为止。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京三快在线科技有限公司,其通讯地址为:100080 北京市海淀区北四环西路9号2106-030;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。