恭喜北京奇虎科技有限公司周航宇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京奇虎科技有限公司申请的专利数据处理方法及终端获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119250072B 。
龙图腾网通过国家知识产权局官网在2025-05-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411775315.3,技术领域涉及:G06F40/284;该发明授权数据处理方法及终端是由周航宇设计研发完成,并于2024-12-04向国家知识产权局提交的专利申请。
本数据处理方法及终端在说明书摘要公布了:本申请涉及计算机技术领域,本申请公开了一种数据处理方法及终端,该方法包括确定针对目标大模型的输入文本以及输入文本的模型词元数信息,基于模型词元数信息确定针对输入文本的处理策略;当处理策略为第一处理策略时,确定输入文本的词汇单元以及词汇单元的单元自信息值,通过单元自信息值从词汇单元中确定目标词汇单元,并生成目标词汇单元对应的目标输入文本;确定目标输入文本的全局相对位置特征,利用全局相对位置特征控制目标大模型对目标输入文本进行处理,得到第一模型输出结果。从而解决大模型在对较长的文本进行处理时,较长的文本可能会超出大模型的处理范围,从而使得在大模型的模型处理过程中出现信息丢失或出现错误的技术问题。
本发明授权数据处理方法及终端在权利要求书中公布了:1.一种数据处理方法,其中,所述方法包括:确定针对目标大模型的输入文本以及所述输入文本的模型词元数信息,基于所述模型词元数信息确定针对所述输入文本的处理策略;当所述处理策略为第一处理策略时,确定所述输入文本的词汇单元以及所述词汇单元的单元自信息值,通过所述单元自信息值从所述词汇单元中确定目标词汇单元,并生成所述目标词汇单元对应的目标输入文本;确定所述目标输入文本的全局相对位置特征,利用所述全局相对位置特征控制所述目标大模型对所述目标输入文本进行处理,得到第一模型输出结果;其中,所述确定所述输入文本的词汇单元以及所述词汇单元的单元自信息值,包括:对所述输入文本进行词汇单元划分处理得到所述输入文本的词汇单元;确定所述词汇单元对应的词元序列,计算所述词元序列中各词元的词元自信息值;其中,所述词元自信息值用于表征所述词元的信息量;基于所述词元序列中各词元的词元自信息值,确定所述词元序列对应的词汇单元的单元自信息值;其中,所述计算所述词元序列中各词元的词元自信息值,包括:采用第一计算式计算所述词元序列中各词元的词元自信息值;所述第一计算式满足以下公式:I(Ti)=-log2P(Ti|CT0~TN,Ti);其中,Ti为所述词元序列中序列顺序号为i的词元,N≥i≥0且i为整数,N+1为所述词元序列中的词元总数;T0~TN为所述词元序列中T0至TN的全部词元;CT0~TN,Ti为T0至TN的全部词元中剔除Ti后得到的词元;I(Ti)为Ti的词元自信息值;P(Ti|CT0~TN,Ti)为T0至TN的全部词元中剔除Ti后余下词元所对应的词元生成事件发生的条件下,Ti对应的词元生成事件的发生概率值;所述基于所述词元序列中各词元的词元自信息值,确定所述词元序列对应的词汇单元的单元自信息值,包括:采用第二计算式对所述词元序列中各词元的词元自信息值进行累加处理,得到所述词元序列对应的词汇单元的单元自信息值;所述第二计算式满足以下公式:I(u)=;其中,u为所述词汇单元,I(u)为u的单元自信息值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京奇虎科技有限公司,其通讯地址为:100088 北京市西城区新街口外大街28号D座112室(德胜园区);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。