恭喜蜜度科技股份有限公司张晓娟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜蜜度科技股份有限公司申请的专利古文标点预测方法、系统、电子设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119150864B 。
龙图腾网通过国家知识产权局官网在2025-05-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411640553.3,技术领域涉及:G06F40/289;该发明授权古文标点预测方法、系统、电子设备及介质是由张晓娟;于凯设计研发完成,并于2024-11-18向国家知识产权局提交的专利申请。
本古文标点预测方法、系统、电子设备及介质在说明书摘要公布了:本申请提供一种古文标点预测方法、系统、电子设备及介质,所述古文标点预测方法包括:获取训练数据;对所述训练数据进行拆分处理,利用拆分后的数据块获取训练数据集;利用最小哈希算法构建索引库,以获取所述训练数据集的参考文本;利用所述参考文本和所述训练数据集的原始文本对初始语言模型进行训练,以获取古文标点预测模型;利用所述古文标点预测模型对待预测文本进行预测,以获取预测结果。此种古文标点预测方法能够避免连续标点预测的漏报问题,提高古文标点预测的准确度。
本发明授权古文标点预测方法、系统、电子设备及介质在权利要求书中公布了:1.一种古文标点预测方法,其特征在于,包括:获取训练数据;对所述训练数据进行拆分处理,利用拆分后的数据块获取训练数据集;对所述训练数据进行拆分处理,利用拆分后的数据块获取训练数据集包括:对所述训练数据进行句子拆分和文本拆分,以获取短句集合和文本集合;根据所述短句集合和所述文本集合获取窗口范围内的最大短句数量和最大文本数量;根据所述最大短句数量、所述最大文本数量、所述短句集合和所述文本集合获取所述训练数据集;利用最小哈希算法构建索引库,以获取所述训练数据集的参考文本;所述训练数据集包括至少一个待检索文本,利用最小哈希算法构建索引库,以获取所述待检索文本的参考文本包括:基于最小哈希算法获取所述训练数据集的哈希签名向量;利用所述哈希签名向量基于局部敏感哈希森林构建签名索引库;基于最小哈希算法获取待检索文本的哈希签名向量;利用所述待检索文本的哈希签名向量在所述签名索引库中进行检索,获取所述待检索文本的参考文本;利用所述参考文本和所述训练数据集的原始文本对初始语言模型进行训练,以获取古文标点预测模型;利用所述古文标点预测模型对待预测文本进行预测,以获取预测结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人蜜度科技股份有限公司,其通讯地址为:201204 上海市浦东新区中国(上海)自由贸易试验区张衡路198弄10号301AB室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。