首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种中文词条多条件复合的排序方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:雅昌文化(集团)有限公司;北京雅昌艺术印刷有限公司;上海雅昌艺术印刷有限公司

摘要:本发明公开一种中文词条多条件复合的排序方法,包括:获取预先创建的汉字的拼音库;获取预先创建的汉字的笔画笔型索引库;初始化待排序中文词条清单;根据最长匹配的原则在所述拼音库里检索中文词条的拼音,写入拼音清单;从笔画笔型索引库里检索中文词条中每个汉字的索引值,写入索引值清单;对于任意两个待排序的中文词条,依次对各自清单中的元素根据先拼音后索引值的原则进行比较,从而得到这两个中文词条的排序顺序;对所有的待排序中文词条采用预设的排序算法,输出为目标排序结果。本发明解决了多音字、生僻字排序不准确的问题,实现了更精准的中文索引词条的排序。

主权项:1.一种中文词条多条件复合的排序方法,其特征在于,包括:步骤S10:获取预先创建的汉字的拼音库,包括汉字及其对应的拼音两个字段;其中,对于多音字的汉字以第一预设符号间隔多个拼音,对于词组与短语则以第二预设符号间隔每个汉字的拼音;步骤S20:获取预先创建的汉字的笔画笔型索引库,包含汉字、笔画笔型值、索引值三个字段;其中,汉字字段保存一个汉字,笔画笔型值字段为对应汉字在预设规范中的基本笔型序号的顺序并转换成数值保存,索引值字段代表对应汉字的笔画数、基本笔型序号数值的大小在笔画笔型索引库的位次;步骤S30:初始化待排序中文词条清单;其中,清单中每个词条为清单中的一个元素,每个元素包括拼音、索引值与页码三个属性;步骤S40:根据最长匹配的原则在所述拼音库里检索中文词条的拼音,写入拼音清单,所述拼音清单中元素与中文词条的汉字一一对应,清单长度与中文词条的汉字数量相等;步骤S50:从所述笔画笔型索引库里检索中文词条中每个汉字的索引值,写入索引值清单,所述索引值清单中元素与中文词条的汉字一一对应,清单长度与中文词条的汉字数量相等;步骤S60:对于任意两个待排序的中文词条,依次对各自清单中的元素根据先拼音后索引值的原则进行比较,从而得到这两个中文词条的排序顺序;步骤S70:对所有的待排序中文词条采用预设的排序算法,输出为目标排序结果;其中,所述步骤S60包括:步骤S61:获取预设的词条比较函数,导入两个待排序的中文词条各自的拼音清单与索引值清单;其中,两个待排序的中文词条可分别称为A、B;步骤S62:将A的拼音清单中第一个元素与B的拼音清单中第一个元素做字符串unicode比较,若不相等,则小的排前,大的排后,并结束A与B的比较;若相等,则进入步骤S63;步骤S63:将A的索引值清单中第一个元素与B的索引值清单中第一个元素比较,若不相等,则小的排前,大的排后,并结束A与B的比较;若相等,则进入步骤S64;步骤S64:将A的拼音清单中第二个元素与B的拼音清单中第二个元素做字符串unicode比较,若不相等,则小的排前,大的排后,并结束A与B的比较;若相等,则进入步骤S65;步骤S65:将A的索引值清单中第二个元素与B的索引值清单中第二个元素比较,若不相等,则小的排前,大的排后,并结束A与B的比较;若相等,则进入步骤S66;步骤S66;按照所述步骤S62-S65,依次类推,直至确定A与B的排序。

全文数据:

权利要求:

百度查询: 雅昌文化(集团)有限公司 北京雅昌艺术印刷有限公司 上海雅昌艺术印刷有限公司 一种中文词条多条件复合的排序方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。