首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】搜索数据库的正排索引处理方法、装置、介质和设备_极限数据(北京)科技有限公司_202410479400.9 

申请/专利权人:极限数据(北京)科技有限公司

申请日:2024-04-22

公开(公告)日:2024-06-21

公开(公告)号:CN118069590B

主分类号:G06F16/13

分类号:G06F16/13;G06F16/172;G06F16/18;G06F16/11;G06F16/14

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2024.06.11#实质审查的生效;2024.05.24#公开

摘要:本发明公开了一种搜索数据库的正排索引处理方法、装置、介质和设备,将文档写入最新数据源内存的第一正排索引结构中,并同时写入预写日志。当监测到预写日志中有文档写入时,后台线程创建第三正排索引结构并写入文档。当第一正排索引结构达到数据量阈值时,第一正排索引结构停止写入并通知第三正排索引结构创建到预写日志中相同的位置,将创建的第三正排索引结构写入数据源磁盘并在写入完成可以读取后创建新的数据源,并进行数据源切换。本发明中,将正排索引与倒排索引在逻辑上进行分离,文档会被写入专门设计的正排索引结构中,因此在仅对正排索引的过程处理中十分灵活。同时,创建的正排索引结构可被实时搜索,这也有效提高了搜索效率。

主权项:1.一种搜索数据库的正排索引处理方法,其特征在于,搜索数据库包括内存、磁盘、预写日志及后台线程,内存和磁盘中的数据作为数据源,原子量追踪最新数据源,在数据不断地被写入的过程中,新的数据源被创建,数据源的版本对应增长,原子量被对应更新,所述内存中初始创建有两个可被实时搜索的正排索引结构,作为第一数据源,原子量初始追踪第一数据源,所述方法包括:获取上传的文档;将所述文档写入原子量追踪的最新数据源内存的第一正排索引结构中,且将所述文档写入预写日志;其中,第一正排索引结构为数据源中所述两个正排索引结构中当前被写入的正排索引结构,第二正排索引结构为数据源中所述两个正排索引结构中当前未被写入的正排索引结构,第一正排索引结构与第二正排索引结构的结构相同;当所述后台线程监测到所述预写日志中有文档写入时,通过所述后台线程创建第三正排索引结构,并将所述文档写入创建的第三正排索引结构;当第一正排索引结构写入的数据量达到阈值时,数据源准备进行切换,更新最新数据源,第一正排索引结构停止写入并通知第三正排索引结构也创建到预写日志中相同的位置,将创建完成的第三正排索引结构写入所述磁盘,并在磁盘写入完成可以读取后创建第二数据源,在第一数据源的基础上,第二数据源包含第三正排索引结构,且移除第一正排索引结构,将当前的第二正排索引结构作为更新后的第一正排索引结构,且创建新的正排索引结构作为更新后的第二正排索引结构,当第二数据源创建完成,对追踪最新数据源的原子量进行原子更新。

全文数据:

权利要求:

百度查询: 极限数据(北京)科技有限公司 搜索数据库的正排索引处理方法、装置、介质和设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。