首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于BiLSTM-CRF的历史典籍阅读辅助系统及其控制方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:哈尔滨工业大学

摘要:一种基于BiLSTM‑CRF的历史典籍阅读辅助系统及其控制方法,使用BiLSTM‑CRF进行命名实体标注;在用户指定针对某一实体访问时,程序会在数据库中查询和该词有关的信息;本发明标注了一些隋唐时期的文本作为训练数据;之后利用这些数据对BiLSTM‑CRF模型进行训练;在实际使用过程中,本发明在读者使用应用打开一个文言文文件后,对文本进行预处理;之后,将这个表示传入BiLSTM层,计算每一个位置可能对应的各个标签的概率,之后通过CRF层计算出得分最高的标签序列;在提取出实体之后,到预设的数据库中对实体的相关信息进行查询,并将查询结果以浮窗形式显示在应用上。

主权项:1.一种基于BiLSTM-CRF的历史典籍阅读辅助系统,其特征在于,所述系统包括:基于Asp.NETCoreBlazor的前端模块:所述Asp.NETCoreBlazor是一个使用.NET生成交互式客户端WebUI的框架;使用C#代替JavaScript创建的交互式UI,共享使用.NET编写的服务器端和客户端应用逻辑;所述前端模块使用现存的Web前端框架完成构建或移植;基于.NETCore+python+飞桨的形式的后端模块:所述.NETCore部分用于预处理传输文件,再将数据传送给python+飞桨的模型部分来完成预测,再对预测结果进行处理,查询数据库后,传给前端模块进行显示;显示模块:从后端模块传回来的数据将被渲染为html文档供用户阅读;被识别为时间、地点和人名的实体字词会被高亮显示;用户将鼠标移到高亮显示的实体字词上时,会显示悬浮信息卡,点击字词,会跳转应用到该字词相关信息的详情页面;人名对应的详情页面为人物关系图,所述人物关系图是基于ApacheECharts显示的;Electron.NET封装模块:Electron是使用JavaScript,HTML和CSS构建跨平台的桌面应用程序的框架,Electron.NET封装模块将所述前端模块、后端模块和显示模块构成的一个Web应用,再封装成一个跨平台的桌面应用程序;所述显示模块执行以下操作:对于识别出的时间类实体,所述时间类实体被识别出来之后,将会被自动分开,年号部分将到数据库中查询,得到此年号的开始时间;时间部分将被转换为一个偏移值,直接与开始时间相加,相加的结果将作为这个时间实体对应的公元纪年;对于识别出的人名实体,首先利用数据库中的统一ID对照表,得到此人名的唯一ID;对于文章中的重名现象,即同一实体名有两个统一ID满足条件,则从此实体出发,找到和它距离最近的N个人名实体,分别计算这N个人名实体到各个ID对应的人物的距离; 其中spj,pi的计算方式为:如果联通,则人物pj和pi相连的路径上的人物个数;否则spj,pi为k’+1,其中k’为搜索的步数: 对于识别出的地名实体,直接到对应地名库中进行查询;对于不同地点的统一地名,当在同一朝代条件下,每个地点的地名唯一时,即同一地名只能对应同一个地点;当识别到的地名在数据库中有两条记录时,将统计与此地名最近的N个时间实体和人名实体,利用这N个实体进行投票,以决定此地名所在的朝代,进而确定此地名在数据库中的子项;最后在提取出实体之后,到数据库对实体的相关信息进行查询,并将查询结果以浮窗形式显示在应用上。

全文数据:

权利要求:

百度查询: 哈尔滨工业大学 一种基于BiLSTM-CRF的历史典籍阅读辅助系统及其控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。