买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:富士通株式会社
申请日:2015-04-13
公开(公告)日:2016-11-23
公开(公告)号:CN106156143A
专利技术分类:
专利摘要:本发明实施例提供一种网页处理装置和网页处理方法,用于在实体网页中嵌入资源描述框架属性RDFa,该装置包括:第一识别单元,其用于识别网页的实体类型,所述实体类型对应有至少一个RDFa;第一划分单元,其基于所述网页的视觉结构以及所述实体类型,将所述网页划分为至少一个语义片段;第一确定单元,根据预先确定的语义片段与RDFa的对应关系,确定所述网页中每个语义片段所对应的所述实体类型中的RDFa,其中,所述对应关系是基于网页检索所获得的训练网页而确定的;以及嵌入单元,其用于在所述网页的每个语义片段中嵌入对应的RDFa。根据本发明实施例,无需对训练网页进行预先的人工标注,从而节省时间和人力,并且具有良好的扩展性。
专利权项:一种网页处理装置,用于在实体网页中嵌入资源描述框架属性,该装置包括:第一识别单元,其用于识别网页的实体类型,所述实体类型对应至少一个资源描述框架属性;第一划分单元,其基于所述网页的视觉结构以及所述实体类型,将所述网页划分为至少一个语义片段;第一确定单元,根据预先确定的语义片段与资源描述框架属性的对应关系,确定所述网页中每个语义片段所对应的资源描述框架属性,其中,所述对应关系是基于网页检索所获得的训练网页而确定的;以及嵌入单元,其用于在所述网页的每个语义片段中嵌入对应的资源描述框架属性。
百度查询: 富士通株式会社 网页处理装置和网页处理方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。