买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京科技大学
摘要:本发明提供了一种基于眼动仪的高质量用户生成内容的识别方法和系统,涉及用户生成内容分类技术领域。本发明利用眼动仪获取注视区域,并根据注视区域对文章进行重排版,重排版后的字符更加适配使用场景,能够使后续阅读时长的计时更加准确。用户打开文章浏览页面后,通过眼动仪实时获取用户的注视区域,并计算注视区域在各个段落显示区域的停留时长作为段落的阅读时长,再基于所述停留时长,计算文章的评论的可信值B,基于可信值筛选高质量评论;同时基于所述高质量评论,计算文章的质量值Q,基于质量值筛选高质量文章,使机器人和水军的评论不会被收入评判数据,最终实现高准确度的高质量用户生成内容的识别。
主权项:1.一种基于眼动仪的高质量用户生成内容的识别方法,其特征在于,该方法包括:基于上传的文章,获取所述文章的段落信息其中,表示第n个段落的字符信息,N表示文章的总段落数量;基于眼动仪获取的注视区域,计算各个段落的重排版信息Set={s1,s2,...,sn,...,sN};其中,表示第n个段落的重排版信息,dp表示段落间距,sizeword表示字符尺寸,numcpl表示每行预设字符数,表示第n个段落的行数,表示第n个段落的显示尺寸;基于各个段落的重排版信息,对所述文章进行重排版;基于重排版后的文章,生成包含多个段落的段落显示区域的文章浏览页面;所述段落显示区域包括第n个段落在显示设备上的位置及尺寸信息;用户打开文章浏览页面后,眼动仪实时获取用户的注视区域,并计算注视区域在各个段落显示区域的停留时长其中,表示注视区域在第n个段落的段落显示区域的停留时长;基于所述停留时长,计算文章的评论的可信值B,将所述可信值高于第一预设阈值的评论标记为高质量评论;基于所述高质量评论,计算文章的质量值Q,并将所述质量值大于第二预设阈值的文章标记为高质量文章;所述计算注视区域在各个段落显示区域的停留时长包括:当注视区域与段落显示区域存在交集时,记为在段落显示区域停留,开始停留时长计时;当注视区域与段落显示区域的交集为空时,记为在段落显示区域停留,停止停留时长计时;所述计算注视区域在各个段落显示区域的停留时长还包括:停留时长计时的过程中,获取k时刻和k+1时刻的注视区域的中心点坐标,计算两个所述中心点坐标构成的视线移动方向与文字阅读方向的夹角α和移动高度mh;若移动高度mh大于字符尺寸sizeword中的字符高度pixelh,且夹角α大于第三预设阈值,则令时间段Δt=[k,k+1]不计入停留时长;所述基于所述停留时长,计算文章的评论的可信值B,包括:获取评论对应的用户的历史阅读速度Vhis;计算用户阅读第n个段落的阅读速度Vn,若Vn-Vhis≥V0,则记录第n个段落已阅读,V0表示阅读速度判定参数;计算该用户的文章已阅读比例作为评论的可信值B;所述基于所述高质量评论,计算文章的质量值Q,包括:获取文章的高质量评论,所述评论的类型包括好、一般或不好;计算各个评论的类型的占比,将评论为好的占比作为文章的质量值Q。
全文数据:
权利要求:
百度查询: 北京科技大学 基于眼动仪的高质量用户生成内容的识别方法和系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。