首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

用于包容性CAPTCHA的系统和方法 

申请/专利权人:塔塔咨询服务公司

申请日:2018-03-16

公开(公告)日:2019-07-16

公开(公告)号:CN110020059A

主分类号:G06F16/951(20190101)

分类号:G06F16/951(20190101);G06F16/953(20190101);G06F16/9535(20190101);G06F16/36(20190101);G06F16/332(20190101)

优先权:["20170717 IN 201721025362"]

专利状态码:有效-授权

法律状态:2023.04.07#授权;2019.08.09#实质审查的生效;2019.07.16#公开

摘要:本公开提供一种用于包容性CAPTCHA的系统和方法,且旨在提供一种满足具有所有能力的用户的可访问性、可用性和安全性需求的多重要求以使其实际上具有包含性的CAPTCHA。本公开提供了基于与现实生活情境相关的媒体文件的CAPTCHA问题,从而实现可用性和可访问性。失真干扰被引入媒体文件中以实现安全性。所述问题涉及从多个主题中选定的主题。每个主题还与基于环境信息和上下文信息相关的多个媒体文件相关。诸如语言和文化等地理方面的问题也被考虑在内以增加可用性。媒体文件、类型的广阔的知识库、类型和组合加入CAPTCHA的安全性方面。自主学习式CAPTCHA决策模块考虑到拼写错误、不完全答复、语境转喻、同义词及其变体中的一个或多个,以智能地进行决策而增强可访问性方面。

主权项:1.一种用于包容性CAPTCHA的处理器实施方法200,所述方法包括:响应对具有CAPTCHA的网页的用户请求,实时产生媒体文件,其中,产生的所述媒体文件的特征在于失真干扰以及对应于从与现实生活情境202相关的多个主题中选定的主题;为产生的所述媒体文件随机选择理解性问题作为所述CAPTCHA,所述理解性问题基于所述选定的主题、与请求所述网页的用户相关的地理位置以及产生的所述媒体文件的上下文,其中所述理解性问题与多个解决方案相关,所述多个解决方案对应于为所述选定的主题204产生的所述媒体文件;以及传送包括所述CAPTCHA206的网页;以及响应对所述理解性问题的用户输入,基于自主学习式CAPTCHA决策模块208智能地检测出是人类输入或机器输入。

全文数据:用于包容性CAPTCHA的系统和方法优先权声明本申请主张于2017年7月17日提交的印度专利申请No.201721025362的优先权。上述申请的全部内容以援引的方式并入本文。技术领域本文的实施例通常涉及数据处理和信息安全,更具体地涉及用于包容性CAPTCHA的系统和方法,该包容性CAPTCHA满足具有所有能力的用户usersofallabilities,具有不同的能力水平的所有用户的需求并具体地优化安全与访问之间的权衡。背景技术全自动区分计算机和人类的公众图灵测试CAPTCHA是一种计算机程序或系统其旨在区别人类与机器输入而作为安全措施。CAPTCHA的用途是保护诸如网页注册、线上调查等网络应用免受恶意程序机器人、字典式攻击和网络爬虫的侵害。用户被给予一种人类可理解的挑战来解决。基于所给予的响应,系统确定用户是否为人类。CAPTCHA基于失真distort,扭曲的内容类型而分类。某些类型的CAPTCHA是基于文本的CAPTCHA、基于图像的CAPTCHA、基于语音的CAPTCHA和基于拼图的CAPTCHA。本领域现有技术的CAPTCHA不可避免地涉及安全目的与访问目的之间的权衡。可以观察到,为了向残障用户提供可访问的CAPTCHA,受保护的应用可能需要在安全方面作出妥协。由于CAPTCHA主要目的针对信息安全,因此在确保对所有能力的用户的可用性和可访问性的同时,对管理安全具有挑战。发明内容本公开的实施例提出多种技术改进而作为对发明人在传统系统中认识到的一个或多个上述技术问题的解决方案。在一个方案中,提供了一种用于包容性CAPTCHA的处理器实施方法,其包括:响应对具有CAPTCHA的网页的用户请求,实时产生媒体文件,其中,产生的所述媒体文件的特征在于失真干扰以及对应于从与现实生活情境相关的多个主题中选定的主题;基于所产生的媒体文件随机选择理解性问题作为CAPTCHA,该理解性问题基于选定的主题、与请求网页的用户相关的地理位置以及所产生的媒体文件的上下文;以及传送包括CAPTCHA的网页。再次,响应对理解性问题的用户输入,该方法基于自主学习式CAPTCHA决策模块智能地检测出是人类输入或机器输入。在另一个方案中,提供了一种系统,包括:一个或多个硬件处理器;以及一个或多个数据存储装置102,操作性地联接到一个或多个处理器以存储被配置成用于通过一个或多个处理器执行的指令,所述指令被包括在以下中:CAPTCHA生成模块,该CAPTCHA生成模块被配置成:响应对具有CAPTCHA的网页的用户请求,实时产生媒体文件,其中,产生的所述媒体文件的特征在于失真干扰以及对应于从与现实生活情境相关的多个主题中选定的主题;基于所产生的媒体文件随机选定理解性问题作为CAPTCHA,该理解性问题基于选定的主题、与请求网页的用户相关的地理位置以及所产生的媒体文件的上下文;以及传送包括CAPTCHA的网页。指令还被包括在自主学习式CAPTCHA决策模块中,该自主学习式CAPTCHA决策模块被配置成:响应对理解性问题的用户输入,智能地检测出是人类输入或机器输入。在又另一方案中,提供了一种计算机程序产品,包括:非暂时性计算机可读介质,具有在其中体现的计算机可读程序,其中计算机可读程序在计算装置上被执行时,引起计算装置:响应对具有CAPTCHA的网页的用户请求,实时产生媒体文件,其中,产生的所述媒体文件的特征在于失真干扰以及对应于从与现实生活情境相关的多个主题中选定的主题;基于产生的媒体文件随机选定理解性问题作为CAPTCHA,该理解性问题基于选定的主题、与请求网页的用户相关的地理位置以及所产生的媒体文件的上下文;以及传送包括CAPTCHA的网页。再次,响应对理解性问题的用户输入,计算装置基于自主学习式CAPTCHA决策模块智能地检测出是人类输入或机器输入。在本公开的一个实施例中,产生的媒体文件是听觉形式或视觉形式的至少一种。在本公开的一个实施例中,所产生的媒体文件是相同形式但不同类型的两个或更多个媒体文件的组合、或者不同形式的两个或更多个媒体文件的组合,每个组合对应于选定的主题。在本公开的一个实施例中,两个或更多个媒体文件的不同类型与媒体文件的环境信息和上下文信息相关。在本公开的一个实施例中,CAPTCHA生成模块还被配置成,响应对理解性问题的用户输入,选择并传送用于选定的主题的至少一个替代性理解性问题。在本公开的一个实施例中,每个理解性问题与多个解决方案相关,这些解决方案对应于用于选定的主题的所产生的媒体文件。在本公开的一个实施例中,CAPTCHA生成模块还被配置成以视觉形式或听觉形式的至少一种呈现选定的理解性问题。在本公开的一个实施例中,自主学习式CAPTCHA决策模块被配置成基于以下内容智能地检测出是人类输入或机器输入:在考虑拼写错误、不完全答复、语境转喻、同义词及其变体中的一个或多个的情况下,智能地比较用户输入与从自主学习式CAPTCHA决策模块的决策库得到的之前存储的用户输入;基于比较和其相关决策检测出是人类输入或机器输入;以及基于检测到的输入,借助用户输入和相关决策而更新决策库。应该理解的是,前述一般描述和以下详细描述仅是示例性且说明性的,而非限制所声明的本公开的实施例。附图说明将参考附图而从以下详细描述中更好地理解这里的实施例,在附图中:图1示出根据本公开的实施例的提供包容性CAPTCHA的系统的示例性框图;图2示出根据本公开的实施例的提供包容性CAPTCHA的系统的示例性结构图解;图3是示出根据本公开的实施例的用于包容性CAPTCHA的计算机实施方法的示例性流程图;图4示出根据本公开的实施例的用于包容性CAPTCHA的方法的工作流程图;图5示出根据本公开的实施例的具有不同能力的用户和使用包容性CAPTCHA的成功和失败的尝试次数的示意图;图6示出根据本公开的实施例的具有不同能力的用户和成功完成包容性CAPTCHA所做的尝试次数的示意图;图7示出根据本公开的实施例的具有不同能力的用户和完成包容性CAPTCHA所需时间的示意图;图8示出根据本公开的实施例的用于包容性CAPTCHA的主流用户的音频文件明智分析wiseanalysis的示意图;以及图9示出根据本公开的实施例的用于包容性CAPTCHA的屏幕阅读器用户的音频文件明智分析的示意图。本领域技术人员应该理解的是,这里的任何框图表示了体现当前主旨的原理的说明性系统的概念图。同样,应该理解的是,任何流程图、作业图、状态转换图、虚拟码等表示可大体上呈现于计算机可读介质中并由计算装置或处理器执行的多种过程,无论这样的计算装置或处理器有没有被明确示出。具体实施方式下面将参照附图描述示例性实施例。在附图中,附图标记的最左边的数字表示首次出现该附图标记的附图图号。为了方便起见,在所有附图中相同的附图标记用来指代相同或相似的部件。虽然在文中描述了所公开的原理的示例和特征,但是在不背离所公开的实施例的精神和范围的前提下,改进、调整和其他实施方式也是可行的。以下详细描述应仅看作是示例性的,真实的保护范围和精神由所附权利要求指定。在给出详细描述之前,应注意的是,不管具体的实施方式是如何描述的,以下所有讨论实质上都是示例性的而非限制性的。用于全自动区分计算机和人类的公众图灵测试CAPTCHA,验证码是一项挑战-答复测试,用于确定用户是否为人类。引入了基于失真的不同类型的CAPTCHA。1基于文本的CAPTCHA:向用户呈现基于阅读文本或其他视觉听觉感知任务的文本挑战。例如,·Flower,resting,lawyerandcampsite花朵、测试、律师和野营地:其中以“c”开始的词语是?·1+six1+六等于几?·袜子、图书馆、蛋糕或红色中哪一个是颜色?·relieves,luxuriateorCAMPAIGN解除、奢侈和竞选中以大写字母给出的是哪一个?具有最具算术性、逻辑性或常识性基础的问题的基于文本的CAPTCHA能由计算引擎容易地解决,从而产生安全问题。对于认知障碍的用户来说也很难解决这些CAPTCHA。2基于图像的CAPTCHA:向用户呈现具有扭曲字符和迷惑技术的组合的图像或者真实世界对象例如动物、人物或风景的图像,用户需要识别或阅读并重新输入这些信息。它们基于阅读文本或其他视觉感知任务。例如,·可能会显示具有12个宠物的图像,并且可能会要求用户识别出所有猫的图像。·可能会向用户呈现分成多块的图片,用户必须将它们组合或掉换才能形成完整图片,就像拼图游戏一样。基于视觉感知的CAPTCHA对于视觉受损的用户是不可访问的,因为它们被设计为不能由机器读取;诸如屏幕阅读器等常用辅助技术工具也不能解析它们。有时候,这些CAPTCHA具有这样扭曲的文本和图像,即,致使主流用户以及低视力用户也难以阅读,从而妨碍了可用性。此外,以拼图操作例如拖放、图像翻转、用鼠标点击的形式进行的基于图像的CAPTCHA对于仅有键盘的用户来说可能也难以执行。对于认知障碍的用户来说,这可能也是一个挑战。3基于音频的CAPTCHA:音频CAPTCHA是基于声音系统的专门为视障用户开发的。用户通常需要收听音频并输入到文本框中。它们是基于听觉-感知的任务。人们根据研究文献发现,由于存在失真干扰,音频CAPTCHA难以解答。在失真时对于听起来很相似的字母例如T和D、B和P产生误解很常见的。而且,这些音频可能容易地被当前的自动语音识别ASR技术解码,从而引起安全问题。音频CAPTCHA还面临本地化问题,因为音频中的内容可能不是对每个用户来说都是可理解的。音频播放是线性的。依靠屏幕阅读器的用户在理解屏幕阅读器的语音与音频之间的差异方面可能具有挑战。从现有技术的CAPTCHA可以注意到,可访问、安全且同时可用的CAPTCHA的成功实施是个挑战。视觉障碍者、低视力用户发现,基于图像的CAPTCHA具有挑战性,因为他们无法在视觉上感知它,从而使其无法访问和无法使用。除非在可访问性方面做出妥协,否则基于图像的CAPTCHA的安全性方面也可以通过机器学习技术而被越过和打破。音频CAPTCHA可能会满足视障用户的要求,但是可能难以解答、费时且成功率低如研究文献中所见,因此进一步降低了可用性并影响了可访问性。高质量的自动语音识别ASR和噪音消除系统也可能破解现有技术的音频CAPTCHA。本公开特别致力于现有技术CAPTCHA中看到的可访问性与安全性之间的权衡,并且相应地,本公开的方法和系统旨在提供包容性的CAPTCHA,其满足可用性、可访问性和安全性的多重要求orthogonalrequirements,同时考虑了所有需求的用户并因此具有包容性。现在参考附图,并且更具体地参照图1至图9,其中在所有附图中,类似的附图标记一致地表示相应的特征,在附图中示出了优选实施例,并且在以下示例性系统和方法的环境中描述了这些实施例。图1示出了根据本公开的实施例的用于提供包容性的CAPTCHA的系统100的示例性框图。在一个实施例中,系统100包括:一个或多个处理器104、通信界面装置或输入输出IO界面106、以及可操作地联接到所述一个或多个处理器104的一个或多个数据存储装置或存储器102。作为硬件处理器的一个或多个处理器104可以被实施为一个或多个微处理器、微计算机、微控制器、数字信号处理器、中央处理单元、状态机、图形控制器,逻辑电路和或根据操作指令操纵信号的任何装置。除其他能力之外,处理器还被配置为获取并执行存储在存储器中的计算机可读指令。在一个实施例中,系统100可以以各种计算系统实施,诸如膝上型计算机、笔记本电脑、手持装置、工作站、大型计算机、服务器、网络云等。IO界面装置106可以包括各种软件和硬件界面,例如网络界面、图形用户界面等,并且可以促进多种网络NW和协议类型内的多种通信,包括有线网络例如LAN、电缆等,以及无线网络例如WLAN、蜂窝或卫星。在一实施例中,IO界面装置可以包括用于将多个装置彼此连接或连接至另一个服务器的一个或多个端口。存储器102可以包括本领域已知的任何计算机可读介质,例如包括:易失性存储器诸如静态随机存取存储器SRAM和动态随机存取存储器DRAM,和或非易失性存储器诸如只读存储器ROM、可擦除可编程ROM、闪存、硬盘、光盘和磁带。在一实施例中,系统100的一个或多个模块未示出可被存储在存储器102中。图2示出了根据本公开的实施例的用于提供包容性的CAPTCHA的系统的示例性体系结构图。本公开的包容性CAPTCHA考虑残障视觉、听觉、运动、残疾用户以及主流用户在可用性、安全性和可访问性方面的多重要求,从而使CAPTCHA实际上具有包容性。图3是示出根据本公开的实施例的用于包容性CAPTCHA的计算机实施方法200的示例性流程图。在一实施例中,系统100包括可操作地联接至一个或多个处理器104的一个或多个数据存储装置或存储器102,并且所述系统被配置为存储指令,所述指令被配置为由一个或多个处理器104执行方法200的步骤。现在将基于图2的体系结构图,参照系统100的部件,详细解释方法200的步骤。在一实施例中,系统100可包括示例性模块,例如CAPTCHA生成模块未具体示出以及自学式CAPTCHA决策模块未具体示出。在一实施例中,CAPTCHA生成模块被配置为响应于用户对具有CAPTCHA的网页的请求,在步骤202实时地创建媒体文件,其中所创建的媒体文件的特征表现为失真干扰。在本公开的上下文中,失真干扰包含媒体文件的重叠。根据本公开,所创建的文件可以具有听觉形式、视觉形式或两者的组合诸如视听形式,其中视觉形式可以包括视频或动画。然而,为了便于解释,可以参考音频文件来解释某些示例性实施例,该音频文件不可被解释为限制所附权利要求书的范围和或适用性。在另一实施例中,所创建的媒体文件是具有相同形式或不同形式的两个或更多个媒体文件的组合。再次,当两个或更多媒体文件具有相同的形式时,它们可以是不同类型的。根据本公开,可能具有与真实世界场景相关的多个主题。例如,创建的媒体文件可以是以学校、交通工具、火车站、动物园、公园等中的对话为例的音频文件。创建的媒体文件对应于来自多个主题的选定主题。每个提到的主题如学校、火车站、动物园等可以与媒体文件库相关联。再次,在一实施例中,两个或更多个媒体文件的不同类型与环境及其相关语境信息相关联。例如,在创建的媒体文件是音频文件的情况下,每个主题可以与音频文件库相关联,其中每个库可进一步包括与环境主题相符的关于主对话、环境噪声、背景噪声和背景语音的更多音频文件子库,这些音频文件可以被实时地组合并作为创建的媒体文件呈现给用户。每个主题和可能的变体以及媒体文件例如所描述的用于创建媒体文件的四种类型的音频文件的失真干扰或重叠的可能组合的级别使得能够解决安全方面的问题。在一实施例中,CAPTCHA生成模块被配置为在步骤204中随机地选择理解性问题用于作为CAPTCHA的创建媒体文件。在一实施例中,题库可以包括与每个主题有关的所有可能的理解性问题。在一实施例中,所选择的理解性问题基于选择的主题、与请求网页的用户相关联的地理位置和所创建的媒体文件的上下文context;其中与用户相关联的地理位置也与相应的文化和语言有关。图4示出了根据本公开的实施例的用于包容性CAPTCHA的方法的工作流程图。CAPTCHA生成模块首先随机地选择主题图4的图示中为学校。在如图4所示的示例性实施例中,创建的媒体文件是四种类型的音频文件即,主对话、背景噪声、环境噪声和背景语音的实时组合的音频文件。这种组合媒体文件的技术例如,音频文件,比如实时音频混合器模块使ASR引擎很难解译CAPTCHA问题。创建的音频文件中的对话可能是单一语言或多种语言,语法正确不正确,从而使ASR难以破解。由于呈现给用户的创建的音频文件是人类在日常生活中经历的真实世界情景如图4中的学校,因此人类处理、提取和解析信息会需要最少的脑力劳动。此外,主题与真实世界场景相关并且所选问题基于创建的媒体文件的上下文这样的事实促进了所有能力的用户的可访问性。再次,也可考虑用户的地理位置、文化和语言来定制所创建的媒体在示例性实施例中为音频文件。如图4所示,向用户呈现的理解性问题是“教师正在教什么”。CAPTCHA中提问的问题完全基于学校主题和创建的音频文件的上下文,从而减少用户的认知负担。可以注意到,合并多个媒体文件使得自动脚本难以识别音频或图像以及难以准确地提取信息以答复CAPTCHA;而由于该CAPTCHA是与真实世界的场景有关且关联的上下文,所以该CAPTCHA对于人类来说很容易理解。在一实施例中,CAPTCHA生成模块被配置为在步骤206传送包括CAPTCHA的网页。在一实施例中,所选择的理解性问题可以以视觉形式、听觉形式或其组合例如视听形式来呈现。在一实施例中,自学式CAPTCHA决策模块被配置为,在步骤208,响应于对理解性问题的用户输入,智能地检测出是人类输入或机器输入。在一实施例中,响应于对理解性问题的用户输入,CAPTCHA生成模块可以针对所选择的主题选择并传送至少一个替代的理解性问题。例如,如果自学式CAPTCHA决策模块不能基于对理解性问题的用户输入做出决定,则CAPTCHA生成模块可以针对所选主题提出替代的理解性问题。一旦用户回答了所呈现的理解性问题,则自学式CAPTCHA决策模块判定其正确性并确定该访问是由人类进行的还是由机器进行的。在一实施例中,自学式CAPTCHA决策模块被配置为,首先通过将该用户输入与来自自学式CAPTCHA决策模块的决策库的先前存储的用户输入进行智能比较来检测是人类输入或机器输入。通过考虑拼写错误、不完全答复、语境转喻,同义词及其变体中的一个或多个,CAPTCHA决策模块可以使用信息取回技术策略来将用户给出的用户输入与存储的用户输入进行比较。例如,如果对理解性问题的答复是“tea茶”,可能的可接受答复包括“chai印地语言同义词、tea真实答案、chaha马拉地语言同义词、tee不正确拼写、热饮料转喻词、cha不完全答复”。本公开的这个特征确保了可访问性,特别是对于阅读障碍的用户和具有学习障碍的用户。检测是人类输入或机器输入这个步骤基于比较及其相关决定。以自学的方式,每个用户输入和该自学式CAPTCHA决策模块基于检测的输入得出的相关决策在决策库中被动态地更新,以建立知识库,该知识库可以被不断地更新以提高决策准确性。在图4的示例性实例中,针对所提问的问题的可接受用户答复可以是“数学数学课求和加相加加法”,这是只有人类可以解析和回答出来的。在另一个实例中,如果选择相同的主题学校,所提问的问题可保持相同“教师正在教什么”,但是如果由CAPTCHA生成模块选择的主对话音频文件被更改,其中教师正在教英语,则接受的答案可能会变成“英语angrezi印地语的“英语”英国英语外语”。因此,在一实施例中,每个理解性问题都可以与针对所选主题所创建的媒体文件相对应的多个答案相关联,这使得ASR和机器学习引擎对于破解CAPTCHA来说变得更加复杂。在另一示例性实例中,可以有四种类型的音频文件:背景噪音:交通声,汽车鸣笛2次,汽车行驶声。背景语音:乞丐的声音,有人在路上卖报。环境噪音:在移动着的交通工具汽车中的人正在通电话。主对话:嗨,Srikanth。那边几点了?现在是印度早上10点钟。理解性问题和可接受的用户输入可能是:·这个人在问谁时间?Srikanth男人Srikant·在音频中详细说明的是印度时间几点?10am10点dus印地语“十”·在背景中车辆鸣笛多少次?2次两次do印地语“二”2二·音频中提及了哪个国家?印度Bharat巴拉特·是一天中哪个时段的10点-早上。根据本公开,通过启用所创建的媒体文件的重放,可以进一步增强关于包容性CAPTCHA的可用性。可以通过使用户能够使用屏幕阅读器并提供键盘可访问性来同时收听和输入来进一步增强用户界面UI。当用户点击“播放”时,焦点可以自动设置在文本输入栏上,以使用户能够在听到音频后立即输入。在一实施例中,可以实施快捷键以在焦点保持在文本栏上的同时为用户重放音频,从而减少了用户为了完成CAPTCHA所需的交互点击的次数。使用音频文件对本公开的示例性实施例进行评估研究:程序:进行用户研究和安全测试以评估包容性CAPTCHA的可用性、可访问性和安全性。共有119名参与者参加了用户研究,其中24名参与者是屏幕阅读器用户部分失明或完全失明,95名是通过众包crowdsourcing,人群采集而征集的非残疾主流用户。屏幕阅读器用户使用的屏幕阅读器软件类型没有限制,并且要求所有用户都使用他们自己的装置。对用户进行了关于CAPTCHA的简要介绍,并要求用户填写一个网络表单,其中包含CAPTCHA的内容。通过网络表单,向用户提问诸如姓名、年龄、电子邮件、是否有视觉障碍等信息。从一组10个音频文件中,随机选择一个音频文件并呈现给用户。为了获得可用性问题的边界,要求用户填写由三个问题组成的反馈调查问卷,其中要求用户对本公开的包容性CAPTCHA给出1和5之间的评分,其中1是最低分,5是最高分。安全分析:CAPTCHA是由一些门户网站采用的机制,用于保护他们的网络应用程序免受诸如机器人bots,病毒等恶意程序的侵害。由机器学习算法支持的强大机器人有能力破解现有的音频CAPTCHA。然而,本公开的包容性CAPTCHA由图4的示例中的诸如音频文件的媒体文件组成,其是多个重叠语音对话和不同声音的组合。包容性CAPTCHA包括叠加有背景噪音的人类口语对话,其形式为与主题相关的人类声音和环境噪音。这些创建的音频CAPTCHA无法由测试用的现有技术通用自动语音识别引擎语音到文本转换器进行解码。下面的表1显示了从ASR获得的一些转录脚本transcripts。表1:ASR引擎和实际音频文件转录脚本的比较结果清楚地表明,从ASR获得的转录脚本完全不接近音频的实际脚本,由此证明本公开的包容性CAPTCHA是强大的,但是对于机器解码而言是困难的。定量分析:本公开的包容性CAPTCHA音频具有11秒的平均播放时间。CAPTCHA的可用性和可访问性根据以下指标进行衡量:·完成一项完整挑战的时间完成时间·用户的思考时间音频完成和直到用户输入其答复之间的持续时间·用户听音频以解答CAPTCHA的次数。用户能力分析:假设用户能够在第一次尝试中解答CAPTCHA,则被记录为成功的尝试。图5示出了具有不同能力的用户和使用根据本公开的实施例的包容性CAPTCHA的成功和失败尝试次数的图形表示。在所有用户中,86%119个中的103个成功尝试,使用屏幕阅读器的用户中有84%24个中的20个且非残疾主流用户中有88%能够在第一次尝试中完成挑战;然而,所有用户都能够完成任务成功率为100%,如图6所示,在图6中示出了具有不同能力的用户和成功完成根据本公开实施例的包容性CAPTCHA所做的尝试次数的图形表示。图5中的失败尝试表示在第一次尝试中未能解答CAPTCHA的用户的数量。但是,如图6所示,在两次或更多次尝试之后他们就能够完成CAPTCHA任务。如观察到的,在主流类别中没有用户需要第三次尝试,而在屏幕阅读器类别中只有一名用户需要第三次尝试。答复时间分析:下面的表2示出了在用户研究中由所有用户、主流用户和屏幕阅读器用户解答CAPTCHA所花费的平均答复时间的统计测量结果。表2:用于包容性CAPTCHA的时间答复比较所有用户主流用户屏幕阅读器用户平均答复时间31秒30秒38秒最短时间8秒8秒14秒最长时间142秒130秒142秒为了理解用户研究的所有参与者部分的答复时间的总体分布和变化,除了平均答复时间之外,还包括用于测量结果的盒型图boxplot。图7示出了具有不同能力的用户和用于完成根据本公开实施例的包容性CAPTCHA所用时间的盒型图形式的图形表示。该图清楚地显示,对于所有和主流用户来说,在下十五秒范围upperquartilerange和上十五秒范围的完成时间分数没有显著差异,但是更多数量的屏幕阅读器用户落在上十五秒范围。综上所述,屏幕阅读器用户花更多时间来答复CAPTCHA图7,但84%的用户在第一次尝试时就正确了没有关于包容性CAPTCHA的背景知识,并且多次使用时答复时间也缩短了。对于主流用户完成CAPTCHA测试的平均时间为30秒,最短为8秒;对于屏幕阅读器用户完成CAPTCHA测试的平均时间为38秒,最短为14秒,其小于65.64秒这是本领域中已知的完成ReCAPTCHA测试的平均时间,因此使其更加可用。音频文件明智分析:图8示出了根据本公开的实施例的用于包容性CAPTCHA的主流用户的音频文件明智分析的图形表示。如观察到的,超过85%的主流用户曾经播放过一次或两次音频。在图8中,音频8具有最多数量的只收听一次音频文件的用户。这清楚地表明该音频声音对人类有多清晰。图9示出了根据本公开的实施例的用于包容式CAPTCHA的屏幕阅读器用户的音频文件明智分析的图形表示。如观察到的,超过83%的屏幕阅读器用户曾经播放过一次或两次音频。这清楚地表明音频声音对屏幕阅读器用户有多清晰。下面的表3给出了比较包容性CAPTCHA和标准图像CAPTCHA的结果。表3:在主流用户之间比较包容性CAPTCHA和图像CAPTCHA。完成本公开的包容性CAPTCHA所花费的平均时间较高,但是观察到,包容性CAPTCHA所用的平均输入时间少于图像CAPTCHA,因为用户已经阅读了问题,收听了音频文件并且根据音频文件回答问题,从而减少了思考用于解答CAPTCHA的答案的认知负担。定性分析:最后,询问3个问题的反馈调查问卷,并且用户可以在1和5之间进行评分,其中1是最低分,5是最高分。下面的表4总结了用户给出的每个问题的平均得分,其描述了关于解决包容性CAPTCHA的总体经验的积极反馈。表4:所询问的反馈问题的平均分。因此,根据本公开,本文上面描述的系统和方法基于用户在日常生活中可能涉及的真实世界场景提供了包容性CAPTCHA,从而减少认知负担。安全测试的结果显示,本领域已知的自动引擎很难进行破解和解码。可访问性和可用性测试显示出积极的回应,易于使用且具有100%的任务成功率,并且参与的83%的屏幕阅读器用户在没有对本公开的包容性CAPTCHA经历任何初始培训的情况下在第一次尝试中就成功了。屏幕阅读器用户能够以38秒的平均时间完成任务,最短为14秒,这比以前的研究更短,从而使包容性CAPTCHA真正安全、可用并且可用于所有能力的用户。书面的说明书在此描述了主题以使本领域技术人员能够作出并使用本公开的实施例。这里所限定的主题实施例的范围可以包括本领域技术人员所想到的其他修改。如果具有与权利要求书的字面语言没有不同的相似元件或者如果包括与所述字面语言没有实质上不同的等价元件,这样的其他修改旨在属于所述范围内。这里所限定的主题实施例的范围可以包括本领域技术人员所想到的其他修改。如果具有与权利要求书的字面语言没有不同的相似元件或者如果包括与所述字面语言没有实质上不同的等价元件,这样的其他修改旨在属于所述范围内。虽然理解为保护范围被扩展到这样的程序且除了其中具有信息的计算机可读装置之外;当程序在服务器或移动设备或者任何合适的程序化设备上运行时,这样的计算机可读存储装置包含用于实施所述方法的一个或多个步骤的程序代码装置。硬件设备可以是可编程的任何类型的设备,其包括:例如,诸如服务器或个人计算机等任何类型的计算机等、或者两者的组合。该设备还可以包括可以是例如硬件装置的装置,所述硬件装置诸如是:例如,专用集成电路ASIC、现场可编程门阵列FPGA、或者硬件和软件装置的组合例如,ASIC和FPGA、或者至少一个微处理器和至少一个其中装有软件模块的存储器。因此,该装置可以包括硬件装置和软件装置两者。这里所述的方法实施例可以在硬件和软件中实施。该设备还可以包括软件装置。替代性地,本公开的实施例可以在不同的硬件装置上实施,例如使用多个CPU。这里的实施例可以包括硬件元件和软件元件。在软件中实施的实施例包括但不限制于固件、常驻软件、微码等。通过包括本公开的系统的多种模块执行并在此描述的功能可以在其他模块或其他模块的组合中实施。为了这个描述的目的,计算机可用的或计算机可读的介质可以是任何器件,其包括、存储、连通、传播、或传送程序以供使用,或者与指令执行系统、器件或设备连接。这里描述的多种模块可以被实施为软件模块和或硬件模块,并且可以被存储于任何类型的非暂时性计算机可读介质或其他存储设备中。非暂时性计算机可读媒体的某些非限制性示例包括CD、DVD、BLU-RAY、闪速存储器和硬盘驱动器。另外,虽然过程步骤、方法步骤、技术等可以按顺序描述,这样的过程、方法和技术可以被配置成以交替的顺序进行。换言之,可描述的步骤的序列或顺序没有必要表明所述步骤以该顺序执行的需求。这里所述的过程的步骤可以以任何实用的顺序来执行。另外,某些步骤可以被同时执行。列出所示步骤以解释所示的示例性实施例,并且应该预期的是,不间断的技术开发将改变执行特定功能的方式。为了说明的目的,这里呈现了这些示例,且这些示例不是限制性的。另外,为了方便表述,随意地限定功能性构建块的边界。只要其特定功能和关系被适当地执行,则可以限定替代性的边界。基于这里包含的教导,相关领域的技术人员将清楚地了解到替代性方案包括这里所公开的那些方案的等价、扩展、变型、偏差等。这些替代性方案落在所公开的实施例的范围和构思内。此外,词语“包括”、“具有”、“包含”和“含有”及其他类似形式在含义上等价并且是开放式的,即跟随这些词语的任一一个的项目或多个项目并不意味着是这样的项目或多个项目的详细清单,或者并不意味着仅限制于所列出的项目或多个项目。而且,必须注意的是,如这里和在所附权利要求书中所使用的,单数形式“一”、“一个”和“该”包括复数的引用,除非在上下文中另外清楚地指出。本公开和示例仅被认为是示例性的,且所公开的实施例的真实范围和构思由所附的权利要求书来指出。

权利要求:1.一种用于包容性CAPTCHA的处理器实施方法200,所述方法包括:响应对具有CAPTCHA的网页的用户请求,实时产生媒体文件,其中,产生的所述媒体文件的特征在于失真干扰以及对应于从与现实生活情境202相关的多个主题中选定的主题;为产生的所述媒体文件随机选择理解性问题作为所述CAPTCHA,所述理解性问题基于所述选定的主题、与请求所述网页的用户相关的地理位置以及产生的所述媒体文件的上下文,其中所述理解性问题与多个解决方案相关,所述多个解决方案对应于为所述选定的主题204产生的所述媒体文件;以及传送包括所述CAPTCHA206的网页;以及响应对所述理解性问题的用户输入,基于自主学习式CAPTCHA决策模块208智能地检测出是人类输入或机器输入。2.根据权利要求1所述的处理器实施方法,其中,产生的所述媒体文件是听觉形式或视觉形式的至少一种,以及相同形式但不同类型的两个或更多个媒体文件的组合、或者不同形式的两个或更多个媒体文件的组合,每个组合对应于所述选定的主题,以及其中,所述两个或更多个媒体文件的不同类型与所述媒体文件的环境信息和上下文信息相关。3.根据权利要求1所述的处理器实施方法,其中,响应对所述理解性问题的用户输入的步骤还包括:选择和传送用于所述选定的主题的至少一个替代的理解性问题。4.根据权利要求1所述的处理器实施方法,其中,传送包括所述CAPTCHA的网页的步骤包括:以视觉形式或听觉形式的至少一种呈现选定的理解性问题。5.根据权利要求1所述的处理器实施方法,其中,基于自主学习式CAPTCHA决策模块智能地检测出是人类输入或机器输入的步骤包括:在考虑拼写错误、不完全答复、语境转喻、同义词及其变体中的一个或多个的情况下,智能地比较所述用户输入与从所述自主学习式CAPTCHA决策模块的决策库得到的之前存储的用户输入;基于所述比较和其相关决策检测出是人类输入或机器输入;以及基于检测到的输入,借助所述用户输入和所述相关决策而动态地更新所述决策库。6.一种用于提供包容性CAPTCHA的系统100,包括:一个或多个硬件处理器104;以及一个或多个数据存储装置102,操作性地联接到所述一个或多个处理器104,用以存储被配置成用于通过所述一个或多个硬件处理器104执行的指令,所述指令被包括在以下中:CAPTCHA生成模块,被配置成:响应对具有CAPTCHA的网页的用户请求,实时产生媒体文件,其中,产生的所述媒体文件的特征在于失真干扰以及对应于从与现实生活情境相关的多个主题中选定的主题;为产生的所述媒体文件随机选择理解性问题作为所述CAPTCHA,所述理解性问题基于所述选定的主题、与请求所述网页的用户相关的地理位置以及产生的所述媒体文件的上下文,其中所述理解性问题与多个解决方案相关,所述多个解决方案对应于为所述选定的主题产生的所述媒体文件;以及传送包括所述CAPTCHA的网页;以及自主学习式CAPTCHA决策模块,被配置成:响应对所述理解性问题的用户输入,智能地检测出是人类输入或机器输入。7.根据权利要求6所述的系统,其中,产生的所述媒体文件是听觉形式或视觉形式的至少一种,以及相同形式但不同类型的两个或更多个媒体文件的组合、或者不同形式的两个或更多个媒体文件的组合,每个组合对应于所述选定的主题,以及其中,所述两个或更多个媒体文件的不同类型与所述媒体文件的环境信息和上下文信息相关。8.根据权利要求6所述的系统,其中,所述CAPTCHA生成模块还被配置成执行以下一个或多个:响应对所述理解性问题的用户输入,选择和传送用于所述选定的主题的至少一个替代的理解性问题;以及以视觉形式或听觉形式的至少一种呈现选定的理解性问题。9.根据权利要求6所述的系统,其中,所述自主学习式CAPTCHA决策模块被配置成通过以下内容而智能地检测出是人类输入或机器输入:在考虑拼写错误、不完全答复、语境转喻、同义词及其变体中的一个或多个的情况下,智能地比较所述用户输入与从所述自主学习式CAPTCHA决策模块的决策库得到的之前存储的用户输入;基于所述比较和其相关决策检测出是人类输入或机器输入;以及基于检测到的输入,借助所述用户输入和所述相关决策而动态地更新决策库。10.一种计算机程序产品,包括非暂时性计算机可读介质,所述非暂时性计算机可读介质具有在其中具体化的计算机可读程序,其中所述计算机可读程序在计算装置上被执行时,引起所述计算装置:响应对具有CAPTCHA的网页的用户请求,实时产生媒体文件,其中,产生的所述媒体文件的特征在于失真干扰以及对应于从与现实生活情境相关的多个主题中选定的主题;随机选定用于产生的所述媒体文件的理解性问题作为CAPTCHA,所述理解性问题基于所述选定的主题、与请求所述网页的用户相关的地理位置以及所产生的媒体文件的上下文;以及传送包括所述CAPTCHA的网页;以及响应对所述理解性问题的用户输入,智能地检测出是人类输入或机器输入。

百度查询: 塔塔咨询服务公司 用于包容性CAPTCHA的系统和方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。