买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:重庆邮电大学
摘要:本发明属于人工智能自然语言处理领域,具体涉及一种直白文本到反讽文本的文本风格转换方法及装置,包括:首先利用爬虫技术获得若干社交平台的评论数据,从中抽取具有明显情感倾向性的评论样本并打上标签,得到正负情感极性的平衡数据集,构建正负情感二分类的情感倾向性分类模型;基于正负情感二分类的情感倾向性分类模型构建模块构造名词‑形容词正负情感极性搭配表;然后通过转换模块对文本样本执行中心词与评价词的定位,并针对评价词进行正向情感极性替换;最后追加正向情感极性的评价句;本发明提出的方法适用于负面情感极性的文本,针对直白负面情感倾向性的文本进行风格转换,最终在不改变文本原意的前提下生成具有反讽内涵的文本。
主权项:1.一种直白文本到反讽文本的文本风格转换方法,其特征在于,包括以下步骤:步骤1:利用爬虫技术获得若干社交平台的评论数据,从中抽取具有明显情感倾向性的评论样本并打上标签,构建正负情感极性的平衡数据集,根据平衡数据集构建正负情感二分类的情感倾向性分类模型;步骤2:基于正负情感二分类的情感倾向性分类模型构造名词-形容词正负情感极性搭配表;步骤2.1:利用爬虫技术获得若干社交平台评论数据并进行预处理,去掉无意义的符号和空格后,进行分词;步骤2.2:利用词嵌入技术将预处理后的数据转换为文本张量;步骤2.3:将文本张量输入至正负情感二分类的情感倾向性分类模型,得到数据的正负情感极性标签;步骤2.4:利用词性标注和句法依存分析技术对评论数据进行句式结构识别,提取构成主谓结构或偏正结构的名词与形容词搭配,并根据所述正负情感极性标签统计每对名词与形容词搭配的文本情感极性频次,正向频次记为Freqpos,负向频次记为Freqneg;步骤2.5:计算Freqpos与Freqneg的比值,若大于1,则将该名词与形容词搭配标记为正向情感极性的搭配;若小于1,则将该名词与形容词搭配标记为负向情感极性的搭配;若等于1,则由人工确定该搭配的情感极性;步骤2.6:将每对情感极性搭配以结构化的形式存入名词-形容词正负情感极性搭配表;步骤3:对输入的文本样本进行预处理;步骤3.1:清理输入的文本样本,删除无意义的符号与空格;步骤3.2:对经过步骤3.1处理后的文本样本进行分词;步骤3.3:识别每条分词处理后的文本样本的情感类别,包括正向情感和负向情感,只有负向情感的输入文本才可以执行后续步骤实现反讽风格文本转换;步骤4:根据名词-形容词正负情感极性搭配表判断文本样本的情感类别,若文本样本的情感类别为负向情感,则对预处理后的文本样本执行中心词与评价词的定位,针对评价词进行正向情感极性替换,替换后计算整句困惑度并将困惑度最低的文本保留;步骤4.1:利用词性标注和句法依存分析技术分析预处理后的文本,提取构成主谓关系和偏正关系的名词与形容词搭配,将名词视为中心词,对应的形容词视为评价词;步骤4.2:利用名词-形容词正负情感极性搭配表中的评论数据搭配的结构化形式判断步骤4.1中定位出的中心词与评价词搭配的情感极性,若为负向情感搭配,则检索能与该中心词搭配的正向情感搭配形容词列表,依次分别替换原始的评价词,并按照语言困惑度公式分别计算替换后的整句困惑度,将困惑度最低的文本保留;语言困惑度评分公式为: 其中,s表示替换后的文本,wi表示文本的第i个词语,D表示本地的语料库,countwi,D表示词语wi在语料库D中的出现频数,countwi-1wi,D表示前一个词是wi-1的情况下,wi在语料库D中的出现频数,Ps表示句子的困惑度,δ表示防止0概率问题的平滑参数,L为文本长度;步骤5:对困惑度最低的文本追加正向情感极性的评价句并输入至正负情感二分类的情感倾向性分类模型,完成直白文本到反讽文本的文本风格转换;步骤5.1:人工构造若干条可以用于任何对象的通用正向评价句;步骤5.2:将步骤5.1构造的正向评价句添加至得分最高的文本的末尾,分别得到若干条追加后的文本,并分别输入至正负情感二分类的情感倾向性分类模型,输出对应文本的情感标签以及置信度,并记录该文本的情感标签和置信度;置信度计算公式为: 其中,yi代表正负情感二分类的情感倾向性分类模型产生的原始输出,i代表原始输出对应情感标签类别,e代表自然底数,n为标签总数量,Cyi代表将yi映射至[0,1]从而得到置信度;步骤5.3:将使模型输出情感标签为正向的文本保留,作为最终的反讽风格文本,如果有若干个输出文本的情感标签为正向,则保留对应正向标签的置信度最大的文本;如果所有输出文本的情感标签都为负向,则保留对应负向标签的置信度最小的文本。
全文数据:
权利要求:
百度查询: 重庆邮电大学 一种直白文本到反讽文本的文本风格转换方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。