一种基于质量和韵律特征融合的古诗词朗读评估方法

导航：龙图腾网> 最新专利技术> 一种基于质量和韵律特征融合的古诗词朗读评估方法

申请/专利权人：天津大学

申请日：2022-08-18

公开（公告）日：2024-05-14

公开（公告）号：CN115359782B

主分类号：G10L15/01

分类号：G10L15/01;G10L15/02;G10L15/16;G10L15/18

优先权：

专利状态码：有效-授权

法律状态：2024.05.14#授权;2022.12.06#实质审查的生效;2022.11.18#公开

摘要：本发明提出一种基于质量和韵律特征融合的古诗词朗读评估方法，包括建立基于MOS的客观语音质量评价模型，提取mel频谱特征，mask_res残差卷积网络提取信号高维度特征，UnMask输出模块聚合单个古诗词朗诵的MOS评分；建立基于特征融合韵律评价模型，提取基频、能量、过零率等信号基本特征，通过多特征分析模型，计算为轻重音、语调、节奏韵律特征参数，建立韵律评分函数，映射实际韵律得分；建立基于多项式拟合的综合度量体系基于最优解和最小化模型的目标，构建基于质量和韵律特征融合的无参考评价模型。

主权项：1.一种基于质量和韵律特征融合的古诗词朗读评估方法，其特征在于：包括如下步骤：（1）建立基于MOS的客观语音质量评价模型，通过提取mel频谱特征，用mask_res残差卷积网络提取信号高维度特征，在UnMask输出模块聚合单个古诗词朗诵的MOS评分；具体包括如下步骤：（11）特征提取，从输入信号中计算梅尔子帧，划分重叠段，补齐不同语音片段的长度，通过神经网络学习得到语谱图特征；（12）质量分析，根据步骤（11）得到的语谱图特征进行质量分析，以梅尔子帧为输入进行特征降维，对语音序列进行预测，具体为：使用残差卷积层网络提取高维度特征，在BasicBlock中向下卷积，实现3次特征降维，然后通过全连接层输出，设定输出特征维度为20，通过view实现输出扁平化；（13）自UnMask输出，根据步骤（12）得到的高维度特征进行UnMask输出，语音时间根据复原特征长度，特征聚合，估计出单个MOS值，具体为：首先根据之前记录的原始长度，得到UnMask掩膜并与特征向量对应位置上的unmask值相乘，完成去零操作，得到实际语音段长，然后通过最大池化层，对每个有效特征向量，取所有特征数的最大值，得到单个语音的MOS评分输出；（2）建立基于特征融合韵律评价模型，通过提取信号基本特征，按照多特征分析方法转化为轻重音、语调、节奏韵律特征，通过韵律评分函数映射为实际韵律得分；具体包括如下步骤：（21）韵律特征提取，对输入进行分帧，使用矩形窗，取N为0.05倍的采样率，计算古诗词的短时平均幅度函数、基音曲线，并提取函数曲线中的每个峰值，得到峰值的相对标准差，计算基频，并估计每一帧的倒谱，使用均值滤波平滑基频曲线，并微调阈值参数以标记主峰；（22）多特征分析，根据步骤（21）得到的韵律特征，计算特征参数，计算短期平均幅度的每个峰值的标准偏差，以反映声音的重音变化；计算每个相邻峰值时间间隔的相对标准差参数，以反映语音节奏特征；计算每个峰的相对标准差参数，反映读者对语调的处理方式；计算一首诗词中每个单词的音节长度的相对标准偏差，以反映音节的停顿或延长；计算静音时间，以反映朗读的停顿是否合理；（23）韵律评分模型，根据步骤（22）得到的特征参数，使用评分公式映射实际韵律评价分数：；；其中是对应特征参数的量化值，是映射分数的放大系数；将阅读样本的特征参数转化为百分制分数，根据最佳阅读样本的实验值制定参考值，对样本的不同特征打分，取其加权平均作为最终得分；（3）针对上述两个评价模型，基于多项式拟合建立基于质量和韵律特征融合的无参考古诗词朗读评估模型，利用该模型进行评分。

全文数据：

权利要求：

百度查询：天津大学一种基于质量和韵律特征融合的古诗词朗读评估方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：电池的装配结构、圆柱电池、电池模组和电池包

下一篇：一种连续制备五氯化磷的装置

相关技术

电池的装配结构、圆柱电池、电池模组和电池包

一种连续制备五氯化磷的装置

一种细分子印刷喷粉加工用研磨装置

一种零部件加工的表面喷漆装置

一种液体沥青取样装置

一种配电网规划用的智慧配电网架

一种新型全遮光窗帘面料

一种机罩

一种巡检方便的电容补偿柜

气动搬运平台

一种圆管弯曲成型装置

一种实时监测并控制化锡线硫化氢气体的装置

古诗词相关技术

一种诗词生成方法、装置、电子设备及可读存储介质_网易(杭州)网络有限公司_202010712561.X

诗词内容的生成方法、装置、终端及存储介质_平安科技(深圳)有限公司_201811520555.3

一种无监督的非自回归古诗生成方法、装置及存储介质_浙江香侬慧语科技有限责任公司_202110101971.5

古诗词生成方法、装置、设备及存储介质_北京搜狐互联网信息服务有限公司_201910987761.3

古诗文主观题自动评分方法_北京工业大学_202110877661.2

诗词生成方法及装置、电子设备、存储介质_北京小米松果电子有限公司_202010231975.0

一种基于质量和韵律特征融合的古诗词朗读评估方法_天津大学_202210989714.4

一种用于古诗词情感分析的知识图谱构建方法_西北大学_202410254065.2

模型训练及古诗生成方法、古诗生成装置、设备和介质_爱驰汽车有限公司_201911258834.1

语文教学用古诗学习装置_河南建筑职业技术学院_202322399963.0

融合相关技术

新型融合蛋白和用于预防或治疗癌症的包含该融合蛋白的药物组合物_古德T细胞有限公司_201980028463.X

基于模糊粗糙集的数据分级融合方法_大连理工大学_202410448720.8

基于“算测融合”的导弹数字孪生建模方法_大连理工大学_202410451810.2

多视频流融合方法、电子设备、存储介质_北京大视景科技有限公司_202010922428.7

用于车辆导航的雷达-摄像头融合_移动眼视觉科技有限公司_202280076986.3

基于微光+彩色可见光融合图像的方法_北京晶品特装科技股份有限公司_202410258993.6

椎间融合器显影丝压装系统_宁波华科润生物科技有限公司_202321970013.2

一种椎板间支撑、固定、融合装置_北京大学第三医院(北京大学第三临床医学院)_201910768087.X

运行程序的融合方法及设备_青岛海尔洗衣机有限公司_202211693392.5

TGF-β受体胞外域融合分子及其用途_加拿大国家研究委员会_202410363517.0

朗读相关技术

屏幕朗读模式下的文本编辑方法及电子设备_华为技术有限公司_202410385592.7

一种朗读亭隔音结构_湖北鼎森智能科技有限公司_202323061223.2

一种英语学习朗读隔音装置_黑龙江职业学院(黑龙江省经济管理干部学院)_202322306831.9

朗读评测方法、装置、设备、存储介质及计算机程序产品_科大讯飞股份有限公司_202410151287.1

屏幕朗读方法、装置_南京伟柏软件技术有限公司_202210733636.1

随选朗读方法及电子设备_荣耀终端有限公司_202211459360.9

文字朗读方法、装置、终端及存储介质_OPPO广东移动通信有限公司_202110697342.3

一种基于质量和韵律特征融合的古诗词朗读评估方法_天津大学_202210989714.4

一种朗读质量监测器_汉得利(常州)电子股份有限公司_202410098871.5

一种视频合成方法、装置、设备、朗读亭和存储介质_科大讯飞股份有限公司_202311708272.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于质量和韵律特征融合的古诗词朗读评估方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务