一种基于算法模型的演讲文稿生成方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：京华信息科技股份有限公司

摘要：本发明提供了一种基于算法模型的演讲文稿生成方法及系统，包括：获取训练时的第一演讲音视频文件，并对第一演讲音视频文件解析，第一图像结果和音频结果；除去第一图像结果的背景，并对得到待检测第一图像结果进行分类，得到文字区、表格区和图片区；根据初始的第一增强权重对分类结果进行增强，得到增强特征，并获取对应的扩写文本，将扩写文本作为第一孪生网络模型输入；对音频结果进行识别，得到演讲人的演讲文本，并将演讲文本作为第一孪生网络模型的第二个输入进行训练，得到训练好的第二扩写网络模型后对测试时的演讲素材，生成演讲文稿；采用本发明能够提高扩写文本有侧重的生成质量。

主权项：1.一种基于算法模型的演讲文稿生成方法，其特征在于，包括：获取训练时的第一演讲音视频文件，并对所述第一演讲音视频文件解析，得到第一音视频结果，并对所述第一音视频结果进行预处理，得到第二音视频结果；其中，所述第二音视频结果包括：若干帧的第一图像结果和音频结果；根据所述第一图像结果的灰度直方图，生成第一掩膜图层，并根据所述第一掩膜图层除去所述第一图像结果的背景，得到以灰度图显示的待检测第一图像结果，对所述待检测第一图像结果进行分类，得到文字区、表格区和图片区；根据初始的第一增强权重对所述文字区、所述表格区和所述图片区对应的特征做相同的增强，得到增强特征，并将所述增强特征作为初始的第一扩写网络模型的输入，将输出的扩写文本作为初始的第一孪生网络模型的第一输入；根据训练好的第一语音识别网络模型对所述音频结果进行识别，得到演讲人的演讲文本，并按照所述增强特征对应的时段，从所述演讲文本中截取目标演讲片段，将得到的演讲片段作为标签输入到所述第一孪生网络模型的第二输入中；根据所述第一孪生网络模型，分别得到所述第一输入的特征意图评分和所述第二输入的标签意图评分，根据所述特征意图评分与所述标签意图评分，得到第一损失函数，并根据所述第一损失函数对所述第一孪生网络模型和所述第一扩写网络模型进行训练；其中，同时根据所述特征意图评分与所述标签意图评分对所述第一增强权重进行更新，以使下次训练时，以更新后的第二增强权重进行特征增强；经过若干次训练后，得到训练好的第二扩写网络模型，并根据所述第二扩写网络模型对测试时的演讲素材，生成演讲文稿。

全文数据：

权利要求：

百度查询：京华信息科技股份有限公司一种基于算法模型的演讲文稿生成方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种便于升降的一体机

下一篇：一种便于清理的聚氨酯烘箱

相关技术

一种便于升降的一体机

一种便于清理的聚氨酯烘箱

一种大板式正压医疗舱

一种建筑施工建筑网

一种再生资源回收装置

一种锥齿轮防尘润滑装置

一种具有接料底的污水自动过滤箱装置

一种垂直起降固定翼无人机

一种防结块的色母粒转运工装

一种混凝土地面浇水养护装置

一种节能注塑机余料回收装置

一种电凝冲吸器

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于算法模型的演讲文稿生成方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务