买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:贵阳朗玛信息技术股份有限公司
摘要:本发明公开了一种朗读流式Markdown文本并跟踪显示朗读进度的方法,包括:对Markdown文本流式解析,提取完整块级元素;将Markdown块级元素文本转换HTML文本,提取用于显示的文字内容,构建第一序列,按顺序串联所述第一序列中的文字,得到语音合成需要的文字;根据得到的文字内容合成语音,获得若干组语音合成文件及其元信息;根据所述第一序列和语音合成文件的元信息计算语音合成所用文字及发音字词在HTML文本中的位置;播放合成语音并根据进度控制当前朗读的段落及字词高亮显示。将该方法应用于实时生成的流式Markdown文本朗读,解决了现有通用语音合成服务会将Markdown格式符号当做文字内容进行语音合成的问题,实现了Markdown文本快速渲染和根据朗读进度高亮显示朗读段落和字词的功能。
主权项:1.一种朗读流式Markdown文本并跟踪显示朗读进度的方法,其特征在于,包括:对Markdown文本流式解析,提取完整块级元素;将Markdown块级元素文本转换为HTML文本,提取用于显示的文字内容,构建第一序列,按顺序串联所述第一序列中的文字,得到语音合成需要的文字内容;根据得到的文字内容合成语音,获得若干组语音合成文件及其元信息;语音合成文件指:语音合成模块生成的音频;元信息指:合成语音所使用的文字,各个发音字词在合成所用文字中的位置、发音起始时间、持续时间;根据所述第一序列和语音合成文件的元信息计算语音合成所用文字及发音字词在HTML文本中的位置,包括:句子查找和发音字词查找;句子查找指:根据所述语音合成文件的元信息,逐字查找语音合成所用句子字符在所述第一序列中各元素文字块中的位置,进而得到该字符在HTML文本中的位置,形成第二序列,所述第二序列以JSON格式记录;发音字词查找指:根据所述语音合成文件的元信息,获得发音字词字符在句子中的位置,再根据所述第二序列中句子字符在HTML文本中的位置,得到发音字词字符在HTML文本中的位置;播放合成语音并根据进度控制当前朗读的段落及字词高亮显示,包括:客户端接收合成语音文件和朗读进度控制信息、播放合成语音文件、界面渲染Markdown块级元素转换得到的HTML文本;根据音频播放进度,控制客户端界面高亮显示当前正在朗读的句子和发音字词;高亮字符用span标签包裹,设置css样式以突出显示;先对句子字符添加span标签,再对发音字词字符添加span标签;字词样式在内侧,优先级高于句子样式;其中,计算语音合成所用文字及发音字词在HTML文本中的位置后,在所述播放合成语音并根据进度控制当前朗读的句子及字词高亮显示之前对控制显示所需的信息进行整合,把语音合成文件及其元信息、句子字符在HTML文本中的位置、发音字词在HTML文本中的位置组装成JSON格式协议数据传递给应用客户端;协议数据包括:句子序号、Markdown块级元素转换得到的HTML文本、语音合成文件、音频时长、句子边界数组、发音字词边界数组;句子边界数组指:句子字符在HTML文本中的位置信息;发音字词边界数组指:发音字词字符在HTML文本中的位置信息,以及该发音字词的发音起始时间、持续时间。
全文数据:
权利要求:
百度查询: 贵阳朗玛信息技术股份有限公司 一种朗读流式Markdown文本并跟踪显示朗读进度的方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。