买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:腾讯美国有限责任公司
摘要:用于训练模型以执行端到端字符到音素C2P转换的系统和方法包括:从第一数据源中选择多个未标记的句子;从第二数据源中选择多个已标记的句子;对所选择的未标记的句子和已标记的句子的组合语料库进行预处理以提取多个语言特征;通过基于所提取的多个语言特征自动标记预处理的语料库中的令牌来生成混合训练数据;以及使用混合训练数据来训练预训练模型以执行端到端C2P转换。
主权项:1.一种用于训练模型以执行端到端字符到音素C2P转换的方法,其特征在于,所述方法由至少一个处理器执行,并且包括:从第一数据源中选择多个未标记的句子;从第二数据源中选择多个已标记的句子;对所选择的未标记的句子和已标记的句子的组合语料库进行预处理以提取多个语言特征;通过基于所提取的多个语言特征自动标记预处理的语料库中的令牌来生成混合训练数据;以及使用所述混合训练数据来训练预训练的模型以执行端到端C2P转换。
全文数据:
权利要求:
百度查询: 腾讯美国有限责任公司 用于字符到音素转换的系统和方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。