首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于语料处理技术的中韩翻译系统_吉林农业科技学院_202211571433.3 

申请/专利权人:吉林农业科技学院

申请日:2022-12-08

公开(公告)日:2024-06-04

公开(公告)号:CN115828940B

主分类号:G06F40/58

分类号:G06F40/58;G06F40/30

优先权:

专利状态码:有效-授权

法律状态:2024.06.04#授权;2023.04.07#实质审查的生效;2023.03.21#公开

摘要:本发明涉及翻译领域,公开了一种基于语料处理技术的中韩翻译系统,包括翻译机,翻译机上安装有主屏和副屏,主屏固定安装在翻译机的正面,副屏活动安装在翻译机背面;翻译机包括:语音拾取模块,用于拾取待翻译语音,并对语音进行降噪除杂处理;转换模块,用于将语音信息转换为文字信息,并将文字信息显示在主屏或副屏上,文字信息中包括同音字或词以及近似音的字或词;以及纠错模块、翻译模块和语音播放模块,本发明能够实现对拾取的语音信息进行纠错校正,确保翻译的语义正确,能够基于语料处理技术,选择合适的语式和常用的语句翻译目标语言,使得翻译的目标语言,语义准确,表达生动。

主权项:1.一种基于语料处理技术的中韩翻译系统,其特征在于,包括翻译机(100),翻译机(100)上安装有主屏(110)和副屏(120),主屏(110)固定安装在翻译机(100)的正面,副屏(120)活动安装在翻译机(100)背面;翻译机(100)包括:语音拾取模块,用于拾取待翻译语音,并对语音进行降噪除杂处理;转换模块,用于将语音信息转换为文字信息,并将文字信息显示在主屏(110)或副屏(120)上,文字信息中包括同音字或词以及近似音的字或词;纠错模块,用于接受主屏(110)或副屏(120)点击信号,并根据点击信号,选择对应的字或词,纠正文字信息,并将主屏(110)或副屏(120)上未被点击的字或词或标点符号消除,并显示在主屏(110)上;翻译模块,接收纠正之后的文字信息,翻译出对应的语音信息;语音播放模块,用于播放翻译之后的语音信息;翻译模块的翻译方法包括如下步骤:S1:获取文字信息,并按照预存的标准语式进行分词,得到字词信息表;S2:获取输入的字词信息表,统计汇总字词,根据字词出现的频率对字词增加相应的权重,以及对字词信息表进行属性处理;S3:根据汇总的字词,在语料库中检索出对应的韩文或中文字词;S4:根据检索出的字词,并筛选出唯一语式,然后按照与分词时语式标准对应的目标语言语式进行组句;S5:将得到的目标语句在语料库中检索出对应的标准语句集,该标准语句集包括标准语句和与该标准语句语义相同的常用语句;S6:根据筛选出语式和使用者的语言习惯选择与该标准语句语义相同的常用语句;S7:输出选出的语句;在步骤S1中,对文字信息进行分词的步骤如下:S11:对文字信息的语式进行分析,得到文字信息的语式分析结果,该语式分析结果至少包括一种预存的标准语式;S12:根据分析得到的语式,对该文字信息进行分字和或词,每种语式得到一组字和或词;S13:将每组字和或词编为一条字词信息表;在步骤S2中,汇总之后的字词,在字词信息表中出现的频率越高,其对应的权重就越高,字词信息表的属性包括每条字词信息表中各字和或词的属性;在步骤S3中,在语料库中包括若干组中文和韩文相对应的字和词相对应的翻译集,在语料库中检索出字或词对应的翻译集,并提取翻译集中对应的目标语言的字词;在步骤S4中,根据字词表中字词权重和字词属性重复次数,筛选出权重占比最多,字词属性重复次数最多的字词信息表,提取出该字词信息表对应的语式;在步骤S4中,语式标准包括中文语式标准和韩文语式标准,语式标准存储在语料库中,语料库中还包括若干语式集,该语式集为相互匹配的中文语式标准和韩文语式标准的集合,根据步骤S11中分析出的语式,在语料库中,检索出对应的语式集,并将目标语言的语式标准提取出来,然后将翻译之后的字词按照目标语言的语式标准进行组合;在步骤S5中,标准语句集为语式-标准语句-语义相同的常用语句的映射集;在步骤S6中,首先根据语式在语料库中筛选出相同语式的标准语句集,然后提取出该标准语句集中的标准语句,然后,将标准语句逐个与目标语句比对,找出相似度最高的标准语句,然后将该标准语句对应的常用语句提取出来,根据使用者的语言习惯,筛选出适合的常用语句;使用者的语言习惯通过记录使用者的语言记录,并进行机器记录学习得到。

全文数据:

权利要求:

百度查询: 吉林农业科技学院 一种基于语料处理技术的中韩翻译系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。