专利名称:一种多领域机器翻译网络训练方法及系统专利类型:发明专利发明人:陈巍华
申请号:CN202010719198.4申请日:20200723公开号:CN112115725A公开日:20201222
摘要:本发明提供了一种多领域机器翻译网络训练方法及系统,所述方法执行以下步骤:将领域标志信息融合到多领域训练数据中;将融合的多领域训练数据分批次传入神经网络进行交替训练,得到交替数据流;生成具有领域嵌入层的端到端的翻译网络;基于所述交替数据流,对所述具有领域嵌入层的端到端的翻译网络进行训练,得到具备多领域翻译能力的多领域翻译网络模型。根据本发明的方法,使用多领域批交替训练的方法能有效缓解训练数据分布不均匀的情况,保证每个领域都能同时训练,这样可以提升各个领域的翻译效果;由于在领域批交替训练的过程中,基础领域和垂直领域是同时训练的,因此能有效缓解基础领域翻译效果的降低。
申请人:云知声智能科技股份有限公司,厦门云知芯智能科技有限公司
地址:100000 北京市海淀区西三旗建材城内1幢一层101号
国籍:CN
代理机构:北京冠和权律师事务所
代理人:安琪
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- sceh.cn 版权所有 湘ICP备2023017654号-4
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务