国际商务财会

中国语言文字论文_基于风格感知的无监督领域

 

文章摘要:近年来,神经机器翻译的译文质量取得了显著的进步,但是其在训练过程中严重依赖平行的双语句子对。然而对于电子商务领域来说,平行资源是稀缺的,此外文化的不同导致产品信息表达存在风格差异。为了解决这两个问题,提出了一种基于风格感知的无监督领域适应算法,该算法在互训练方法中充分利用电子商务单语数据,同时引入拟知识蒸馏的方法处理风格差异。通过获取电商产品数据信息构建非平行双语语料,基于该语料以及中英新闻平行语料进行多组实验,结果表明相比于各种无监督领域适应方法该算法显著提高了翻译质量,较最强的基线系统提高了约5个BLEU点。此外将该算法在Ted,Law和Medical OPUS 3类数据上进一步拓展应用,均取得了更佳的翻译效果。

文章关键词:机器翻译,无监督,领域适应,风格感知,电子商务,

项目基金:国家自然科学基金(61673289),

论文作者:宁秋怡 史小静 段湘煜 张民 

作者单位:苏州大学计算机科学与技术学院 

论文分类号: H085;TP391.2

相似文献:基于枢轴语言的汉越神经机器翻译伪平行语料生成.....作者:贾承勋,赖华,余正涛,文永华,于志强,刊载期刊:《计算机工程与科学》
面向维汉神经机器翻译的双向重排序模型分析.....作者:张新路,李晓,杨雅婷,王磊,董瑞,刊载期刊:《北京大学学报(自然科学版)》
基于篇章上下文的蒙汉神经机器翻译方法.....作者:高芬,苏依拉,仁庆道尔吉,刊载期刊:《计算机工程与应用》
带标记音节的双向维汉神经机器翻译方法.....作者:艾山·吾买尔,斯拉吉艾合麦提·如则麦麦提,西热艾力·海热拉,刘文其,吐尔根·依布拉音,汪烈军,瓦依提·阿不力孜,刊载期刊:《计算机工程与应用》
融入语言差异化特征的汉越神经机器翻译译文质量估计.....作者:邹翔,朱俊国,高盛祥,余正涛,杨福岸,刊载期刊:《小型微型计算机系统》
基于多语言联合训练的汉-英-缅神经机器翻译方法.....作者:满志博,毛存礼,余正涛,李训宇,高盛祥,朱俊国,刊载期刊:《清华大学学报(自然科学版)》
基于变分信息瓶颈的半监督神经机器翻译.....作者:于志强,余正涛,黄于欣,郭军军,高盛祥,刊载期刊:《自动化学报》
融合单语语言模型的汉越伪平行语料生成.....作者:贾承勋,赖华,余正涛,文永华,于志强,刊载期刊:《计算机应用》
基于图割精细化和可微分聚类的无监督显著性目标检测.....作者:李小雨,房体育,夏英杰,李金屏,刊载期刊:《计算机应用》
信息传递增强的神经机器翻译.....作者:史小静,宁秋怡,季佰军,段湘煜,刊载期刊:《计算机工程与科学》

相关文章:新时期汉语二语教学的学科建设与发展.....作者:张新生
汉字能力的时代嬗变与国际汉语课程体系的因应发展.....作者:储诚志
建设华语教学作为独立学科的观想与现实.....作者:信世昌
汉语二语教育学科建设的宏观思考.....作者:崔永华
汉语二语协力组合教学模式:在线全球互动+线下本土实践.....作者:吴英成
如何在汉语二语教育的学科发展中汲取最新知识养分.....作者:刘宏超
大数据的技术创新和应用—以人口普查为例.....作者:冯乃林
大数据融合应用技术框架与行业应用.....作者:段飞虎