党的二十大胜利闭幕后,航天科工集团208所人工智能与语言科技实验室第一时间组织对党的二十大报告多语版内容开展了语料库建设工作。随着《新时代的中国北斗》白皮书发布,语言实验室也同步进行了该文件术语语料的提取加工。
语言实验室本次以中、英、法、俄、德五个语种为主,进行了语料获取、语料清洗、语料对齐、术语提取等工作,初步形成党的二十大报告的中英、中法、中俄、中德系列语料库,以及《新时代的中国北斗》中英语料库及术语库,可导入多语智能翻译系统和文本分析工具中助力翻译工作和语言分析,后续将围绕语料标注、多语平行语料库构建开展相关工作。
该语言实验室是基于国家语言战略不断发展、智能科技广泛应用的背景下成立的,旨在创新开展智能科技引领下的翻译理论方法和实践范式研究,重点探索人工智能与翻译技术的深度融合与广泛应用,不断完善国防科技翻译体系,加强前沿技术赋能的语言能力建设。
此次术语语料库建设是该语言实验室在语言资产挖掘和管理方面的一次成功尝试,未来,语言实验室将在术语提取、语料标注、数据挖掘等方面持续发力,继续加强语言资产管理,打造高质量的多语言国防科技术语语料库,利用多语言智能翻译系统不断完善语言资产数据平台建设,从而为科技情报提供语言信息的强力支撑。
1
正威泰安金属新材料产业园项目:与上下游产业协同发展 助力新型工业化强市建设 2022-04-27
2
汉马动力实力诠释高油价时代下的“魔高一尺 道高一丈” 2022-04-01
3
首批新能源汽车动力蓄电池回收服务网点认证证书颁发 2022-02-25
4
陕鼓集团:奋楫笃行强劲韧性 长期业务续航未来 2022-01-12
5
徐工丝路电商带动中国制造“借船出海”,扬帆远航 2022-01-12
6
新一轮产业变革下潍柴路在何方?独家揭秘谭旭光“双轮驱动”战略 2022-01-12