机器翻译的现状
神经机器翻译(NMT)在过去5年取得了突破。DeepL、Google神经机器翻译和Yandex翻译使用基于Transformer的模型,考虑整个句子甚至段落的上下文。欧洲语言对(英德、英法)的质量按BLEU指标接近85-90%。
但指标是平均值。它们掩盖了关键失误:机器可能完美翻译了10个句子中的9个,但第10个出现的错误足以颠覆文件的含义。
何时可以使用机器翻译
大意了解(gisting)。员工需要了解外国合作伙伴来信的要点或浏览国外文章。措辞精确性不重要——重要的是整体含义。MT可以胜任。
内部通信。企业聊天、内部说明、备忘录——如果文件不出公司范围,机器翻译可以节省时间。
大批量初筛。公司需要浏览500页技术文档并选出50页相关内容。MT可以快速筛选,仅对选出的部分订购专业翻译。
用户生成内容。电商平台评价、社交媒体评论、技术支持工单——翻译粗糙是可以接受的。
何时不能使用机器翻译
法律文件。合同、公司章程文件、法院判决。一个翻译错误的情态词(shall/may/will)就能改变各方的义务。MT经常混淆这些结构。
医学文件。药品说明书、临床试验方案、出院记录。剂量、有效成分名称或禁忌症的错误可能危及患者生命。
需要公证的文件。证书、学历、政府文件。公证员认证的是合格翻译人员的签名——机器翻译无法进行公证。
营销和广告材料。机器适配的广告语好的情况下听起来别扭,糟的情况下冒犯目标受众。文化适配超出MT的能力范围。
专利文件。专利权利要求是具有法律意义的文本。不精确的翻译会缩小或扩大专利的法律保护范围。
PEMT:折中方案
PEMT(机器翻译后编辑)是由专业翻译人员编辑机器翻译结果。分两个级别:
- 轻度PEMT——快速修改:纠正严重错误,核实含义。适用于信息类材料、技术描述。费用:全价翻译的50-60%。
- 完整PEMT——深度编辑:风格、术语、语法、自然度。效果与专业翻译相当。费用:全价翻译的70-80%。
我们为50页以上的技术文本提供PEMT服务,此时节省效果明显。对于法律和医学文件,我们不使用PEMT——风险不值得节省。
MT引擎比较:DeepL、Google、Yandex
根据我们的内部评估(2,500个测试片段,8个语言对,2024年):
- DeepL——欧洲语言对效果最佳(EN-DE、EN-FR、EN-ES)。风格自然,上下文处理好。亚洲语言较弱。
- Google翻译(NMT)——语言覆盖最广(130多种)。质量稳定在中等水平。稀有语言对的最佳选择。
- Yandex翻译——RU-EN和RU-DE语言对效果最佳。处理俄语句法良好。语言种类有限。
没有任何引擎能对法律、医学和高度专业术语提供稳定的质量。每次测试中,10-15%的片段包含关键错误。
如何选择:客户清单
- 文件是否将在公司外部使用?是→专业翻译。
- 错误是否可能导致财务或法律后果?是→专业翻译。
- 文件是否需要公证?是→仅限专业翻译。
- 50页以上的技术主题?考虑PEMT。
- 内部使用、一般了解?MT可以接受。
不确定哪种方案适合?将文件发给我们——我们免费评估难度并建议最优方案。笔译每页450卢布起,PEMT每页250卢布起。签订合同,简易税制(免增值税),提供结算文件。