2025年机器翻译现状
过去两年,神经翻译质量实现了堪比2016年从统计模型向神经模型转变的飞跃。主要参与者:
- DeepL——欧洲语言质量领先。支持33种语言。EN↔DE语言对在72%的情况下错误率与人工翻译持平(BLEU+人工评估数据)。
- GPT-5和Claude——大型语言模型(LLM)在翻译具有复杂上下文的文本时表现出色。能理解讽刺、文化引用和风格细微差别。但会产生"幻觉"——添加原文中没有的信息。
- Yandex翻译——俄语最强模型,特别是RU↔EN、RU↔ZH、RU↔TR语言对。与Yandex云的集成对俄罗斯企业客户很方便。
- Google翻译(Gemini)——243种语言,主流语言质量稳定,在稀有语言对和专业术语方面表现较弱。
神经网络擅长的领域
我们在真实订单上测试了所有主要引擎——500篇不同主题文本,总计200万字符。结果:
高质量(最少修改):
- 一般商务通信——错误不到5%的片段
- 电商产品描述——提供上下文时结果稳定
- 新闻文本——神经网络达到初级翻译水平
- 软件界面(有上下文的短字符串)——高达85%的片段无需修改
中等质量(需要编辑):
- 技术文本——神经网络混淆拼写相似的术语,忽视标准化术语
- 营销文本——直译扼杀了情感冲击力和创意
不可接受的质量(需完全返工):
- 法律合同——神经网络不考虑目标语言的法律体系
- 医学文件——剂量和诊断中存在严重危险的错误
- 文学文本——丧失作者风格、语调和节奏
PEMT:神经网络如何用于翻译
PEMT(机器翻译后编辑)不是"按个按钮就得到翻译"。这是一个完整的生产流程:
- 文本分析。项目经理评估主题、篇幅、质量要求,决定PEMT是否适用于该订单。
- 机器翻译。文本通过一个或多个引擎(DeepL、Google NMT等)处理。
- 后编辑。专业翻译人员修正机器翻译:修正术语、文体、语义错误,检查数字。
- 质量控制。审校编辑按ISO 17100清单审核最终版本。
PEMT将笔译成本降低20-35%,交付周期缩短30-50%。但并非适用于所有文本类型——法律文件、公证翻译和创意文本仅由人工翻译。
AI力所不及时:5个真实失败案例
来自我们的实践:
1. 医疗器械说明书。DeepL将"apply pressure"翻译为"施加压力"而非"按压"。在止血的语境下——这是致命错误。
2. 供货合同。GPT-4翻译"Force Majeure clause"时遗漏了完全改变风险分配的法律措辞。
3. 营销口号。Yandex翻译将"Think different"直译——技术上正确,但失去了所有营销冲击力。
4. 财务报表。Claude将"accrued liabilities"翻译为非标准术语,不符合IFRS公认术语。
5. 专利申请。所有测试引擎均未能翻译专利权利要求——这是一种对句法有严格要求的特殊法律文体。
2025-2026年趋势:预期展望
基于我们的观察和行业研究(GALA、TAUS、Slator):
- 定制语言模型——企业用自有数据训练LLM。狭窄领域的翻译质量接近人工水平。
- 多模态——翻译图片、视频、VR界面中的文字。网站本地化超越了纯文本范畴。
- 实时翻译——通过耳机进行实时口译(Timekettle、Google Pixel Buds)。质量尚不足以应对商务谈判,但对旅游已可接受。
- PEMT增长——据Slator预测,到2026年60%的商业翻译量将通过PEMT工作流程完成。
神经网络不会取代翻译人员,但不掌握AI工具的翻译人员将输给使用AI的同行。我们自2019年起投资技术,在PEMT成为主流之前就已将其整合到工作流程中。