2025年机器翻译现状

过去两年，神经翻译质量实现了堪比2016年从统计模型向神经模型转变的飞跃。主要参与者：

DeepL——欧洲语言质量领先。支持33种语言。EN↔DE语言对在72%的情况下错误率与人工翻译持平（BLEU+人工评估数据）。
GPT-5和Claude——大型语言模型（LLM）在翻译具有复杂上下文的文本时表现出色。能理解讽刺、文化引用和风格细微差别。但会产生"幻觉"——添加原文中没有的信息。
Yandex翻译——俄语最强模型，特别是RU↔EN、RU↔ZH、RU↔TR语言对。与Yandex云的集成对俄罗斯企业客户很方便。
Google翻译（Gemini）——243种语言，主流语言质量稳定，在稀有语言对和专业术语方面表现较弱。

神经网络擅长的领域

我们在真实订单上测试了所有主要引擎——500篇不同主题文本，总计200万字符。结果：

高质量（最少修改）：

中等质量（需要编辑）：

不可接受的质量（需完全返工）：

PEMT（机器翻译后编辑）不是"按个按钮就得到翻译"。这是一个完整的生产流程：

PEMT将笔译成本降低20-35%，交付周期缩短30-50%。但并非适用于所有文本类型——法律文件、公证翻译和创意文本仅由人工翻译。

来自我们的实践：

1. 医疗器械说明书。DeepL将"apply pressure"翻译为"施加压力"而非"按压"。在止血的语境下——这是致命错误。

2. 供货合同。GPT-4翻译"Force Majeure clause"时遗漏了完全改变风险分配的法律措辞。

3. 营销口号。Yandex翻译将"Think different"直译——技术上正确，但失去了所有营销冲击力。

4. 财务报表。Claude将"accrued liabilities"翻译为非标准术语，不符合IFRS公认术语。

5. 专利申请。所有测试引擎均未能翻译专利权利要求——这是一种对句法有严格要求的特殊法律文体。

基于我们的观察和行业研究（GALA、TAUS、Slator）：

神经网络不会取代翻译人员，但不掌握AI工具的翻译人员将输给使用AI的同行。我们自2019年起投资技术，在PEMT成为主流之前就已将其整合到工作流程中。