PEMT通俗解释
PEMT——Post-Editing of Machine Translation——即由人工译员编辑机器翻译结果。文本首先由神经网络MT系统(DeepL、Google NMT、ModernMT或企业级引擎)翻译,然后由合格的编辑——后编辑人员——修正错误,使文本达到所需质量。
PEMT不是"帮谷歌翻译修修补补"。这是一门独立的专业学科,拥有自己的标准(ISO 18587:2017)、对后编辑人员的资质要求和明确的适用标准。后编辑人员必须是合格的翻译——标准禁止将此工作交给没有翻译培训的人员。
Light PEMT和Full PEMT:两个级别
ISO 18587标准和行业实践区分两个后编辑级别:
Light PEMT(轻度后编辑)——编辑仅修正关键错误:意思扭曲、遗漏、事实不准确。不修正文体和文本流畅性。结果是可理解的、事实准确的文本,但可能听起来"机械"。适用于内部文件,当读者是专业人员而非最终消费者时。
Full PEMT(完整后编辑)——编辑将文本提升到与人工从头翻译(human translation quality)无法区分的质量。修正文体、术语、语法、一致性和逻辑。结果可以发布、发送给客户、用于市场营销。
| 标准 | Light PEMT | Full PEMT | 人工翻译 |
|---|---|---|---|
| 意义传达准确性 | 是 | 是 | 是 |
| 文体修正 | 否 | 是 | 是 |
| 术语准确性 | 基本 | 完整(按术语表) | 完整 |
| 相比人工翻译节省 | 30-40% | 15-25% | 基础价格 |
| 速度 | 5,000-8,000词/天 | 3,000-5,000词/天 | 2,000-3,000词/天 |
| 可发布质量 | 否 | 是 | 是 |
ISO 18587:2017标准
ISO 18587:2017《翻译服务——机器翻译输出的后编辑——要求》是规范PEMT的唯一国际标准。它规定了:
- 对后编辑人员的要求。专家必须符合ISO 17100的资质标准(翻译教育或经认证的经验),并具备处理MT输出的技能。这不是初级自由译者——而是经过后编辑专业培训的资深翻译。
- 项目前评估。在启动PEMT项目之前,需要评估特定语言对和专业领域的MT输出质量。如果质量低于阈值——PEMT不可行。
- 质量控制。PEMT结果需要根据级别(Light/Full)进行抽样检查或全面审查。
- 保密性。通过云MT系统处理的文本可能进入训练数据集。标准要求与客户协商保密政策。
根据ISO 18587标准,在启动PEMT项目前建议进行测试:通过MT翻译1,000-2,000词,评估编辑量,然后决定——PEMT是否有效还是从头翻译更经济。
PEMT何时能省钱
PEMT在具有以下特征的文本上能带来最大效益:
- 重复性结构。产品目录、电商平台产品卡片、规格说明。文本模式化,MT可完成70-85%。
- 技术文档。操作说明、用户手册、API描述。词汇有限,句法简单——MT系统就是在这类数据上训练的。
- 现有翻译的更新。如果80%的文本未变,20%是新内容,TM+PEMT组合用于新段落效果最佳。
- 大批量紧急项目。5天内500页——人工翻译不可能(需要7-8名译员)。使用PEMT——可行:MT几小时内翻译完成,2-3名后编辑人员并行修正。
实际案例:一家网店订购了家电目录翻译(12,000个产品卡片,英语→俄语)。人工翻译报价840,000卢布,需30个工作日。Full PEMT费用520,000卢布,12个工作日。节省38%成本和60%时间。
PEMT的风险区域
有些文本类别中,PEMT制造的问题比解决的更多:
- 法律文件。合同、章程、法院判决。MT系统混淆法律结构:"shall"时译为"应当",时译为"必须",时译为"将会"。一个词的错误可能改变法律含义。法律翻译我们只使用人工翻译。
- 医学文档。临床研究方案、药品说明书、安全报告。MT不区分INN(国际非专利名称)和商品名,混淆剂量,错误传达缩写(AE、SAE、SUSAR)。错误的代价——患者健康。
- 营销文本。标语、广告材料、网站文案。MT不懂创意、文字游戏、文化适配。Light PEMT会把营销变成枯燥的说明书。
- 含文化典故的文本。文学作品、字幕、游戏本地化。MT识别不了反讽、暗喻、成语。
原则:如果错误代价高(法律责任、安全、品牌声誉)——只能按ISO 17100标准进行人工翻译。
翻译社"Universal"的PEMT工作流程
我们的PEMT项目工作流程如下:
- 适用性评估。项目经理分析文本、主题、语言对。如果MT质量不足(通过测试确定),我们推荐人工翻译。
- 选择MT引擎。欧洲语言通常使用DeepL Pro(封闭API,数据不保存)。亚洲语言——Google NMT或ModernMT。机密文本——仅限本地部署方案。
- CAT系统准备。文本加载到SDL Trados或memoQ。首先调用TM(如有积累的数据库),然后新段落通过MT插件翻译。后编辑人员在CAT系统的熟悉界面中查看MT建议并进行修正。
- 后编辑。合格的翻译后编辑人员处理每个段落:修正错误、按术语表检查术语、确保一致性。
- QA检查。自动控制:数字、标签、术语、遗漏。加上独立编辑的抽样人工检查(10-15%的量)。
- 交付和反馈。客户收到翻译和QA报告。我们记录意见并为后续订单调整MT术语表。
使用PEMT的笔译费用根据语言对、主题和数量单独计算。参考价格请查看价格页面。
PEMT与保密性:注意事项
云MT系统在提供商的服务器上处理文本。免费版本(Google Translate、DeepL Free)可能将上传的文本用于模型训练。这对NDA项目、商业秘密和个人数据至关重要。
我们使用的解决方案:
- DeepL Pro / DeepL API Pro——文本处理后不保存,不用于训练。已通过DPA(数据处理协议)确认。
- 本地部署MT——MT引擎部署在客户的本地服务器或我们的安全服务器上。数据不离开安全边界。适合对安全性要求高的大型项目。
- NDA——我们与每位PEMT项目客户签署保密协议。按合同工作,提供结算凭证(简化税制,无增值税)。
项目启动前请向经理确认将使用哪个MT引擎以及如何保障保密性。了解更多关于我们的方针——请访问关于我们页面。