PEMT простыми словами
PEMT — Post-Editing of Machine Translation — это редактирование машинного перевода человеком-переводчиком. Текст сначала переводит нейросетевая MT-система (DeepL, Google NMT, ModernMT или корпоративный движок), а затем квалифицированный редактор-постредактор исправляет ошибки, доводя текст до требуемого качества.
PEMT — это не «подчистить за Google Translate». Это отдельная профессиональная дисциплина со своим стандартом (ISO 18587:2017), требованиями к квалификации постредакторов и чёткими критериями применимости. Постредактор должен быть квалифицированным переводчиком — стандарт запрещает поручать эту работу людям без переводческой подготовки.
Light PEMT и Full PEMT: два уровня
Стандарт ISO 18587 и отраслевая практика различают два уровня постредактирования:
Light PEMT (лёгкое постредактирование) — редактор исправляет только критичные ошибки: искажения смысла, пропуски, фактические неточности. Стилистика и гладкость текста не правятся. Результат — понятный, фактически верный текст, который может звучать «машинно». Подходит для внутренних документов, когда адресат — специалист, а не конечный потребитель.
Full PEMT (полное постредактирование) — редактор доводит текст до качества, неотличимого от перевода, выполненного человеком с нуля (human translation quality). Исправляются стиль, терминология, грамматика, согласованность, логика изложения. Результат можно публиковать, отправлять клиентам, использовать в маркетинге.
| Критерий | Light PEMT | Full PEMT | Human Translation |
|---|---|---|---|
| Точность передачи смысла | Да | Да | Да |
| Стилистическая правка | Нет | Да | Да |
| Терминологическая точность | Базовая | Полная (по глоссарию) | Полная |
| Экономия vs. human translation | 30-40% | 15-25% | Базовая цена |
| Скорость | 5 000-8 000 слов/день | 3 000-5 000 слов/день | 2 000-3 000 слов/день |
| Публикуемое качество | Нет | Да | Да |
Стандарт ISO 18587:2017
ISO 18587:2017 «Translation services — Post-editing of machine translation output — Requirements» — единственный международный стандарт, регулирующий PEMT. Он определяет:
- Требования к постредактору. Специалист должен соответствовать квалификационным критериям ISO 17100 (переводческое образование или подтверждённый опыт) плюс иметь навыки работы с MT-выходом. Это не начинающий фрилансер — это опытный переводчик, обученный специфике постредактирования.
- Предпроектная оценка. Перед запуском PEMT-проекта необходимо оценить качество MT-выхода для конкретной пары языков и предметной области. Если качество ниже порогового — PEMT нецелесообразен.
- Контроль качества. Результат PEMT подлежит выборочной проверке (sampling) или полной ревизии в зависимости от уровня (Light/Full).
- Конфиденциальность. Текст, обрабатываемый через облачную MT-систему, может попасть в обучающую выборку. Стандарт требует согласовать политику конфиденциальности с заказчиком.
По стандарту ISO 18587 перед запуском PEMT-проекта рекомендуется провести тестовый прогон: перевести 1 000-2 000 слов через MT, оценить объём правки и принять решение — эффективен PEMT или дешевле перевести с нуля.
Когда PEMT экономит деньги
PEMT даёт максимальную выгоду на текстах с определёнными характеристиками:
- Повторяемая структура. Каталоги товаров, карточки продуктов для маркетплейсов, спецификации. Текст типовой, MT справляется на 70-85%.
- Техническая документация. Инструкции, руководства пользователя, описания API. Лексика ограниченная, синтаксис простой — MT-системы обучены на этих данных.
- Обновления существующих переводов. Если 80% текста не изменилось, а 20% — новый контент, эффективна комбинация TM + PEMT для новых сегментов.
- Большие объёмы с жёсткими сроками. 500 страниц за 5 дней — невозможно при human translation (нужно 7-8 переводчиков). С PEMT — реально: MT переводит за часы, 2-3 постредактора параллельно правят.
Пример из практики: интернет-магазин заказал перевод каталога бытовой техники (12 000 карточек, английский/русский). Human translation оценивался в 840 000 руб. и 30 рабочих дней. Full PEMT обошёлся в 520 000 руб. и 12 рабочих дней. Экономия — 38% по стоимости и 60% по срокам.
Когда PEMT опасен: зоны риска
Есть категории текстов, где PEMT создаёт больше проблем, чем решает:
- Юридические документы. Договоры, уставы, судебные решения. MT-системы путают юридические конструкции: «shall» переводится то как «должен», то как «обязан», то как «будет». Ошибка в одном слове может изменить правовой смысл. Для юридического перевода мы используем только human translation.
- Медицинская документация. Протоколы клинических исследований (КИ), инструкции к лекарственным препаратам, отчёты по безопасности. MT не различает INN (международные непатентованные наименования) и торговые названия, путает дозировки, неправильно передаёт аббревиатуры (AE, SAE, SUSAR). Цена ошибки — здоровье пациента.
- Маркетинговые тексты. Слоганы, рекламные материалы, тексты для сайтов. MT не умеет в креатив, игру слов, культурную адаптацию. Light PEMT превращает маркетинг в сухую инструкцию.
- Тексты с культурными отсылками. Художественная литература, субтитры, игровая локализация. MT не распознаёт иронию, аллюзии, фразеологизмы.
Правило: если цена ошибки высока (юридическая ответственность, безопасность, репутация бренда) — только human translation по стандарту ISO 17100.
Рабочий процесс PEMT в бюро «Универсал»
Наш workflow для PEMT-проектов выглядит так:
- Оценка применимости. Менеджер анализирует текст, тематику, языковую пару. Если MT-качество недостаточно (определяется тестовым прогоном), рекомендуем human translation.
- Выбор MT-движка. Для европейских языков обычно DeepL Pro (закрытый API, данные не сохраняются). Для азиатских — Google NMT или ModernMT. Для конфиденциальных текстов — только on-premise решение.
- Подготовка в CAT-системе. Текст загружается в SDL Trados или memoQ. Сначала отрабатывает TM (если есть накопленная база), затем новые сегменты переводятся через MT-плагин. Постредактор видит MT-предложение и правит его в привычном интерфейсе CAT-системы.
- Постредактирование. Квалифицированный переводчик-постредактор обрабатывает каждый сегмент: исправляет ошибки, проверяет терминологию по глоссарию, обеспечивает согласованность.
- QA-проверка. Автоматический контроль: числа, теги, терминология, пропуски. Плюс выборочная ручная проверка (10-15% объёма) независимым редактором.
- Сдача и обратная связь. Клиент получает перевод и QA-отчёт. Мы фиксируем замечания и корректируем MT-глоссарий для следующих заказов.
Стоимость письменного перевода с применением PEMT рассчитывается индивидуально: зависит от языковой пары, тематики и объёма. Ориентировочные тарифы — на странице цены.
PEMT и конфиденциальность: на что обратить внимание
Облачные MT-системы обрабатывают тексты на серверах провайдера. Бесплатные версии (Google Translate, DeepL Free) могут использовать загруженные тексты для обучения моделей. Это критично для NDA-проектов, коммерческой тайны, персональных данных.
Решения, которые мы используем:
- DeepL Pro / DeepL API Pro — тексты не сохраняются после обработки, не используются для обучения. Подтверждено DPA (Data Processing Agreement).
- On-premise MT — MT-движок развёрнут на локальном сервере заказчика или на нашем защищённом сервере. Данные не покидают контур. Подходит для крупных проектов с высокими требованиями к безопасности.
- NDA — мы подписываем соглашение о конфиденциальности с каждым заказчиком PEMT-проекта. Работаем по договору, предоставляем закрывающие документы (УСН, без НДС).
Перед запуском проекта уточните у менеджера, какой MT-движок будет использоваться и как обеспечивается конфиденциальность. Подробнее о нашем подходе — на странице о компании.