Состояние машинного перевода в 2025 году
За последние два года качество нейросетевого перевода совершило скачок, сопоставимый с переходом от статистических моделей к нейронным в 2016 году. Ключевые игроки:
- DeepL — лидер по качеству для европейских языков. Поддерживает 33 языка. Для пары EN↔DE ошибки на уровне человеческого перевода в 72% случаев (по данным BLEU + human evaluation).
- GPT-5 и Claude — большие языковые модели (LLM) показывают отличные результаты при переводе текстов со сложным контекстом. Понимают иронию, культурные отсылки, стилистические нюансы. Но генерируют «галлюцинации» — добавляют информацию, которой нет в оригинале.
- Yandex Translate — сильнейшая модель для русского языка, особенно для пар RU↔EN, RU↔ZH, RU↔TR. Интеграция с Яндекс.Облаком удобна для корпоративных клиентов в России.
- Google Translate (Gemini) — 243 языка, стабильное качество для массовых языков, слабая работа с редкими парами и специализированной терминологией.
Где нейросети работают хорошо
Мы протестировали все основные движки на реальных заказах — 500 текстов различных тематик общим объёмом 2 млн знаков. Результаты:
Высокое качество (минимальная правка):
- Общая деловая переписка — ошибки менее 5% сегментов
- Описания товаров для e-commerce — стабильный результат при наличии контекста
- Новостные тексты — нейросети справляются на уровне junior-переводчика
- Интерфейсы ПО (короткие строки с контекстом) — до 85% сегментов не требуют правки
Среднее качество (требуется редактура):
- Технические тексты — нейросети путают термины со схожим написанием, игнорируют стандартизированную терминологию
- Маркетинговые тексты — буквальный перевод убивает эмоциональность и креативность
Неприемлемое качество (полная переработка):
- Юридические договоры — нейросети не учитывают правовую систему целевого языка
- Медицинские документы — критически опасные ошибки в дозировках, диагнозах
- Художественные тексты — потеря авторского стиля, интонации, ритма
PEMT: как нейросети используются в переводе
PEMT (Post-Editing of Machine Translation) — это не «нажал кнопку и получил перевод». Это полноценный производственный процесс:
- Анализ текста. Менеджер оценивает тематику, объём, требования к качеству и решает, подходит ли PEMT для данного заказа.
- Машинный перевод. Текст прогоняется через один или несколько движков (DeepL, Google NMT и др.).
- Постредактирование. Профессиональный переводчик правит машинный перевод: исправляет терминологию, стилистику, смысловые ошибки, проверяет числа.
- Контроль качества. Редактор проверяет финальную версию по чек-листу ISO 17100.
PEMT снижает стоимость письменного перевода на 20–35% и ускоряет сроки на 30–50%. Но подходит не для всех типов текстов — юридические документы, нотариальные переводы и креативные тексты переводятся только вручную.
Когда AI не поможет: 5 реальных провалов
Из нашей практики:
1. Инструкция к медицинскому прибору. DeepL перевёл «apply pressure» как «оказывайте давление» вместо «прижмите». В контексте остановки кровотечения — критическая ошибка.
2. Договор поставки. GPT-4 перевёл «Force Majeure clause» как «пункт о высшей силе» и пропустил юридическую формулировку, которая полностью меняла распределение рисков.
3. Маркетинговый слоган. Yandex Translate перевёл «Think different» как «Думай по-другому» — технически корректно, но теряет весь маркетинговый заряд.
4. Финансовая отчётность. Claude перевёл «accrued liabilities» как «накопленные обязательства» вместо стандартного «начисленные обязательства» — несоответствие принятой терминологии МСФО.
5. Патентная заявка. Все протестированные движки не справились с переводом формулы изобретения — это особый юридический жанр с жёсткими требованиями к синтаксису.
Тренды 2025–2026: чего ожидать
На основе наших наблюдений и отраслевых исследований (GALA, TAUS, Slator):
- Кастомные языковые модели — компании обучают LLM на своих данных. Качество перевода в узкой области приближается к человеческому.
- Мультимодальность — перевод текста на изображениях, в видео, в VR-интерфейсах. Локализация сайтов выходит за рамки текста.
- Real-time translation — устный перевод в реальном времени через наушники (Timekettle, Google Pixel Buds). Пока качество недостаточно для деловых переговоров, но для туризма уже приемлемо.
- Рост PEMT — по прогнозам Slator, к 2026 году 60% объёма коммерческих переводов будет проходить через PEMT-воркфлоу.
Нейросети не заменят переводчиков, но переводчики, которые не освоят AI-инструменты, проиграют тем, кто их используют. Мы инвестируем в технологии с 2019 года и интегрировали PEMT в рабочий процесс ещё до того, как это стало мейнстримом.