Программы машинного перевода — это программы, которые специально разрабатываются для облегчения процесса перевода с помощью компьютера (букв. computer assisted translation ), как AutoCAD для инженеров или ArchiCAD для архитекторов. Такое программное обеспечение специально разработано, чтобы создавать, хранить, читать и записывать информацию в виде файлов под названием «память перевода» (букв. translation memories), при этом программа создает строку с языковой парой, автоматически находя для отдельного слова или словосочетания его соответствие на другом языке. Программа создает файл с названием, например, RU_EN или RU_IT и т.п., в котором слово или словосочетание на одном языке соответствует своему значению на другом языке.

Что такое «память перевода» и как она работает.

Память перевода (translation memory, TM) — это объемный файл с техническими терминами, сокращениями, устоявшимися выражениями.

Если вам предстоит перевести, например, сокращение «CCCP » с русского на английский с помощью программы машинного перевода (CAT), программа сразу предложит вам вариант перевода: Soviet Union.

На первый взгляд, все просто, но не все так просто, как кажется. Если мы переводим документ, не имеющий отношения к истории, тогда данная аббревиатура может означать нечто совершенно другое: c arbonyl c yanide m-c hlorophenyl h ydrazone , токсичный ионофор, разобщитель дыхательной цепи. Или, например, это может означать «c ombined c ommunity c odec p ack «, программный пакет Microsoft Windows для воспроизведения мультимедийных файлов.

Вот почему компания «Экспримере» не использует в работе программы автоматического перевода. Мы пользуемся исключительно терминологическими базами данных для технических переводов.

Описание

Одна запись в такой базе данных соответствует сегменту или «единице перевода » (англ. translation unit ), за которую обычно принимается одно предложение (реже - часть сложносочинённого предложения либо абзац). Если единица перевода исходного текста в точности совпадает с единицей перевода, хранящейся в базе (точное соответствие, англ. exact match ), она может быть автоматически подставлена в перевод. Новый сегмент может также слегка отличаться от хранящегося в базе (нечёткое соответствие, англ. fuzzy match ). Такой сегмент может быть также подставлен в перевод, но переводчик будет должен внести необходимые изменения.

Помимо ускорения процесса перевода повторяющихся фрагментов и изменений, внесенных в уже переведённые тексты (например, новых версий программных продуктов или изменений в законодательстве), системы ПП также обеспечивают единообразие перевода терминологии в одинаковых фрагментах, что особенно важно при техническом переводе. С другой стороны, если переводчик регулярно подставляет в свой перевод точные соответствия, извлеченные из баз переводов, без контроля их использования в новом контексте, качество переведённого текста может ухудшиться.

В каждой конкретной системе ПП данные хранятся в своем собственном формате (текстовый формат в Wordfast, база данных Access в Deja Vu), но существует международный стандарт TMX (англ. Translation Memory eXchange format ), который основан на XML и может генерироваться практически всеми системами ПП. Благодаря этому сделанные переводы можно использовать в разных приложениях, то есть переводчик, работающий с OmegaT , может использовать ПП, созданную в Trados , и наоборот.

Большинство систем ПП как минимум поддерживают создание и использование словарей пользователя, создание новых баз данных на основе параллельных текстов (англ. alignment ), а также полуавтоматическое извлечение терминологии из оригинальных и параллельных текстов.

Популярные программные системы ПП

В соответствии с обзорами использования систем ПП к наиболее популярным системам относятся :

В английской Википедии есть список , сравнивающий возможности различных систем.

Стандарты и форматы памяти переводов

  • TMX (Translation Memory Exchange Format - Обмен памятью переводов). Этот стандарт обеспечивает взаимный обмен между разными поставщиками памяти переводов. TMX является общепринятым форматом в среде переводчиков и лучше всего подходит для импорта и экспорта памяти переводов. Последняя версия этого формата - 1.4b позволяет восстанавливать исходные документы и их перевод из файла TMX.
  • TBX (Termbase Exchange format - Обмен терминологическими базами). Это принятый LISA (Ассоциации индустрии локализации) формат сейчас пересматривается и переиздаётся согласно ISO 30042 . Этот стандарт позволяет проводить обмен терминологией, в том числе детальной лексической информацией. Основная база TBX определяется стандартами: ISO 12620 , ISO 12200 и ISO 16642 . ISO 12620 обеспечивает реестр четко определённых «категорий данных» со стандартизованными именами, которые функционируют как типы элементов данных или предопределённые значения. ISO 12200 (известен также как MARTIF) предоставляет основу для каркасной структуры TBX. ISO 16642 (известен также как Terminological Markup Framework - Структура терминологической разметки) включает структурную метамодель для терминологических языков разметки (Terminology Markup Languages) в целом.
  • SRX создан для улучшения формата TMX и большей эффективности обмена памятью переводов между программами. Возможность указывать правила сегментации, которые использовались в предыдущем переводе, повышает эффективность отождествления сегментов в текущем тексте с содержимым ПП.
  • GMX GILT означает Globalization, Internationalization, Localization, and Translation (Глобализация, интернационализация , локализация , перевод). Стандарт GILT Metrics состоит из трёх частей: GMX-V для показателей объёма, GMX-C для показателей сложности, GMX-Q для показателей качества. Предложенный стандарт GILT Metrics направлен на квантификацию объёма работ и требований качества при реализации задач GILT.
  • OLIF - открытый стандарт, совместимый с XML , который используется для обмена терминологическими и лексическими данными. Хотя изначально он применялся в качестве способа обмена лексическими данными между частными лексиконами машинного перевода, постепенно этот формат превратился в более общий стандарт терминологического обмена.
  • XLIFF (XML Localisation Interchange File Format - XML формат для взаимного обмена при локализации), создан как единый формат файлов для взаимного обмена, который распознаётся всеми программными средствами локализации. XLIFF - это наилучший в современной индустрии переводов способ обмена информацией в формате XML. Некоторые инструменты используют проприетарные форматы XLIFF, не позволяющие открывать созданные в них файлы в других программах.
  • TransWS (Translation Web Services - переводческие веб-сервисы), определяет требуемые параметры вызова веб-сервисов при отправлении и получении файлов и сообщений, имеющих отношение к проектам локализации. Задумывался как развёрнутая система автоматизации процесса локализации с использованием сервисов в сети Интернет .
  • xml:tm , этот подход к памяти переводов основан на концепции текстовой памяти, которая позволяет совмещать авторскую память и память переводов. Формат xml:tm был передан Lisa OSCAR компанией XML-INTL .

Преимущества и недостатки

Преимущества

  • Сокращение времени и объёма работы переводчика.
  • Улучшение последовательности перевода, особенно при работе группы переводчиков над одним проектом.
  • Увеличение прибыли за счёт увеличения производительности труда переводчика, группы переводчиков.
  • Повышение качества услуг за счёт увеличения точности и единообразия перевода терминов, особенно в специализированных текстах.

Недостатки

  • Может делать перевод более «сухим»; утрачивается сама суть текста, если перевод с использованием накопителя переводов выполняется переводчиком низкой квалификации.
  • Часто отсутствует связь предлагаемого программой предложения/текста с соседними предложениями и с текстом в целом.
  • Оригинал должен быть в электронном виде.
  • Одна незамеченная ошибка может распространиться на весь проект.
  • Необходимо обучение работе в самой программе, а при смене работы - возможно, и не один раз (если работодатели пользуются разными программами ТМ).
  • Подходит не ко всем видам текстов.
  • Высокая стоимость лицензионного ПО.

См. также

Литература

  • Грабовский В. Н. Технология Translation Memory // Мосты. Журнал переводчиков. 2004. № 2. - С. 57-62.

Ссылки

  • Использование профессиональных программ переводческими компаниями России // Константин Дранч, 8 апреля 2015.

В наш век стремительного развития информационных технологий и невиданного до сих пор тесного взаимодействия самых, казалось бы, отдалённых культур потребность в предоставлении быстрых и качественных переводческих услуг становится особенно актуальной. И не удивительно, что сфера письменного перевода , считавшаяся до недавнего времени территорией приложения исключительно человеческого интеллекта, с появлением уже первых компьютеров начала медленно, но заметно видоизменяться. И не могло быть иначе, ведь облегчение труда и постоянный поиск новых решений заложен в самой сути человека.

Как это часто бывает, технический прогресс в сфере коммуникаций не только поставил перед человечеством новые задачи, но и принёс с собой средства для их решения. В сфере письменных переводов одним из таких решений стала технология под названием Translation Memory (ТМ) и использующие её средства автоматизированного перевода (CAT - computer assisted translation) .

Важно заметить, что средства автоматизированного перевода ни в коем случае нельзя путать с машинным переводом. Это два совершенно разных подхода к автоматизации перевода компьютерными средствами, две совершенно разные «философии» переводческого процесса. В случае машинного перевода весь перевод - от начала и до конца - делает машина, компьютер, используя для этого имеющиеся в её распоряжении словари и алгоритмы перевода. Как следствие, результат такой работы далёк от того, что можно назвать «качественным переводом» ровно по той причине, что искусственный интеллект до сих не изобретен человечеством. Во втором же случае речь идёт только об инструментах , облегчающих и ускоряющих традиционный процесс человеческого перевода , который выполняется и контролируется непосредственно переводчиком. Бюро переводов «ЛингваКонтакт» никогда не занималось и не занимается машинным переводом.

Translation Memory (TM) или «память переводов» (ПП) представляет собой базу данных, где хранятся все ранее выполненные переводы с её использованием. Для удобства переводчика программы, использующие технологию Translation Memory, разбивают переводимый текст на так называемые сегменты - фрагменты текста, оригинал и перевод которых и хранится в памяти. За единицу сегментирования (минимальную единицу перевода) такие программы обычно принимают предложение или часть сложноподчинённого предложения, но в зависимости от настроек ею также могут быть слово, фраза либо целый абзац.

Принцип работы большинства средств автоматизированного перевода прост. Во время перевода программа, во-первых, «запоминает» все переводы сегментов, подтверждённые переводчиком, а во-вторых, постоянно сверяет каждый новый непереведённый сегмент с уже имеющимися в памяти переводов и в случае обнаружения идентичного или похожего сегмента «напоминает» его перевод. Таким образом, переводчику остаётся только подтвердить предложенный программой перевод или исправить/дополнить его в соответствии с контекстом.

Кроме собственно создания и работы с памятью переводов, современные программы автоматизированного перевода позволяют:

Создавать и использовать глоссарии и словари пользователей;

Создавать памяти переводов из пар уже ранее переведенных текстов без использования средств автоматизированного перевода;

Проводить анализ текста и делать выборку из его ключевых слов, которые потом можно добавлять в глоссарии;

Осуществлять так называемый «предварительный перевод» (pretranslation) на основе уже имеющихся баз ПП.

Наиболее эффективно применение данной технологии для перевода:

Больших проектов, содержащих много однотипных фрагментов и терминов: разного рода научных и технических текстов, документаций , финансовых и юридических текстов ;

Одного проекта группой из нескольких переводчиков - в этом случае технология ПП (облачная) позволяет добиться единообразия терминологии и стиля;

Новых версий уже ранее переведённых текстов - это значительно сокращает время на поиск и перевод новых фрагментов;

В то же время эта технология оказывается практически бесполезной при переводе художественных , публицистических и рекламных текстов. Другими словами, всего того, что требует творческого подхода и незаурядных решений.

Вот так выглядит интерфейс SDL Trados, интегрированной в MS Word:

Краткий обзор основных средств автоматизированного перевода

Сегодня на рынке представлено несколько десятков программ, поддерживающих работу с технологией Translation Memory. Самыми известными из них являются SDL Trados , Déjà vu , Wordfast , MultiTrans , STAR Transit и Omega-T . Кроме самого очевидного - цены (например, программа Omega-T является полностью бесплатной) - эти программные среды отличаются:

Интерфейсом редактирования текста: некоторые программы интегрируются в MS Word (например, все версии SDL Trados до версии SDL Trados 2007 включительно), другие же имеют свой собственный интерфейс;

Алгоритмами разбиения текста на сегменты (сегменты состоят из предложений, фраз или слов);

Наличием дополнительных функций (например, в программе MemoQ, в отличии от других, существует возможность оценки в процентном отношении однородности текста, т.е. наличия в нём повторяющихся элементов на уровне слов и фраз);

Возможностью интеграции средств машинного перевода;

Количеством поддерживаемых форматов файлов;

Наличием возможности работать с памятью переводов в режиме он-лайн.

Выбор CAT-программы часто зависит больше от личных предпочтений переводчика или требований бюро переводов, с которым он сотрудничает (к примеру, многие западные бюро переводов работают с форматом TTX, а он полноценно поддерживается только средой SDL Trados).

Переводчики бюро переводов «ЛингваКонтакт» знают и владеют на высоком уровне самыми распространенными CAT-инструментами. Кроме того, в нашем арсенале «помощников переводчика» есть не только средства работы с памятью переводов, но также и множество других программ и утилит (инструменты Quality Assurance, создание терминологических баз, межформатная конвертация и пр.), без которых едва ли можно добиться высокого качества и скорости работы. На счету «ЛингваКонтакт» десятки тысяч переведённых страниц с использованием TM-средств!

Вы можете быть уверены, что Ваш текст будет переведён качественно и в срок, в каком бы формате и какой бы сложности он ни был!

Из-за ценового давления переводческий бизнес сегодня уже не может долго оставаться прибыльным и конкурентоспособным без автоматизации. Почти все профессиональные переводчики и бюро работают в программах памяти перевода (CAT-tools, они же «кошки»). Используя эти программы и компании экономят в среднем 36% бюджета и времени, а иногда до 90%. Бюро, чья стратегия ориентирована на продажи с профессиональным и сведущим заказчикам, например, зарубежным бюро переводов, не могут обойтись без целого набора из нескольких технологий.

Существует более различных 50 программ памяти переводов: от бесплатных/open source Omega-T и MateCAT до дорогостоящих коммерческих решений с коллективной работой и системной интеграцией..

Топ-10 средств translation memory

Продукт Компаний-пользователей на 03.2017 Изменения позиции с 03.2015
1 Программы SDL 122 -
2 59 -
3 48 4
4 memoQ - Kilgray * 33 ↓1
5 STAR Transit 20 3
6 Across 17 ↓2
7 Lionbridge Translation Workspace 17 new
8 WordFast 17 ↓2
9 Atril DejaVu 16 ↓3
10 XTM 14 ↓1

* из 33-х пользователей memoQ шесть компаний указали, что используют сервер

Не используются переводческими компаниями региона: MateCat, Transifex, PhraseApp, Fluency, CafeTran Espresso, WordBee, MetaTexis, Heartsome, Swordfish, LogiTerm Pro, Crowdin, translate5, TextUnited и другие.

Шесть и более CAT-средств необходимо для субподрядов

Данные в таблице почерпнуты из в котором зарегистрированы 280 компаний. Из них 170 указали инструменты памяти переводов. 60% компаний пользуются одной или двумя программами, четверть владеет несколькими (от 3 до 5).

15% компаний указали десять или более средств памяти переводов в своем распоряжении. Почти все из них выполняют существенный объем переводов на субподрядах иностранных переводческих фирм. Чтобы адаптироваться под различные технологические требования заказчиков, они тестируют все популярные «кошки» и могут закупить доступ к ним на короткое время. Часто лицензии вместе с проектом предоставляет клиент.

Компании, указавшие больше всех CAT-инструментов К-во
Janus Worldwide 19
Promova 18
KONSIS 18
Logrus Global 18
ITI 17
Palex Group 15
Databridge 14
Yepanoff 13
Technolex Translation Studio 11
Neotech 10
ЭГО Транслейтинг 10
InText 9

На практике в сколько-нибудь серьезном масштабе они пользуются только одним или двумя инструментами. Например, в компании Janus Worldwide, перечислившей 19 инструментов, основными являются SDL Trados и Across. В Неотэке и ЭГО Транслейтинг с 10 «кошками» на складе в ежедневном режиме переводчики работают в Trados и в Memsource.

Чем пользуются крупнейшие БП

Количество инструментов и выручка или прибыль компании не связаны. Расходы тоже: доступ к паре отдельных переводческих лицензий десятка средств памяти переводов стоит дешевле, чем одно серьезное решение для групповой работы. Чтобы определить, какими инструментами пользуются наиболее успешные компании, мы выбрали 28 организаций с выручкой около 100 млн рублей или более. Таблица ниже указывает их предпочтения в софте.

smartCAT и Transit поднялись в таблице

По сравнению с 2015 годом в каталоге выросло количество пользователей всех систем. Но только smartCAT и Transit поднялись в таблице.

smartCAT удалось убедить российского профессиональное сообщество после того как система отделилась от материнской организации ABBYY Language Services и стала независимой. В середине 2016 г. руководитель проекта Иван Смольников оставил пост генерального директора ABBYY LS и начал активную маркетинговую кампанию на бюро переводов, используя привлеченные инвестиции в размере $2,8 млн от фонда RedSeed. Когда крупные переводческие компании России перестали видеть в smartCAT инструмент конкурента, они стали использовать систему на реальных, а не тестовых проектах. Небольшие бюро привлекла финансовая модель системы с бесплатными лицензиями, а также возможность простой и легальной оплаты услуг переводчиков-фрилансеров, не зарегистрированных в качестве ИП (через иностранное юрлицо).

Позиции Transit Nxt выросли за счет эффекта низкой базы и небольшого повышения маркетинговой активности. Star Spb спонсировала две отраслевые конференции в России, начала сотрудничать с вузами. Бюро переводов покупают Transit Nxt не как самостоятельный инструмент, а как технологию под заказчика, когда сотрудничают с бюро переводов STAR Group на субподряде, либо когда выполняют заказы предприятий-пользователей Transit .

40+ переводческих компаний, сменивших системы в 2016 году

Информация по данным анкетирования в марте 2017 г. Авторский язык сохранен на 99%.

Сайт компании Поменяли ли вы программу памяти переводов (CAT) или управления проектами (TMS) в 2016-2017 гг?
1 abbyy-ls.ru По итогам 2016 года: 93 % всех проектов выполняется в SmartCAT (7 % - прочие CAT-среды по запросу клиентов). Внедрены новые CRM-система и таск-менеджер. Начата разработка новой TMS-системы.
2 abc-globe.ru Активно пользуемся smartCAT.
3 allcorrect.ru TMS находится в разработке. Искали аналоги используемой CAT - memoQ, тестировали Trados, smartCAT, Memsource. Тем не менее, недостатки в тестируемых продуктах основного блока перевешивают нехватку некоторых блоков в memoQ, например, портал клиента.
4 apriori-ltd.ru Основная программа Memsource, добавили smartCAT для снижения затрат.
5 avanta-translating.com Новые инструменты: Across, Lionbridge Translation Workspace, smartCAT, Star Transit, ChangeTracker, TQAuditor.
6 benevox.ru Trados, Memsource.
7 bssolutions.ru Переходим на smartCat в качестве основной. Считаем эту программу наиболее прогрессивной в текущем моменте времени.
8 cornplus.ru Приобрели релизы SDL 2017 г.
9 delovoyazyk.ru SDL-Trados.
10 engprofi.ru Программу памяти переводов не поменяли программа управления проектами QTRM.
11 engtrans.biz Перешли на Trados 2017, спасибо его средствам повышения производительности. Поковырялись со smartCAT и отбросили как непригодную для работы систему. Попробовали Memsource - чуть лучше smartCAT, но тоже никуда не годится.
12 exprimo.ru Внедрили Across, так как активно выходим на международные рынки.
13 i-text.kz с начала 2016 года все переводы осуществляются в системе SmartCAT.
14 intext.ua Добавили в InTMS Virtual Knowledge Assistant: функцию, напоминающую менеджерам проектов вовремя об особенностях и требованиях проекта и клиента. В части работы с CAT ориентируемся на запросы клиентов, в частности, в 2016-2017 году стали выполнять больше проектов в Memsource.
15 iti.ru Мы взяли в обойму несколько новых САТ-средств, т.к. того требовали клиенты. Например, стали работать (помимо прочего) в XTM, Smartling.
16 iwords.ru В 2016 году использовался инструментарий Memsource и SmartCAT. Они отвечают текущим нуждам компании.
17 janus.ru memoQ.
18 kiev-bridge.com.ua Поменяли TMS (в процессе разработке собственной). Работаем с Trados уже более 4 лет.
19 levshagames.ru Активнее разрабатываем внутренний портал.
20 li-terra.com Компания перешла почти полностью на Memsource, начала пробовать MemoQ. Изменения связаны с приходом в 2015 г. в компанию нового управляющего директора.
21 linguamaster.ru да, работаем с Смарткат.
22 littera.ru САТ для нескольких заказчиков.
23 logrusit.com Да, начали внедрять smartCAT.
24 lsgroup.pro Сменили Memsourse на smartCAT Приобрели QTRM.
25 medconsult.ru Не поменяли САТ-систему. Взяли на вооружение новые возможности САТ, добавив ряд языковых пар и расширив возможности автоматизированного контроля качества.
26 medsolution.ru Стали больше использовать Memsource, т.к. новым переводчикам проще его осваивать.
27 medts.ru Trados Studio WordFast.
28 minskperevod.by Перешли от Trados в smartCat. Преимущества - бесплатная программа, не требуется установка и длительное обучение переводчика.
29 monoton.su Стали использовать smartCAT в дополнение к ранее имевшимся CAT системам - у многих переводчиков возникают трудности в установке и использовании стационарного ПО. SmartCAT избавляет от этих проблем.
30 mtwain.ru Использовали Trados 10 в ряде проектов. Без него невозможно обеспечить высокую скорость и единство терминологии. Изменилось: привлекаем новых фрилансеров, свободно владеющих системами CAT.
31 palexgroup.com Стали больше использовать облачные решения.
32 perevod-ekb.ru Планируем поменять в 2017 году.
33 perevodmsk.ru Да, начали работать в SmartCAT.
34 philin.com.ua Перешли работать на новую ТМС - Alisa, улучшился сбор всех статистик, контроль сотрудников и их KPI, учет клиентов и срм, сократилось время работы обработки проектов.
35 profpereklad.ua Увеличили количество лицензий SDL Groupshare.
36 компания из топ-20 Да, думаем в сторону smartCAT активно, Trados надоел и не отвечает требованиям, несмотря на то, что стоил нам как чугунный мост.
37 t-link.ru SDL Trados studio 2015 sr2, Memsource.
38 technolex-translations.com Мы используем практически все популярные инструменты.
39 text.ua По старой, доброй традиции работаем с Trados.
40 tradosim.com По-прежнему работаем с Trados Studio. Частично обновились до 2017 версий.
41 traktat.com 1. SmartCAT -- бесплатное подключение переводчиков, наличие собственной базы фрилансеров, гибкий подход к обслуживанию 2. Внедрение собственной ЕРП системы и интеграция с ней АМОCRM.
42 translation.kh.ua Выбрали SmartCAT.
43 судебныепереводчики.рф Разработка собственных программных продуктов.

Бюро переходят на новые версии Trados с задержкой на 3 года

По данным каталога, большая часть переводческих компаний использует старые версии Trados — 2011-2014 года. Можно сделать вывод, что этих версий достаточно для их текущих нужд. Обновления Trados до версии 2017 года в магазине российского представителя SDL компании «Т-Сервис» стоят от 8500 до 40 000 рублей за одну лицензию в зависимости от редакции (профессиональная или индивидуальная). Цикл релизов Trados - 18 месяцев, то есть новые версии выходят раз в полтора года. Далеко не все компании покупают каждый релиз, многие перепрыгивают через один или два. Это не мешает «Т-Сервису» бить рекорды продаж год за годом.

Особенности национального рынка CAT-программ

Как и в других странах, в России самая популярная программа памяти переводов - это SDL Trados. В отличие от других стран, среди бюро переводов России очень высока популярность облачных инструментов: Memsource и, с этого года, smartCAT. С другой стороны, гораздо меньше используется memoQ, а такие зрелые и успешные инструменты как XTM, MateCAT и Wordbee вообще не входят в первую десятку.

Выше популярность систем, интересы которых на российском рынке представляет местный партнер.

  • «Т-Сервис» становится лучшим в мире реселлером SDL по объемам продаж год за годом.
  • Atril Deja Vu набрала популярность в 2011-2012 гг., когда их интересы представляла самарская компания All Correct.
  • STAR Transit опирается на питерскую компанию STAR Спб.

В РФ небольшая доля у Kilgray memoQ. Любимчики мирового переводческого сообщества Kilgray пробовали открыть российское представительство в 2012 году, но после неудачного первого опыта с наймом директора оставили попытки экспансии на наш рынок. Вместо этого впоследствии они открыли офис в Японии, где потенциал для их бизнеса в несколько раз больше. А XTM, Across, MateCAT и Wordbee практически не посещали местные мероприятия и не инвестировали в развитие в РФ. Они предпочитают продавать российским компаниям, когда те посещают международные конференции.

Их доля на российском рынке невысокая, хотя по совокупному объему бизнеса в мире и Across, и memoQ, и XTM опережают Memsource и smartCAT. Пожалуй, даже вместе взятых.

Чем отличаются популярные инструменты

Работающим с технологичными клиентами бюро часто приходится использовать требуемые заказчиком программы. Примеры такого софта в таблице: Oracle Hyperhub, Microsoft Locstudio, Lionbridge Translation Workspace.

Бюро, чьи заказчики не требуют конкретной программы, выбирают либо Trados - программу, ставшую де-факто отраслевым стандартом, либо более доступные облачные инструменты.

Устанавливаемые решения (сервер + desktop)

Редакторы переводов SDL Trados и Kilgray memoQ необходимо скачать и установить на компьютер. Эти популярные программы предоставляют сильный редактор переводчикам, но требуют времени на обучение. Чтобы объединить несколько переводчиков в группу и организовать между ними обмен памятью и терминологией, как правило, нужна дополнительная дорогостоящая программа - сервер.

Облачные решения

Облачные Memsource, XTM и smartCAT работают через браузер. На мой взгляд, они слегка проще в использовании чем desktop-инструменты, хотя могут уступать по функционалу редактора. Переводчик, которому отправили задание через Memsource или smartCAT, получает email со ссылкой, кликает по ней — и может начинать работу. Групповая работа включена в эти системы по умолчанию. Облачные системы не дешевле серверных, но берут оплату по арендной схеме, за месяц.

Лучше для: стабильной группы переводчиков, которая работает с регулярной нагрузкой в течение нескольких лет, может обрабатывать конфиденциальную информацию, редко отдает материалы на сторону. Лучше для: облачные инструменты с арендной схемой (SaaS) лучше подходят для быстрого расширения команды, перепадов в загрузке, работы с большой базой фрилансеров и субподрядчиков.

Говоря об автоматизированном переводе, обычно подразумевают программы, осуществляющие перевод на основе технологии машинного перевода (Machine Translation). Однако существует и другая технология - Translation Memory, которая хотя и не столь широко известна российским пользователям, но, тем не менее, имеет ряд преимуществ.

Бурное развитие технического прогресса привело к увеличению числа технических устройств, машин и другой сложной техники, без которых жизнь современного человека практически немыслима. Например, объем документации для европейского самолета Airbus исчисляется десятками тысяч страниц. Как показывают данные исследования, проведенного в конце 2004 года ассоциацией LISA (LISA 2004 Translation Memory Survey), 42% опрошенных переводят около 1 млн. слов в год, у 24% компаний - участников опроса ежегодный объем переводов составляет 1-5 млн., 12% переводят от 5 до 10 млн., объем переводов остальных компаний - от 10 до 500 и более миллионов слов в год. В частности, большинство производителей сегодня не ограничиваются своим локальным рынком и активно осваивают региональные рынки. При этом локализация продукции, в том числе перевод описания продукта на местный язык, является одним из обязательных условий для выхода на новый рынок.

В то же время, хотя производители регулярно выпускают новые версии своих продуктов - автомобилей, экскаваторов, компьютеров и мобильных телефонов, программного обеспечения, - далеко не все из них принципиально отличаются от предыдущих моделей. Подчас новая модель телефона представляет собой слегка измененную (или рестайлинговую) предыдущую модель. Новые версии продаются лучше, поэтому производителям приходится регулярно обновлять свои продукты. В результате документация по каждому из таких продуктов зачастую на 70-90% совпадает с той, что была у предыдущей версии.

Два фактора - большой объем требующих перевода документов и их высокая повторяемость - послужили стимулом к созданию технологии Translation Memory (сокращенно именуется TM, общепринятый русский перевод этого термина отсутствует). Суть технологии TM можно образно передать одной фразой: «Не переводить один и тот же текст дважды». Иначе говоря, Translation Memory используется для повторного использования ранее сделанных переводов. Это позволяет серьезно сократить время на подготовку перевода, особенно при работе с текстами, имеющими высокую степень повторяемости.

Технологию Translation Memory часто путают с машинным переводом (Machine Translation), которая, безусловно, тоже полезна и интересна, но ее описание не является целью настоящей статьи. Использование технологии ТМ повышает скорость перевода за счет уменьшения объема механической работы. Однако важно отметить, что TM не выполняет перевод за переводчика, а является мощным инструментом для сокращения затрат при переводе повторяющихся текстов.

Технология ТМ работает по принципу накопления результатов перевода: в процессе перевода в базе ТМ сохраняются исходный текст и его перевод. Для облегчения обработки информации и сравнения различных документов система Translation Memory разбивает весь текст на отдельные кусочки, которые называются сегментами. Такими сегментами чаще всего являются предложения, но могут быть приняты и другие правила сегментации. При загрузке нового текста система TM осуществляет сегментирование и сравнивает сегменты исходного текста с уже имеющимися в подключенной базе переводов. Если системе удается найти полностью или частично совпадающий сегмент, то его перевод отображается с указанием совпадения в процентах. Сегменты, которые отличаются от сохраненного текста, выделяются подсветкой. Таким образом, переводчику остается только перевести новые сегменты и отредактировать частично совпадающие.

Как правило, задается порог совпадений на уровне не ниже 75%, так как если установить меньший процент совпадений, то увеличатся затраты на редактирование текста. Каждое изменение или новый перевод сохраняются в ТМ, так что нет необходимости переводить одно и то же дважды!

Важно также постоянно пополнять базу Translation Memory, сохраняя в базе (или в базах, если перевод выполняется по различным тематикам) пары сегментов «исходный текст - правильный перевод». Это позволит значительно сократить время, необходимое для перевода сходных текстов. Помимо снижения трудоемкости перевода система TМ позволяет выдержать единство терминологии и стиля во всей документации.

Использование технологии ТМ обеспечивает переводчику следующие преимущества:

  • повышение производительности труда. Подстановка даже на 80% совпадающих сегментов из базы переводов может сократить время работы над переводом на 50-60%. Как показывает практика, гораздо эффективнее править уже готовый перевод, чем переводить заново - «с нуля»;
  • единство терминологии и стиля при наличии базы переводов по тематике переводимого документа. Это особенно важно при переводе узкоспециальной документации;
  • организация работы коллектива переводчиков с гарантированным качеством перевода благодаря доступу к общей базе Translation Memory.

Отдельно отметим, что в западных странах, где технология Translation Memory давно уже стала де-факто обязательным инструментом переводчика, средства, потраченные на создание базы переводов, рассматриваются не как затраты, а, скорее, как инвестиции в стабильную и качественную работу, что увеличивает не только прибыль, но и стоимость самой компании.

Рынок систем Тranslation Мemory

Бесспорным лидером на рынке систем Translation Memory являются программы SDL-TRADOS. Летом 2005 года произошло объединение двух крупнейших разработчиков систем ТМ - компаний SDL и TRADOS (программные продукты под торговой маркой TRADOS хорошо известны многим пользователям), и теперь они выпускают совместный продукт, который является законодателем стандартов в области Translation Memory.

Новая система SDL-TRADOS имеет расширенные (настраиваемые пользователем) функциональные возможности нечеткого соответствия (поиск по совпадениям в базе переводов), а также инструментарий для проверки качества переводимых документов. Программа осуществляет проверку орфографии и защищает содержимое блоков памяти с помощью технологии шифрования.

Система поддерживает такие форматы, как Word DOC и RTF, online help RTF, PowerPoint, FrameMaker, FrameMaker +SGML, FrameBuilder, Interleaf, QuickSilver, Ventura, QuarkXPress, PageMaker, SGML/HTML/XML, включая HTML Help, RC (Windows Resource), Bookmaster (DCF) и Troff. Помимо системы SDL-TRADOS, на IT-рынке имеются и другие системы ТМ. Особенно широко представлены французские производители.

Система французской компании Atril (www.atril.com) называется. Ее разработчики сначала организовали собственное бюро перевода технической документации, после чего возникла идея создания специализированного ПО на основе технологии Translation Memory.

Это самостоятельное приложение с систематизированным меню. Система может создавать базы ТМ, а также базы данных терминологии и подключать словари. Процесс перевода осуществляется в специальной оболочке Project, куда при ее создании прикрепляется файл, который необходимо перевести, и подключаются дополнительные настройки: база ТМ, словари и др. Текст переводится в специальной таблице, где напротив каждой графы его оригинала нужно заполнить вариант перевода. К преимуществам также относится дополнительная функция для перевода файлов различных форматов, которая позволяет сохранить исходное форматирование файла.


Close