Есть такой онлайн-сервис – тексты выравнивать!

Есть такой онлайн-сервис – тексты выравнивать!

Алена Пайтылова

Эксперт по предмету «Языки (переводы)»

Задать вопрос автору статьи

Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 24 апреля 2016 года; проверки требуют 25 правок.

Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 2 февраля 2021 года; проверки требуют 6 правок.

MateCat (англ. CAT, Computer assisted translation, машинный перевод) — онлайн-средство машинного перевода. Сайт является бесплатным для переводческих компаний, переводчиков и корпоративных пользователей. MateCat является открытым кодом и свободным программным обеспечением.

Флаг  — это флаг эсперанто, в котором зелёный цвет заменён красным, цветом левых идей.

оказалась первой организацией эсперантистов, которая не ставила перед собой приоритет распространения эсперанто. Она позиционирует себя как просветительская, социально-образовательная, дискуссионная ассоциация для своих членов, основанная на принципах взаимопомощи и использующей для выполнения своих целей наднациональный язык — эсперанто. В её задачи входит установка связи между рабочими организациями разных стран.

Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики.
Продолжая посещать сайты проектов вы соглашаетесь с нашей
Политикой в отношении файлов cookie

Эта небольшая статья поможет вам разобраться в основах инструментов для автоматизации перевода. Я расскажу об общих отличиях одних программ от других, а какие же программы являются лидерами по популярности среди переводчиков.

Кроме того набросаю пару заметок по утилитам Across Translator Edition и Pairaphrase.

Иллюстрация сгенерирована при помощи нейросети

Во-первых, что такое CAT-tool. Ещё раз, если кто-то не читал мои предыдущие статьи. CAT-tool или просто кошка — это программа, помогающая в переводе. Как же она помогает? В программе установлены модули, облегчающие работу переводчика как то: ТМ — память перевода, ТБ — база терминов (см. предыдущее видео), возможность объединить сразу несколько документов в один проект, чтобы было удобнее работать, а также ряд других полезных функций, которые могут быть уникальными для той или иной программы. Кошки могут быть офлайн и устанавливаться на компьютер или онлайн, и не требовать установки, а могут быть просто дополнительным модулем для офиса.

Подробнее я рассказывал про память перевода и терминосистемы в статье «Память перевода: вы всё ещё кипятите? Тогда мы идём к вам!»

Всего существует более 20 разных кошек, но перепробовать их все подвластно только безумцам или тем, у кого очень много свободного времени.

Некоторые из распространённых утилит автоматизации перевода

Выше я привёл скриншот страницы Википедии со списком программ.

Одни кошки работают только на Windows, другие только онлайн, есть и те, что устанавливаются на платформы Linux или Java, можно выбрать платформу по душе или взять кросс-платформенную и не париться.

Сложнее становится, если совместить платформу с типом лицензии — темный прямоугольник значит, что программа платная, а светлый — бесплатная. Порой за качество приходится платить. Значительно платить, Trados Studio сейчас стоит 925 евро. Бесплатные утилиты не всегда могут предоставить желаемый набор функций, удобство использования, поддерживаемые форматы и прочее.

Над таблицей есть пометка о том, что самыми популярными среди переводчиков на 2006 год были Trados (35%), Wordfast (17%), Déjà Vu (16%), SDL Trados 2006 (15%), SDLX (4%), STAR Transit (3%), OmegaT(3%), другие (7%) 2006 год был давно, с тех пор прошло целых 17 лет. А в мире технологий — это вечность. Более свежая статистика, которую удалось найти в интернете, впрочем, говорит, что тренды не сильно изменились. Первая тройка всё та же:

Самые популярные CAT-tools

Однако, некоторые из указанных кошек я всё равно оценю. Особенно меня интересует Across Language Server своим невероятным перечнем поддерживаемых форматов.

Поддерживаемые форматы Across Language Server

Системные требования Across Translator Edition v7

После регистрации скачивается целый архив, который содержит несколько небольших документов: документация, изменения в версии и системные требования. Все файлы на двух языках. Файл «документация» содержит всего несколько строк со ссылками на онлайн-документацию. Онлайн-документация — это удобно и ссылка в приложении к инсталлятору тоже хорошая идея была, как мне кажется. Так пользователь сразу поймёт, где искать информацию в случае необходимости. Я также открыл системные требования и удивился. Предлагают 25 гигабайт свободного места на диске. По-моему, высоковато, но, наверное, они считают с базой данных, в которой будет храниться перевод. Я не очень разбирался в настройках БД.

Платная подписка на год со скидкой будет стоить почти 1200 в месяц. 20 долларов в месяц — это не так и дорого. Ну, если есть деньги и есть возможность оплатить.

Разобраться в программе немного сложно, если никогда не имели дело с CAT-тулзами. Но путём нехитрых манипуляций всё же можно создать проект, а потом начать переводить. Единственное, я не понял, где все языки. Почему только английский, немецкий и французский? Наверное, потерялись в премиум-версии. Ради теста решил вбить тот же документ про масла, что использовал в статье про OCR-сервисы. В качестве целевого языка выбрал немецкий.

Предупреждение о шрифтах

Когда я подготовил проект, вылезло такое предупреждение. Мне очень понравилось предупреждение, потому что так я точно знаю, какие шрифты нужно найти, чтобы документ не получился уродливым. Достойно уважения. Но другой вопрос — получится ли их найти и будут ли они бесплатными?

Первые впечатления: не сразу понятно, куда добавлять перевод, много маленьких кнопочек. Но через пару минут привыкаешь. Кнопочки хоть и мелкие, но подписываются при наведении, а расположение окна перевода не напрягает.

К сожалению, импортировать свои память переводов или термины у меня не получилось. Я с трудом понял, куда нужно для этого зайти, однако ни формат традоса, ни формат мемокью не получилось скормить. Мне не понравилось подтверждение сегментов не через CTRL+ENTER, а через ALT+PAGE UP (очень нетривиальное сочетание). Наверное, можно настроить в параметрах, но всё же хотелось бы иметь удобную работу по умолчанию, а не после настройки.

В общем судите сами, но я бы не рекомендовал. Многих эта программа может отпугнуть, создать впечатление, что «кошки» — это сложно и неудобно.

Кстати, с отсканированным PDFAcross не справился. И места на диске он занял всего 1.4 ГБ, а не 20 гигабайт, как сказано в системных требованиях. Возможно, по мере наполнения базы данных, занимаемое место вырастет.

Ладно, возможно есть какой-то пробный период, я просто о нём не знаю. Раньше точно был. Выбрал Токио, просто посмотреть. Но вот при регистрации они просят ещё и название компании, номер телефона и много других персональных данных.

Да и почему-то письмо с подтверждением не пришло мне от них. Ну и ладно, не очень-то и хотелось. Вообще, насколько я помню свой опыт взаимодействия с этим сервисом, он выдавал машинный перевод по умолчанию, который можно редактировать. Видимо, их спонсирует Microsoft, который по умолчанию вставляет свой перевод. Он достойный, но хотелось бы иметь возможность отключать машинный перевод при необходимости. Ладно, всё равно не попробовать уже.

На этом на сегодня хочу закончить вводную статью. Скоро составлю честный обзор на другие кошки, а не эту вводную ерунду. Начать с чего-то было нужно. Пока можете прочитать что-нибудь интересное у меня в профиле.

Время на прочтение

Коты – животные непростые, и хотя самым продвинутым спикером среди них считается Чеширский кот, наш Васька из Лукоморья сказки говорит не хуже британца. В этом посте мы расскажем вам о том, как мы выбирали CAT (Computer-Aided Translation — систему автоматизированного перевода) для синхроподкастов, какую выбрали и почему.

Есть такой онлайн-сервис – тексты выравнивать!

Сколько ни штудируй английскую грамматику, ни зубри слова, а понимать английскую речь на слух это не поможет. Чтобы научиться ловить смысл сказанного надо слушать, слушать и еще раз слушать английскую речь. Именно поэтому в конце 2017 мы выпустили новый продукт — синхроподкасты — обучающие ролики с видео, аудио и синхронизированным текстом.

Синхронные подкасты позволяют одновременно слушать английскую речь (текст читается очень разборчиво, в медленном темпе), видеть соответствующие события на экране и читать перевод текущего фрагмента речи.

Создание синхроподкастов — процесс сложный, но благодаря тому, что материал должен отвечать привычной учебной форме (типичные тембры, четкая артикуляция, произношение, близкое к эталонному), здесь удается применять технологию автоматизированного перевода. Для тех, кто не в теме: автоматизированный перевод и машинный перевод — это не одно и то же. Термином «машинный перевод» называют действие, когда текст переводится с одного естественного языка на другой с использованием специального программного обеспечения. Автоматизированный перевод отличается тем, что весь процесс перевода осуществляется человеком, компьютер лишь помогает ему произвести готовый текст либо за меньшее время, либо с лучшим качеством.

Какие CAT-системы мы анализировали при выборе

Приступая к созданию синхроподкастов, мы, конечно, обозрели широкий арсенал систем САТ. Если вы попробуете поискать такие программы в Гугле или Яндексе, то одной из первых в списке будет CAT-система Deja Vu.

Deja Vu. Это очень простая программа, без нагромождений и лишнего функционала, разработанная испанской компанией Atril Language Engineering, специализирующейся на разработке компьютерных систем для автоматизации работы переводчиков и переводческих агентств. Но и возможностей у нее не очень много. Достоинство – занимает мало места на компьютере.

Deja Vu X может создавать проекты и работать с форматами Microsoft Word, Rich Text Format, Windows Help, Microsoft Excel, Micosoft PowerPoint, Microsoft Access, OpenOffice/StarOffice, Adobe FrameMaker MIF, Adobe InDesign, Adobe PageMaker tagged text, QuarkXPress XTG, Interleaf ASCII, HTML, ASP/ASP.NET, PHP, JavaScript, VBScript, HTML Help, SGML, XML, RC, C/C++/Java, Java properties, IBM TM untranslated segments, Trados WorkBench documents, TradosTag TTX, Trados TagEditor BIF, Trados TagEditor TMX, GNU PO и POT files и файлами в кодах ASCII.

Версия Deja Vu Х Standard рассчитана на переводчиков-фрилансеров, желающих иметь простой и удобный инструмент для работы. Позволяет создавать полноценные проекты, однако в ней отсутствуют некоторые автоматизированные функции, которые есть в версии Professional.

Целевая группа профессиональной версии — те же переводчики-фрилансеры. Но Déjà Vu Professional уже обладает такими автоматизированными функциями, как предперевод, автопоиск по базам данных, автоподстановка перевода по всем аналогичным сегментам на проекте, автопополнение баз данных, а также автосборка перевода из фрагментов, хранящихся в базах данных. Использование функций Лексикона позволяет создавать глоссарии на основе переводимых проектов, определить частотность употребления терминов и использовать полученные глоссарии для контроля качества.

Для агентств и отделов переводов выпущена версия Deja Vu Workgroup. Это достаточно мощный инструмент, включающий все функции версии Professional, и дополненный функционалом для организации коллективной работы, управлению проектами и интеграции.

Deja Vu X TeaM Server – еще более продвинутая система, дает возможность пользователям Deja Vu X2 Workgroup делиться базами данных в режиме реального времени по всему миру. Обеспечивает единообразие и производительность, уменьшает проектные затраты. Разные схемы лицензирования могут снизить или совсем исключить ручное администрирование проектов.

MemoQ — еще одна широко распространенная CAT-система. Ее любят локализаторы, поскольку в отличие от других она совместима с файлами Excel. В MemoQ можно загружать разные типы файлов, и она не привередлива к их объему и содержанию. Но у нее непривычный функционал, и многие пользователи, имеющие опыт работы с другими системами, на первых порах испытывают трудности в настройке.

MultiTerm — программа, которую переводчики используют для создания базы переводов, популярна в узкоспециализированных сообществах, которые занимаются переводами текстов по определенным тематикам. Одно из достоинств MultiTerm — возможность создавать глоссарии для использования в CAT-системах, которые впоследствии вручную можно подключить к автоматизированным системам. Но есть и недостатки. Программа не отличается дружественным интерфейсом, и новичкам довольно сложно разобраться в настройках.

Across — также достаточно популярная система с простым интерфейсом. Но отношение к ней неоднозначно. Все дело в «прозрачности»: проектные данные находятся в открытом доступе. Такой системой можно пользоваться, если вопрос о защите данных не актуален.

XTM — сложная система, используемая крупными компаниями в промышленных целях. Рассчитана на масштабные проекты и большие объемы данных. Главное — суметь правильно ее настроить. Тогда пользователям будет удобно с ней работать, они сэкономят массу времени. А вот переводчикам эта программа вряд ли подойдет.

TRADOS. Все перечисленные выше системы по тем или иным параметрам уступают яркому лидеру среди коммерческих систем – Trados. Этот продукт разработан немецкой компанией Trados GmbH, и является одним из мировых лидеров в данном классе. У системы огромное количество достоинств. Среди ключевых — на данный момент Trados поддерживает 93 языка (больше, чем все остальные системы). И по объему базы памяти переводов она лучше всех известных нам систем. Из недостатков можно отметить специфичный интерфейс. Впрочем, удобство интерфейса – дело вкуса и привычки. Есть проблемы с поддержкой некоторых форматов. Она привередлива к объему и типу файлов (например, уступает по этому параметру MemoQ). И Trados совсем не умеет извлекать текст из картинок.

SmartCAT. Это бесплатная облачная браузерная среда, обеспечивающая совместную работу целой команды переводчиков. Разумеется, SmartCAT — не первая в своем классе. Но по многим параметрам она опережает аналоги, как платные, так и бесплатные. Почему так получилось, становится понятно, если мы поинтересуемся происхождением этой системы. Изначально разработчиком SmartCAT была компания ABBYY, она-то и заложила в продукте широкие функциональные возможности. Сегодня Smartcat — самостоятельная фирма.

Почему мы выбрали SmartCAT

Рассмотрим подробнее функционал системы. Ее главный козырь – многочисленные лингвистические ресурсы, облегчающие работу переводчиков с однотипными текстами, содержащими стандартные фразы и предложения. Как правило, это общепринятые термины — технические, юридические, экономические, научные и т.д., описания товаров и услуг, деловая документация и многое другое. Тут ключевую роль играют базы Translation Memory — базы памяти переводов. В них хранятся когда-то переведенные тексты. Понятно, что эти базы постоянно пополняются новыми переводами.

Другой важный ресурс — глоссарии, которые содержат термины и понятия, принятые в какой-то конкретной отрасли, или компании. SmartCAT позволяет накапливать и поддерживать в актуальном состоянии корпоративные глоссарии и обеспечивает исполнителей правильными данными. А автоматические проверки гарантируют контроль качества перевода, обнаруживая несоответствия в терминах и датах, и отмечая орфографические, пунктуационные и другие ошибки.

Само собой, SmartCAT способна также выполнять и машинный перевод.
Указанные ресурсы системы облегчают работу человека, использующего CAT. Система предлагает варианты перевода отдельных фрагментов, опираясь на имеющиеся тексты из баз памяти переводов и глоссарии с корпоративной терминологией. Переводчик может просто воспользоваться предложенным вариантом, либо отредактировать его, либо, в крайнем случае, перевести текст по собственному разумению.

Особо следует остановиться на форматах файлов, поддерживаемых системой SmartCAT. Их список весьма внушителен: bmp, dcx, pcx, png, jp2, jpc, jpg, jpeg, jfif, tif, tiff, gif, pdf, djvu, djv, jb2, docx, doc, txt, rtf, odt, xlsx, xls, ppt, pptx, potx, pps, ppsx, odp, ttx, sdlxliff, xlf, xliff, srt. Обращает внимание то, что в приведенном списке немало графических форматов. Это приятное наследие ABBYY. Нередко переводчикам приходится работать с документами не в виде текста, а в виде изображений. Чтобы извлечь текст, его необходимо сначала распознать. SmartCAT интегрирован с OCR-технологиями ABBYY: достаточно загрузить графический файл, и система извлечет текст для перевода. Если вам хоть раз приходилось вручную вбивать текст, глядя на картинку, вы по достоинству оцените прелесть использования OCR-технологии.

Еще один комплимент от ABBYY — возможность использования словарей Lingvo. Небольшое, но все же удобство, когда все необходимое для перевода у вас под рукой.

Когда в описании системы встречаются слова «облачная среда», многие потенциальные пользователи рефлекторно напрягаются: «А как обстоят дела с безопасностью? Не украдут ли мои данные?» Ответим честно: взломать можно что угодно. Просто целесообразность взлома определяется соотношением затраченных времени и сил, и полученным результатом. В системе SmartCAT данные хранятся в дата-центре уровня Tier 4 и передаются по защищенным каналам, а уровень доступа к материалам регулируется с помощью системы распределения прав.

Заканчивая краткое описание SmartCAT, добавим, что интерфейс системы интуитивно понятен любому, кто когда-либо работал с CAT-инструментами: вы увидите на привычном месте оригинальный текст и перевод, окно совпадений с памятью переводов и глоссарием. Имеется отдельное окно для поиска в памяти, глоссариях и словарях, и еще одно окно — для результатов проверки качества, истории изменений фрагмента текста и комментариев.

Ну и еще несколько функций и особенностей, которые нельзя обойти молчанием

Хорошенько проанализировав весь арсенал достойных внимания систем САТ, в финале мы выбирали из двух: Trados и SmartCAT. Сравнение их функциональных возможностей показало, что примерно на 95% (это субъективная оценка автора) данные системы идентичны. С одной стороны, большее число поддерживаемых языков и больший объем базы памяти переводов Trados, с другой, дружелюбный интерфейс, поддержка графических форматов и способность извлекать текст из изображений, меньшая требовательность к объему файлов, масса полезных дополнительных функций и бесплатность SmartCAT.

В итоге мы выбрали SmartCAT. И хотя британец Тrados (сегодня система принадлежит британской компании SDL International) хорош и в моде, российская система CAT по ряду параметров превосходит зарубежный аналог и при этом проста в использовании, удобна и не капризна.

Константин Геращенко, редактор образовательного онлайн-ресурса Puzzle English

Автоматизированный перевод — это широкое и не совсем точное понятие, охватывающее широкий спектр простых и сложных инструментов. Они могут включать:

Этапы перевода и применение в процессе перевода САТ-инструментов

В процессе перевода определенного текста или документа можно выделить несколько его этапов:

Применение САТ-системы дает возможность большую часть производимых процессов выполнить в одной среде, не выгружая документ в другие программы. Данный процесс происходит следующим образом: после этапа верстки документа проектный менеджер загружает полученный документ, или материал, в систему. После его загрузки в систему также менеджером определяются требуемые для перевода настройки, а также подключает необходимые вспомогательные материалы. После этого устанавливаются сроки исполнения заказа, и непосредственно происходит отправка заказа исполнителям.

«Современные САТ-системы и подходы к их использованию в различных подвидах письменного перевода» 👇

Сама система подразумевает возможность разделения документа между несколькими переводчиками, скрытия определенных фрагментов, которые не требуют перевода, а также подключение одновременно к процессу работы редактора. Единственной оставшейся задачей менеджера является правка формата исходного файла, поскольку объем текста перевода и текста оригинала может быть разным, что является довольно частым явлением.

Анализируя работу САТ-систем можно с уверенностью утверждать, что их применение значительно экономит время и деньги. Поскольку специалисту-переводчику уже не приходится тратить свое время на поиск тех или иных терминов, они уже сохранены в базе и утверждены заказчиком. Части документов, имеющие 100-процентное совпадение, переводятся автоматически, что также значительно экономит время переводчика. Кроме этого применение САТ-систем позволяет сохранить единство терминологии и стиля, характерные для текстов одного заказчика.

Технологии в области письменного перевода

Рабочий процесс современного переводчика уже невозможно представить без вспомогательных систем и автоматизированных программ, позволяющих ускорять работу в разы. В первую очередь технологии проникли в область письменного перевода.

Машинный перевод все также популярен и стремительно совершенствуется. Взяв на себя трудоемкий процесс поиска и перевода незнакомых выражений, компьютер позволяет переводчикам значительно сэкономить время. Совершенствование машинного перевода может способствовать тому, что в будущем специалистам придется работать исключительно над редактурой машинного текста.

Эта тенденция уже проявляется. Машинный перевод часто путают с автоматизированным, что в корне неверно, поскольку последний подразумевает использование сложных систем и инструментов, созданных для разных видов перевода.

CAT-инструменты (Computer Assisted Translation tools) знакомы почти всем, кто занят в сфере профессионального перевода.

Это целый комплекс программ, включающий:

Особенно эффективно применение подобных систем в сферах перевода с высокой частотностью повторений текстов, например, в финансовой, технической или юридической деятельности. Использование CAT-средств также позволяет нескольким переводчикам одновременно работать над общим проектом, осуществляя согласованный по терминологии и стилистике  перевод.

MultiTerm

Программа, которую переводчики повсеместно используют для создания базы переводов (TB-term base). Особенно популярна у узкоспециализированных переводчиков, которые берутся за переводы текстов определенной тематики. Основное преимущество – создает глоссарии для использования в CAT-системах, которые впоследствии можно подключить к TRADOS, или к другим автоматизированным системам вручную.

Есть такой онлайн-сервис – тексты выравнивать!

Главный минус в том, что эта программа создана конкретно под семейство SDL-продуктов и не особо «юзер-френдли». Новичкам довольно сложно разобраться в настройках.

Возможно, ни для кого во всем мире наш демократический язык не имеет такого значения, как для рабочих, и я надеюсь, раньше или позже, но рабочие станут самой сильной опорой нашего дела. Рабочие не только испытают пользу эсперанто, но они также и больше других почувствуют суть и идею эсперантизма.

была основана на XIII всемирном конгрессе эсперантистов в Праге в 1921 году, на котором состоялось собрание 79 представителей рабочего эсперанто-движения из 15 стран. Инициатором создания стал французский эсперантист Эжен Адам, известный более под псевдонимом Эжен Ланти. В первые годы в рамках организации развивалась идеология безнационализма, однако официально она так и не была принята.

Международный конгресс эсперантистов в Ленинграде на марке СССР 1926 года

Практическая реализация идеи автоматизированного перевода началась с момента появления компьютеров: переводчики всегда выступали против стандартной в те годы концепции МП, на которую было направлено большинство исследований в области компьютерной лингвистики, но поддерживали использование компьютеров для помощи переводчикам.

В настоящее время наиболее распространённые способы использования компьютеров при письменном переводе — работа со словарями и глоссариями, памятью переводов (англ. translation memory, TM), содержащей примеры ранее переведённых текстов, терминологическими базами, а также использование так называемых корпусов, больших коллекций текстов на одном или нескольких языках, что даёт сжатое описание того, как слова и выражения реально используются в языке в целом или в конкретной предметной области.

Для локализации программного обеспечения часто применяются специализированные средства, например, Passolo, которые позволяют переводить меню и сообщения в программных ресурсах и непосредственно в откомпилированных программах, а также тестировать корректность локализации. Для перевода аудиовизуальных материалов (главным образом фильмов) также используются специализированные средства, например Aegisub, которые объединяют в себе некоторые аспекты памяти переводов, но дополнительно обеспечивают возможности появления субтитров по времени, их форматирования на экране, следования видеостандартам и т. п.

В узких предметных областях при большом количестве исходных текстов и устоявшейся терминологии переводчики могут использовать и машинный перевод, который может обеспечить хорошее качество перевода терминологии и устойчивых выражений в узкой области. Переводчик в этом случае осуществляет пост-редактирование полученного текста. Более половины текстов внутри Еврокомиссии (главным образом юридические тексты и текущая корреспонденция) переводится с использованием МП.

Искусственный интеллект и САТ-системы

Понятие искусственного интеллекта чаще всего можно встретить, когда речь идет о нейронно-машинном переводе. Однако в настоящее время данное понятие можно также встретить и в контексте САТ-систем, а точнее САТ-инструментов. Минимальный набор инструментов, который предлагают САТ-системы – это непосредственно встроенная система нейронного перевода, содержащая в памяти переводы и базы терминов.

Однако, анализируя статьи разработчиков систем SDL, можно заметить, что в них не упоминается термин «постредактирование» с применением нейросетей. Согласно их определениям нейросети выполняют не редактирование работ, а непосредственно «проверку» качества перевода.

Как правило, точность системы для пары «английский-русский» составляет 95%.

Но не все разработчики нейросетей считают также. Разработчики «Memsource» активно применяют нейросети в своих программах. По их мнению, нейросети способны значительно сократить время, затраченное на перевод текста. Данный процесс осуществляется при помощи полной автоматизации перевод текста. Но и в данном случае переводчики не испытывают полного доверия к нейросетям, особенно, если это касается проверки текста, поскольку нейросети не способны найти ошибку, которую еще не встречали.

Находи статьи и создавай свой список литературы по ГОСТу

Поиск по теме

XTM

Сложная система, используемая крупными компаниями в промышленных целях. Подразумевает работу с масштабными проектами и огромными объемами данных.

Есть такой онлайн-сервис – тексты выравнивать!

Главный минус программы – ее специализированность. Если компания ее настроила правильно, то ей будет очень удобно пользоваться. Можно сэкономить массу времени на переводе. А переводчику с разными заказами такая программа не подойдет.

а) использовать на практике язык эсперанто для общих целей рабочего класса во всём мире;б) как можно лучше и доступнее облегчать взаимоотношения между своими членами, таким образом, способствуя росту у них общечеловеческой солидарности;в) обучать и просвещать своих членов таким образом, чтобы они становились самыми сознательными из всех так называемых интернационалистов;г) служить посредником в отношениях между разноязычными ассоциациями, чьи цели соответствуют целям ;д) стимулировать и всеми средствами способствовать созданию литературы (оригинальной и переводной), отражающей идеалы ассоциации.

Виды САТ-систем

На сегодняшний день существует большое количество различных САТ-систем. Принцип работы всех систем примерно одинаков, но, тем не менее, каждая из них обладает определенными уникальными инструментами, выделяющими ее из всех систем.

Например, на данный момент все большую популярность набирают облачные системы перевода. Яркими примерами облачных систем являются системы «SmartCAT», «MateCat» и «Memsource». Отличительной характеристикой данных систем является то, что при работе в рамках данных систем у менеджера появляется возможность подключать необходимые базы и глоссарии еще на стадии запуска проекта. Данная особенность значительно сокращает сроки работы над проектом и, следовательно, экономит выделенный бюджет. Еще одной особенностью является возможность менеджера контролировать соблюдение установленных сроков.

Рассматривая необлачные системы, можно выделить определенное программное обеспечение для переводчиков, которые поддерживают большое количество языков, а также различные файловые форматы. Данная особенность является большим преимуществом, поскольку в таком случае совместимость различных файлов также может быть гарантирована. Ярким примером таких ПО являются «SDL Trados» или «memoQ».

Перспективы развития переводческого бизнеса

Подобное высокотехнологичное решение отвечает одному из главных требований современного рынка услуг – высокой скорости их оказания.

Формат «здесь и сейчас» стремительно набирает обороты, и переводческая сфера не осталась в стороне. Этот бизнес уже не может существовать без программных решений, а тем более без участия человека в процессе управления проектом и его выполнения. Ускорение темпов оказания услуг и насыщение рынка в любой сфере будет только прогрессировать и те, кому удастся предложить что-то большее, возглавят этот прогресс.

В сфере перевода, как и в любой другой, необходимо непрерывно искать новые продукты. В то же время требуется разумный и грамотный подход к управлению ресурсами внутри компании. Интернет-платформы – будущее переводческого бизнеса.

Софт станет мощнее и проще на основе систем программного перевода, но необходим и контроль со стороны высококвалифицированных переводчиков, которые всегда будут востребованы. Машинный перевод, наряду с автоматизированным и устным, будет развиваться и совершенствоваться. Уже сегодня наметился тренд к консолидации переводческого бизнеса среди крупных игроков на рынке.

Материалы по теме:

Трудности перевода: эксперты – о самых частых ошибках в деловом английском

4 причины сделать локализацию продукта по-человечески

Продукт продается пользователю, а не покупателю

Стартапчики: Abracadabra — живой переводчик в смартфоне

Зачем учить иностранные языки в эпоху технологий

Déjà Vu

Очень простая программа, ничего лишнего, но и возможностей очень мало. Не займет много места на компьютере.

Есть такой онлайн-сервис – тексты выравнивать!

Популярна в силу своей простоты.

OmegaT

Программа бесплатна в использовании, но не поддерживает работу в MS Word.

Есть такой онлайн-сервис – тексты выравнивать!

Это плюс для тех, кто любит простой софт, где нет ничего лишнего. Но для профессионала такой вариант не подойдет. Есть необходимый минимум, но не более.

Современные САТ-системы

САТ-системами называют системы автоматизированного перевода, которые в значительной степени могут упростить для переводчика сам процесс перевода. САТ-системы в народе принято называть «кошками», от английского слова «cat» — «кошка». Сущность САТ-систем заключается в разделении текста на определенные сегменты, или предложения, и представление их в удобном интерфейсе перевода. Первоначальный текст выделенного сегмента, а также непосредственно сам его перевод сохраняются в качестве единицы перевода в базе памяти переводов («translation memory») и носят название «translation unit». Таким образом, сохраненные единицы перевода могут быть использованы в работе с тем же текстом или в работе с другими текстами. Помимо этого, в системе параллельно идет поиск терминов в других базах и автоматически может быть предложен тот или иной его перевод.

Сдай на права покаучишься в ВУЗе

Вся теория в удобном приложении. Выбери инструктора и начни заниматься!

Получить скидку 4 500 ₽

Основными функциями САТ-систем является сохранение в памяти переводов, автоматическая проверка качества переводов, а также машинный перевод текста. Однако, кроме указанных основных функций САТ-систем, существует еще ряд дополнительных функций таких, как анализ текста, подсчет слов, сегментов и единиц, а также проверка правописания. При выполнении работы переводчик может управлять уже существующими терминами или добавлять свои собственные словари и базы терминов.

Во время редактирования MateCat собирает информацию о времени работы с каждым сегмента, которая обновляется каждый раз, когда сегмент открывается и закрывается. Более того, для каждого сегмента сохраняется информация о всех вариантах перевода, предложенных системой, и о том варианте, который был выбран при окончательном редактировании. Эта информация доступна в любое время по ссылке «Редакция» на странице редактирования (Рис.1). Кроме того, для каждого сегмента, отсортированного от самого медленного до самого быстрого с точки зрения скорости перевода, сообщается подробная статистика о времени операций редактирования, что является источником информации для анализа производительности после завершения проекта.

TRADOS

Это профессиональное программное обеспечение для автоматизированного перевода. Включает множество возможностей и тонких настроек. Программные модули позволяют работать в непредвиденных ситуациях. Подходит для ведения крупных проектов и используется в основном переводческими компаниями.

Есть такой онлайн-сервис – тексты выравнивать!

Минус системы в ее сложности и том, что переводчикам требуется много времени на освоение программы. Тем не менее множество компаний работают на базе TRADOS именно ради специфических настроек, которые не реализованы в других системах.

Преимущества CAT-систем

Почему профессиональные переводчики сегодня все больше отдают предпочтение автоматизированному переводу? Ответ довольно прост. Самое большое преимущество CAT-систем  – это «переводческая память» (Translation Memory).

Она позволяет накапливать в базе переводов данные и создавать тематические глоссарии в различных отраслях знаний. Таким образом, переводчику не нужно каждый раз заново осуществлять перевод того, что он уже когда-то делал. В базе сохраняются большие массивы данных и готовые переводческие шаблоны, позволяющие очень быстро осуществлять качественный перевод.

Техническая, юридическая или другая узкоспециализированная документация, как правило, изобилует специфической лексикой и устойчивыми выражениями. Тут-то и приходит на помощь автоматизированная CAT-система. Достаточно загрузить в нее документ, и она проанализирует в соответствии с накопившейся базой все возможные варианты перевода.

На сегодняшний день на рынке представлен довольно широкий спектр CAT-систем автоматизированного перевода: от простых в управлении и доступных любому обывателю до сложных программ, используемых для осуществления крупных проектов. Далее представлен список наиболее популярных технологических решений, позволяющих ускорить и упростить процесс перевода.

Есть такой онлайн-сервис – тексты выравнивать!

В помощь трудящимся на ниве перевода наша компания выпустила полезный инструмент для выравнивания параллельных текстов, ABBYY Aligner, вместе с онлайн-сервисом Aligner Online. В этой заметке я расскажу о том, что это за сервис, кто такие параллельные тексты, почему их выравнивают и для чего все это надо.

В компаниях, которые работают с иностранцами, всегда много бумаг на разных языках — контракты, инвойсы, статьи и т.д. Отсканированные и распознанные FineReader’ом, оригиналы и переводы не прохлаждаются в электронных запасниках-архивах, ожидая, когда их командируют на печать или перебросят кому-то на мыло, а активно используются в специальных программах для перевода новых документов.

Умные люди уже давно поняли, какой это неблагодарный труд – с нуля переводить тематические тексты, в которых постоянно встречаются определенные термины, фразы-клише, отдельные предложения и даже целые абзацы, а потом искать подобные совпадения вручную по всем папкам и архивам. И поэтому на свет появились полезные программки для переводчиков – CAT-средства (Computer-Assisted Translation Tools) или, как их называют в народе, «кошки». А вместе с ними появились специальные базы данных (базы Translation Memory), где хранятся выровненные параллельные тексты – оригиналы и переводы документов на всех рабочих языках, разбитые на сегменты, которые соответствуют друг другу по смыслу.

Чтобы создать самую простую базу ТМ, достаточно взять оригинал и его перевод, выровнять эти параллельные тексты и сохранить в международном формате TMX, который «едят» практически все «кошки». Чем больше текстов в нашей базе, тем лучше.

Сервис Aligner Online и его старший десктопный «брат» Aligner (у которого больше профессиональных фич в силу десктопности) «заточены» как раз под выравнивание параллельных текстов и создание баз Translation Memory. С помощью сервиса удобно работать с небольшими текстами, когда нам не интересна подсветка ляпов и косяков, просочившихся в наши файлы, не нужно тщательно редактировать результат или ни к чему автоматическая обработка внушительного количества документов. Другие прелести Aligner Online заключаются в том, что он бесплатный, не требует регистрации, «говорит» на 10 самых ходовых европейских языках и довольно быстро соображает.

Благодаря САТ-средствам и базам ТМ повышается качество перевода и скорость его выполнения. Переводчики в выигрыше: им не нужно делать двойную работу, затрачивая силы и время на уже переведенные или повторяющиеся сегменты текста, плюс они могут выполнить больше заказов и больше заработать. Компании-заказчики так же выигрывают: все привычные термины и клише оказываются на своих местах, и повторно платить за уже оплаченные фрагменты текста не надо – стоит только предложить бюро переводов собственную базу ТМ. Так что двигатель прогресса – это все-таки не лень, а умная экономия усилий :)

Есть такой онлайн-сервис – тексты выравнивать!

Десктопная версия Aligner

Есть такой онлайн-сервис – тексты выравнивать!

SAT и СССР

Если в письменном переводе на помощь профессионалам приходит множество программ и технологий, то сфера устного перевода, будь то синхронный или последовательный перевод, все еще опирается на профессиональные навыки переводчика.

Однако и в этой области технологии могут значительно упростить процесс. Речь идет о возможности в любой момент воспользоваться услугами устного перевода.

Такое решение разрабатывает наша компания. Оно позволяет при помощи смартфона или планшета осуществлять видеоудаленный перевод.

Такие сервисы существуют и на Западе. Например, в США есть аналоги, которые начали формироваться в то же время, что и наш сервис. Одна из крупнейших компаний Language Line, ранее занимавшаяся телефонным переводом, стала внедрять услугу видеоперевода и видеоперевода с языка жестов. Компания Purple также занимается переводом с языка жестов, в том числе предлагая и видеоперевод. В свою очередь Certified Languages International запустила видеоудаленный перевод после 20 лет устных и телефонных переводов.

Видеоудаленный перевод – это следующий шаг в развитии этой отрасли и уже очевидно, что это направление будет развиваться и дальше.

Прогрессивная онлайн-платформа, реализовавшая идеи пользователей CAT-систем. Включает возможность работы с множеством плагинов (машинного перевода, QA). Из плюсов – удобный интерфейс. Это одна из самых простых в освоении программ.

Есть такой онлайн-сервис – тексты выравнивать!

Из минусов – частые ошибки и проблемы в работе с большими файлами. Несмотря на ряд недочетов и недоработок, популярна среди фрилансеров, так как позволяет значительно ускорить процесс перевода, а также, помимо CAT-системы, является подобием проектного портала. В ней имеется база клиентов для переводчиков, а также база исполнителей для клиентов, подкрепленная возможностью вести взаиморасчеты прямо в системе.

История создания программы

Консорциум проекта возглавляет FBK (Fondazione Bruno Kessler), международный исследовательский центр, базирующийся в Тренто, Италия.

Across

Достаточно популярная система. Несмотря на простой интерфейс, достаточно неудобна в использовании. Ее неоднозначность в «прозрачности» – проектные данные находятся в открытом доступе. Подойдет для работы, если не важен вопрос о защите данных.

Есть такой онлайн-сервис – тексты выравнивать!

Across крайне популярна в Европе, в отличие от России. Еще один существенный минус в том, что допущенную ошибку не так-то просто исправить (как, например, в «Смарткат»).

MemoQ

Эта система пользуется особенным успехом у локализаторов, поскольку в отличие от других она совместима с мультиязычнымм файлами Excel. В нее можно загружать самые разные типы файлов, и, в отличие от TRADOS, она не привередлива к объему и содержанию файлов.

Есть такой онлайн-сервис – тексты выравнивать!

Однако она менее популярна среди переводчиков, так как у программы непривычный функционал, и многие, кто знаком с TRADOS сперва испытывают некоторые трудности в настройках. Тем не менее MemoQ особенно ценят локализаторы и программисты, в этой среде она очень популярна.

AfterScan

Отличная программа для автопроверки и корректировки исходников. Обнаруживает опечатки, пробелы, ошибки в распознавании. Программа условно бесплатная (функционал на 100% есть только за плату), для работы с англоязычными текстами нужна совершенно другая ее версия. Это, безусловно, существенный недостаток.

Есть такой онлайн-сервис – тексты выравнивать!

Из плюсов нужно отметить русскоязычный интерфейс, безлимитный размер пользовательского словаря и широкие возможности редактирования OCR.

Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: