Немного об инструментах перевода

Один из первых вопросов, который появляется у переводчиков игр, когда текст уже распакован — а где собственно мы будем переводить игру? Тут начинаются варианты. Всё зависит от объёма проекта, структуры текста и, что важнее всего, предпочтений самих переводчиков. И, что немаловажно, от количества людей, работающих над проектом и того, как осуществляется контроль качества на проекте. Поэтому все системы можно рассматривать, исходя из нескольких критериев: сложность и удобство в работе, функционал, возможность распределения работы между несколькими переводчиками и возможности по контролю качества проекта.

От редакции: текст взят из группы FaceOff и опубликован одним из пользователей.

Начнём с самого универсального софта. Даже для тех, кто не занимался непосредственно переводом, наверняка знакома программа Notepad++. При всей кажущейся простоте у этой программы и её аналогов много встроенных функций и практически бесконечная возможность их расширения с помощью плагинов. Даже при использовании других более узкоспециализированных программ для переводчиков, многими функциями я продолжаю пользоваться в ней.

Помимо того, что это, собственно, мощный редактор, отмечу возможность настройки синтаксиса (выделить или даже скрыть сегменты текста, которые не нужно переводить и которые, в принципе, лучше не трогать), гибкую возможность автозамены по файлу или всем файлам в папке (т.н. регулярные выражения — друзья переводчиков игр), возможность проверки явных грамматических ошибок с помощью спеллчекера, проверка превышения допустимого количества символов в строке с помощью линейки. Из естественных минусов программы можно отметить, что она всё-таки не затачивалась под перевод. Она никак не помогает при работе нескольких переводчиков, так как не является некой единой для них онлайн средой. Впрочем, на некоторых проектах её функций вполне достаточно. Такие игры, как Ittle Dew 2+ и Cadence of Hyrule были без проблем полностью переведены в одно лицо в этой программе.

143527-WUyDAUyWUEk.jpg

Фрагмент текста Xenoblade. Без использования синтаксиса глаза быстро собираются в кучку.

Даже с составленным глоссарием иной раз в тексте натыкаешься на незнакомый термин, для перевода которого не хватает контекста. Когда интернет бессилен и не может подсказать хоть что-то о его значении, остаётся копать саму игру. Разобранный текст игры чаще всего находится не в одном файле, а в нескольких. Или — в нескольких сотнях файлов (порой с ни о чём не говорящими именами) в папках, которые находятся в других папках внутри ещё более крупных папок. Для поиска контекста возникает необходимость поиска по всем файлам. В таких случаях я, например, пользуюсь отдельной маленькой программкой Folder Find Text.

143524-OyRvOH5igms.jpg

Поиск показал, что Гоблин — не только монстр, но карта для мини-игры, а также упоминается в сюжетной сцене и на экранах обучения

Такой поиск полезен не только на этапе перевода. Ещё больше от него пользы, когда игра находится на стадии тестирования, потому что по тексту со скриншота с ошибкой можно быстро найти файл, в котором находится этот фрагмент. Например, в Tokyo Mirage Sessions мы сняли под тысячу скриншотов (вылезание текста, пунктуация и прочие ошибки), когда перевод был совсем сырой, и по большинству их приходилось вот так искать текст. Ведь даже при хорошо знакомой структуре текста, расположение отдельных его фрагментов бывает неочевидным.

Довольно распространённым вариантом для перевода является использование таблиц типа Excel. Таблицы от google бесплатны и их онлайн-функции компенсируют отсутствие оных у того же редактора вроде Notepad++. Становится возможным организовать работу нескольких переводчиков. Текст можно разбить либо между несколькими таблицами, либо их листами, либо даже слить всё на одну кажущуюся бесконечной страницу. В одном столбце английский вариант, в другом русский. Дальше начинаются варианты. Можно добавить столбец комментариев, можно для справки привести японский оригинал… короче всё, что будет полезно и придёт в голову переводчикам. Достаточно легко прикручиваются различные счётчики, которые контролируют длину строки или факт перевода/редактуры для подсчёта общей статистики. Нумерация строк помогает разбить текст между несколькими переводчиками. Все недостатки сводятся к тому, что опять же эта среда изначально универсальная и не была предназначена для переводов. Из неё при желании можно выжать многое, прикручивая что-то, но не раз мы натыкались на невозможность реализации того или иного облегчающего жизнь пожелания, мирились с этим и работали как есть.

143526-Ws2Kl8TVstI.jpg

В одной таблице идёт перевод на несколько языков. Вдруг вы захотите для разнообразия пройти Марио на греческом.

Кому-то вариант таблиц покажется тривиальным, но опять же для проектов среднего объёма он неплохо подходит. Таким образом были переведены Dusk Diver, Paper Mario Origami King, Phoenotopia Awakening, Mail Mole, Prison Princess. В таблицах также начинался перевод Daemon ex Machina, пока не был перенесён на «ноту». Иногда в таблицы удобно просто заливать результат работы, так как он доступен всем внутри группы переводчиков.

Ещё пара моментов касательно таблиц из опыта работы с ними. Таблица Paper Mario Origami King можно считать филиалом Организации Объединённых Наций, потому что там помимо русского идёт перевод ещё на несколько языков. Соответственно, при желании и возможности переводчики могут подсмотреть друг у друга перевод тех или иных моментов, терминов и тому подобного. Меня очень умиляет сам факт такого интернационального перевода.

143526-S55xrgf3I9Y.jpg

Так называемый «лок-кит» Phoenotopia Awekening. Очень удобно, что разработчик оставил много комментариев по самым различным аспектам игры.

А также вы могли заметить, что в списке проектов, переведённых в таблицах, были два официальных проекта. Дело в том, что такая среда удобна и многим инди-разработчикам. В Фенотопии в какой-то момент это сыграло с нами шутку: мы думали, что переводим копию текста, а оказалось, что вставляем свой перевод в основной файл, оригинал таблицы. И что все наши несерьёзные комментарии видны разработчикам, среди которых оказалась девушка, знающая русский язык… остальное можете додумать сами.

143525-ppsZocifB0M.jpg

Интерфейс Trello. Всё можно сделать довольно красиво.

Возможно кто-то вспомнит проект перевода игры Detective Pikachu. Так вот он был организован на площадке под названием Trello. Этот сайт не столько среда для переводчиков, сколько пространство для выполнения крупных задач, которые разбиваются на более мелкие задачи. На трелло можно создать несколько досок под каждый проект. Основа - карточки, олицетворяющие какое-то задание (например разработка шрифта). Для этих карточек можно создать категории, например "Нужно сделать", "В работе" и "Готово". Между категориями карточки переносятся простым drag&drop. Уже к задачам этим можно прикреплять конкретные файлы, участников (ответственных за задание), метки и срок. Главный минус: ограничение на количество досок для бесплатной версии. Сам я, если честно, в ней не работал, а пришёл, когда проект перевода впал в транс. Этот абзац написан со слов Кирилла, который застал работу над Детективом Пикачу и участвовал в ней, а мы, отмечу, трелло не используем из-за наличия более функциональных площадок для перевода.

143525-rFH6zjPu0qI.jpg

Poedit. В ней начинался перевод Dusk Diver. Сам я в нём не участвовал, поэтому вот вам случайный скриншот на немецком.

При написании этого материала мне подсказали, что часто для перевода используется инструмент под названием Poedit. В отличие от ранее представленных, это уже инструмент, заточенный под локализацию и в нём когда-то начинался перевод Dusk Diver. В этой же программе наши друзья из Digital Devil Translators переводят Shin Megami Tensei 4 (по их словам инструмент, довольно полезный). Отказались от его использования мы потому, что там сложно организовать работу нескольких переводчиков (совместный доступ продаётся в программе отдельно). Кэп упоминал, что мы как-то пробовали организовать на нём совместную работу через Git, но судя по тому, что работу мы заканчивали уже в гугл-таблицах, это видимо того не стоило. Сам я в этой программе не работал, поэтому и сказать про неё мне особо нечего.

Переходим к тяжелой артиллерии. Среди русскоязычного сообщества переводчиков манги, сериалов, игр и тому подобного контента пользуется популярностью сайт Notabenoid. Та самая «нота», которая уже звучала в этом тексте. Это полузакрытый форум переводчиков, куда можно загрузить свои файлы, разбить их на сегменты, назначить переводчиков и даже подключить словарь перевода (глоссарий). Несмотря на то, что на сайт довольно сложно попасть (нужно приглашение, причем даже у нас при работе их было ограниченное количество и не у всех), многое на нём подкупает и сделано довольно удобно. В переводимых сегментах автоматически проверяются грамматические ошибки, автоматически считается статистика перевода. В этой среде вполне можно работать, хотя со временем начинаешь понимать, что ей не хватает многих функций. А потом этих функций начинает сильно не хватать и на ноту уже не хочется возвращаться.

143523-CUEPiuxJlY0.jpg

Минималистичный интерфейс Notabenoid.

Многие переводчики, которым стала привычна эта среда, возразят, что всё самое нужное на этом сервисе есть. По крайней мере то, сколько на ней ведётся переводов, доказывает, что там есть достаточный минимум функций. Но при переводе Catherine Full Body вскрылись многие из недостатков сервиса, а перевод женского рута Persona 3 Portable стал последним проектом, который мы сделали на ноте. Что же неудобно на ноте?

  • не хватает проверки на наличие повторов в тексте. Допустим, один и тот же фрагмент текста попадается в 10 разных файлах. Они могут попасться разным переводчикам, а потом в игре окажется, что они переведены по-разному. Да, это может привести в порядок редактор, или сам переводчик может вручную поискать повторяющийся фрагмент текста и подставить его во всех таких ситуациях. Но это можно учесть, если программа изначально обрабатывает текст на наличие повторов. Переводишь текст один раз, и он автоматически подставляется в другие фрагменты. Звучит как излишество? Просто эта функция есть в среде, в которой мы работаем сейчас, и теперь при взгляде на ноту я понимаю, что этого там очень не хватает;
  • ограничение на количество строк в файле при их загрузке. Кажется, это как-то обходят с помощью скрипта, либо разбивают файл на части, но это тоже лишняя работа;
  • отсутствие автозамены по нескольким файлам или даже в рамках одного файла;
  • отсутствие возможности использовать машинный перевод. Да, он зачастую переводит текст отвратительно, но я сомневаюсь, что найдётся хотя бы один переводчик, который при работе ни разу не искал перевод отдельных слов в предложении. И вот иногда полезно на него опираться, чтобы увидеть вариант перевода. А если предложение простое и имеет однозначный смысл, то машинный перевод бывает даже вполне правильным;
  • отсутствие возможности использовать подгруженную извне память переводов. Допустим вы перевели одну часть Atelier Ryza и хотите перевести её продолжение. Вы думаете, что наверняка часть системных текстов совпадает между частями игры и можно подставить готовые материалы из первой части во вторую. Нет, на ноте эти материалы никак не использовать. Только подстановка вручную, только хардкор. Ну или не подгружать такие файлу на ноту и делать часть проекта там, часть тут. Думаю, пример понятен. Естественно, можно работать и без этого, но когда где-то можно сократить время работы его лучше сократить, правда?
  • отсутствие конкордансного поиска. Так, а это что за покемон? Это связано с памятью переводов. Возможность посмотреть в переведённых уже (и не только собой) сегментах как переводился тот или иной термин. Очень полезная фича, иногда даже заменяющая необходимость глоссария. Ведь при её реализации всегда можно вбить в поиск английский термин и посмотреть, как его перевели в прошлом. Очень удобно. Но на ноте этой функции тоже нет;
  • было бы здорово, если программа понимала, что определённые куски текста нужно сохранять не тронутыми и как-то их выделяла. Я сейчас про теги и прочий код, который можно случайно перевести или сломать игру, удалив лишнюю скобочку. За этим на ноте тоже нужно следить только вручную;
  • последнее, что пришло мне в голову — это работа с глоссарием. В каком-то виде он реализован на ноте и там можно проверить перевод термина. Но для того, чтобы найти перевод термина нужно вначале знать, что это важный термин. Почему бы не подсвечивать в оригинале совпадения с существующим глоссарием и не выводить в отдельном окошке перевод таких терминов? Тогда, в принципе, не нужно было бы лезть в глоссарий — знай себе, подставляй нужное совпадение с глоссарием в текст перевода. Но на ноте этого тоже нет.

В итоге, на ноте определённо можно работать. Но многие полезные функции так называемых CAT-систем на ней не реализованы. Из-за существования таких систем мы и узнали собственно, что на ноте их не хватает. Поговорим о них. Приведённая аббревиатура никак не связана с кошками и расшифровывается как Computer Assisted Translation. По сути это совокупность программ или сервисов, которые делают перевод удобным и минимизируют различные связанные с ним рутинные операции. Я бы сказал, что это верхний эшелон программ для локализации и поэтому стоимость их использования часто выше того, что готовы платить люди, занимающиеся фанатскими переводами. Но некоторые из этих программ имеют бесплатные версии, функций которых вполне достаточно для работы.

143522-2WFKPPODhkk.jpg

На первый взгляд интерфейс почти такой же, как и на ноте. Нюансы кроятся в меню сверху и других возможностях сервиса.

Хотя сервис не является единственной подобной бесплатной программой, мы уже довольно давно остановили свой выбор на системе под названием SmartCAT. Чтобы не перечислять заново, можете просто вернуться немного назад и прочитать недостатки ноты. Все эти функции в том или ином виде реализованы на смарткате. К недостаткам можно отнести, что с такими системами нужно чуть больше разбираться вначале, но доступный функционал это многократно компенсирует.

143523-J1FDEFyAJQ8.jpg

Как там я, в итоге, перевёл слово Goblin? А точно — как Гоблин… А если серьёзно, конкордансный поиск — очень полезная вещь.

Прежде всего, на этом сервисе можно зарегистрироваться как фрилансер или как организация. Всем переводчикам, успешно прошедшим тест, мы сразу же рекомендуем зарегистрироваться там, потому что на текущий момент все наши основные проекты ведутся там.

143527-yLLooDxp4es.jpg

Этот кот явно использует правильные инструменты перевода.

Сервис поддерживает различные форматы входных текстовых данных. Он автоматически разбивает их на сегменты, отчего с ними становится проще работать, ищет повторы и указывает, если фрагмент повторяется где-то в тексте. Есть поддержка памяти переводов, конкордансный поиск, автозамена, совпадения с глоссарием выделяются, а самое главное — можно распределять задачи между несколькими переводчиками, как и на других ресурсах (сервис онлайновый).

143523-A0ntxbsbxBQ.jpg

Мы в дискорде постоянно делимся корявым машинным переводом. Это тема для отдельной заметки.

Пользователям можно прописать различные уровни доступа и отдельно считаются проценты перевода текста, его редактуры и корректуры. У сервиса есть платная версия, но ограничения бесплатной версии пока никак нам не мешали жить, на этом сервисе мы уже почти год.

143525-ReCF-l-aWsE.jpg

Меню совпадений с памятью переводов и машинный перевод. Да совпадение на 102%, это не ошибка. Это значит, что совпадает не только сегмент, но и порядок сегментов. Значит тем более можно взять перевод из памяти переводов.

Немаловажным является и то, что все проекты находятся в одном месте. Их легко контролировать, понятно где сколько людей, где нужна небольшая помощь, все вопросы менеджмента переводов становятся не такими утомительными и возможно именно из-за этого нам получилось довести число активно идущих переводов до 16. Всё прозрачно и удобно.

143524-Oc8XFIAsTl4.jpg

В программе удобно искать как работу для фрилансеров, так и фрилансеров для работы. Стоп, у нас уже 29 человек в команде?


Этот текст получился уже значительно длиннее, чем я планировал. Я никак не упомянул специальные инструменты, которые существуют для отдельных игр или их серий. Кроме того, отдельно можно рассказать и о тех справочных ресурсах, которыми часто приходится пользоваться независимо от содержания игры. Об этом давайте как-нибудь в другой раз. Надеюсь, вам было интересно почитать о нашем переводческом опыте. До следующего четверга, и как всегда…

Stay Tuned!

Mormon в 14:46 11 мар 2021

Новости и статьи по тегам:

Комментарии:

  • Оставить комментарий
  • CyberBear 11 мар 2021 15:00:55
    Mormon в 14:46 11 мар 2021 сказал:

    для тех, кто не занимался непосредственно переводом, наверняка знакома программа Notepad++.

    Один из лучших текстовых редакторов и не только для переводов, много лет им уже пользуюсь :)

  • 0wn3df1x 11 мар 2021 15:27:54

    Нет ничего лучше облачных таблиц в плане организации коллективной работы. Бесконечное пространство для добавления столбцов и всяких вспомогательных модулей, бесконечное пространство для манипуляции оригиналом и переводом, пакетного перевода текста с использованием регулярных выражений. Т.е. в чистом виде усовершенствованный текстовый редактор для групповой работы. По сути своей текущий функционал тех же гуглотаблиц позволяет не просто перевести текст, но и затем экспортировать всё в уже нужном максимально готовом виде, а иногда и вовсе подгружать текст в игру в онлайн-режиме, как это делает ряд разработчиков игр на Unity.

    CAT-инструменты, которые предпочитают немало переводческих контор, на самом деле являются динозаврами из девяностых. Это тупо софт, созданный в начале 90-х, в котором меняется только интерфейс. Если вы посмотрите на то, с чего начинались эти инструменты и на то, что из себя представляют эти инструменты сейчас, вы увидите минимум развития за 20 лет. Кошмарное неудобство. Кроме памяти переводов никаких плюсов нет от слова совсем.

    Я лично, после 7 лет работы над переводами, вспоминаю все эти кат-инструменты и всё, что с ними связано, как страшный сон, и отдаю своё предпочтение исключительно облачным таблицам.

  • Evangelion_1 11 мар 2021 15:39:01

    шикарная прога для перевода модов для игр беседки ESP/ESM Translator 4, работать в ней одно удовольствие

  • Vano683 11 мар 2021 16:14:19

    26 Длина строки

    Вот еще полезный инструмент для перевода текста в некоторых exe — rova.exe

    Пост навеял воспоминания решил восстановить ссылку

  • Xelon 11 мар 2021 22:33:52
    0wn3df1x в 15:27 11 мар 2021 сказал:

    Нет ничего лучше облачных таблиц в плане организации коллективной работы. Бесконечное пространство для добавления столбцов и всяких вспомогательных модулей, бесконечное пространство для манипуляции оригиналом и переводом, пакетного перевода текста с использованием регулярных выражений. Т.е. в чистом виде усовершенствованный текстовый редактор для групповой работы. По сути своей текущий функционал тех же гуглотаблиц позволяет не просто перевести текст, но и затем экспортировать всё в уже нужном максимально готовом виде, а иногда и вовсе подгружать текст в игру в онлайн-режиме, как это делает ряд разработчиков игр на Unity.

    Не всегда. Довелось как-то участвовать в переводе одной ммо, там ячейки строк на миллионы шли. Куски были раскиданы в разные файлы. Локально еще более-менее можно было сводить в один файл. Но в облаке… Не представляю даже как бы это лагало в онлайне. И да, почему-то никто до сих пор не додумался что можно в качестве листов экселя использовать доковский документ. Нет, давайте лучше два разных приложения будет, каждое со своими файлами…

    Цитата


    CAT-инструменты, которые предпочитают немало переводческих контор, на самом деле являются динозаврами из девяностых. Это тупо софт, созданный в начале 90-х, в котором меняется только интерфейс. Если вы посмотрите на то, с чего начинались эти инструменты и на то, что из себя представляют эти инструменты сейчас, вы увидите минимум развития за 20 лет. Кошмарное неудобство. Кроме памяти переводов никаких плюсов нет от слова совсем.

    Я лично, после 7 лет работы над переводами, вспоминаю все эти кат-инструменты и всё, что с ними связано, как страшный сон, и отдаю своё предпочтение исключительно облачным таблицам.

    тут да, согласен, те CAT которые видел это древние поделки которые пилены-перепилены до состояния когда уже в них могут разбираться только те кто с самого начала в них работал )) Ни одной удобной не нашел когда была такая нужда.

  • Оставить комментарий