Тетради переводчика. Максим Манжосин

Ленты новостей
Технический перевод и локализация. IT Translation
Адрес: http://slovotolk.com
Обновлено: 32 недели 2 дня назад

Sorry в технических текстах

чт, 20/04/2017 - 11:22

Хорошо известно, что далеко не всегда в переводе нужно писать «пожалуйста», если в оригинале стоит please. Об этом рассказано чуть ли не в каждом руководстве по стилю. А вот рекомендацию по переводу слова sorry в пользовательском интерфейсе я впервые увидел на днях. Восполняем пробелы:

Если ошибка или какая-то неудобная ситуация произошла на стороне сайта или приложения, интерфейс которого мы переводим, sorry следует передавать как «извините». Примеры:

Sorry, we are currently offline for server maintenance.
Извините, на сервере ведутся технические работы.

Sorry, the selected contact cannot be reached. Please try again later.
Извините, не удалось установить связь с выбранным контактом. Повторите попытку позже.

Вариант «приносим свои извинения» чересчур формальный, его можно использовать только в очень официальных контекстах.

Если же ошибка произошла в результате действий пользователя, извиняться не за что, и sorry переводить не нужно:

Sorry, the DOB field is required.
Необходимо заполнить поле «Дата рождения».

Sorry, you need admin privileges to remove accounts.
Для удаления учетных записей требуются права администратора.

Поиск в Интернете для переводчиков — часть 2

ср, 01/03/2017 - 09:03

Первая часть здесь.

Стратегия поиска

Движение к заранее намеченной цели, очевидно, эффективнее бесцельного блуждания. Это же применимо к интернет-поиску. Перед тем как нажать Enter в поисковой строке, хорошо бы представить себе, что в итоге вы хотите найти:

  • определение термина?
  • узус — выяснить, где используется термин А, а где — термин Б?
  • общее описание незнакомой технологии или процесса?
  • просто ответ на конкретный вопрос?

Подумайте, на сайте какого типа может найтись нужная вам информация: то ли в словаре, то ли на форуме, то ли на официальном сайте. Это ускоряет фильтрацию ненужных результатов и помогает выстроить стратегию поиска.

  • Народный метод «русское ищем в “Яндексе”, английское — в “Гугле”» может сработать для простых поисковых запросов, а вот для поиска чего-то более сложного (иначе зачем вы всё это читаете?) потребуется более сложный подход. Например, майкрософтовскую терминологию очень качественно ищет Bing.
  • Поиск по конкретному сайту (отраслевому, корпоративному, по словарю и т. п.) намного эффективнее поиска по всему Интернету. Скажем, термины в области телекоммуникационного оборудования можно искать на сайте Nag.ru, а страховую лексику — на insur-info.ru.
  • На сайте Onelook.com есть великолепный обратный словарь, помогающий составить список терминов по нечетким критериям. Как вы будете искать певчих птиц с синим оперением? Сравните запрос songbird blue plumage в Onelook и в Google: «Уанлук» нашел несколько десятков птиц, а «Гугл» на первой странице показал только bluebird и blue jay. 
  • Кстати, о птичках. Названия животных, растений и вообще любых биологических видов традиционно переводились через латынь: нужно было выяснить научное биномиальное название искомого вида, а потом найти русское общеупотребительное соответствие этому латинскому названию. Сейчас этот метод вытеснен «Википедией»: вы просто открываете иноязычную статью о животном и через блок ссылок «На других языках» переходите к русскоязычной версии этой статьи. Это не исключает проверки через латинское название — оно присутствует во всех энциклопедических статьях об организмах.
  • Когда в переводимом документе встречается незнакомый механизм (вообще, любая материальная вещь), поиск по картинкам помогает быстро в нем разобраться. Как там говорится в пословице: лучше один раз увидеть, чем сто раз прочитать непонятное описание. Если вы хорошо знаете русскоязычную терминологию в какой-то области, но «плаваете» в иноязычной, поиск незнакомого термина по картинкам сразу позволит понять, что за штуку имеет в виду автор текста. Нечасто, но встречается и обратная задача: по картинке понять, что же на ней изображено и как это называется. В этом случае поможет обратный поиск по картинкам: в «Яндексе», «Гугле» или TinEye.
  • Чтобы найти сайты, аналогичные уже известному, воспользуйтесь SimilarSiteSearch или поисковым оператором related.
  • Языковые корпусы — как конкорданс в ТМ — позволяют искать по базе параллельных двуязычных текстов. Если вам нужно узнать узус или выяснить различия между контекстами, начните с поиска не по всему Интернету, а по корпусам:
    • TAUS — ветеран интернет-корпусов. В последнее время его вытесняют более удобные системы, но для некоторых технических отраслей база TAUS не имеет аналогов.
    • Linguee — мой любимый корпус, быстро растущий в объеме. По общественно-политическим темам текстов больше, по техническим — меньше, но есть, например, коллекция инструкций по эксплуатации.
    • НКРЯ — это гигантский объем художественных и публицистических текстов и очень мало всего остального. Есть параллельные тексты современных англоязычных писателей.
    • Reverso — сравнительно новый сайт, объединяющий корпус, материалы по изучению языков и что-то еще. Объем технических текстов приближается к Linguee.

Если в результате запроса найдено слишком мало страниц:

  • В первую очередь, проверьте правописание и синтаксис запроса.
  • Возможно, в запросе слишком много терминов. Удалите несколько слов из поискового запроса.
  • Возможно ваш поисковый запрос — окказионализм. Уберите кавычки или переформулируйте запрос с использованием синонима.

Пример: в тексте встретилось выражение advanced tenacious threat. Запрос в кавычках дает три ссылки на один сайт — что-то здесь не так. А запрос без кавычек на пятом месте выдает статью «Википедии» Advanced persistent threat, что и является правильным написанием термина.

Если в результате запроса найдено слишком много нерелевантных страниц:

  • Ограничьте область поиска, добавив уточнение. Например, по запросу semaphore будут, в первую очередь, найдены сайты по флажковой (семафорной) сигнализации, а запрос semaphore computing или semaphore programming сразу выводит на понятие семафора в программировании.
  • Ограничьте область поиска, исключив определенные области. Хороший пример — приведенный выше запрос сальса -музыка -танец.
  • Поставьте искомые слова в кавычки. Запрос quality criteria” более узок, чем quality criteria, так как во втором случае слова могут располагаться в разных частях страницы.
  • Просмотрите вторую, третью, четвертую страницу результатов, особенно если поиск был в пределах информационного пузыря.
Переведи то, не знаю что

Самый сложный случай — это когда в документе без контекста встречается какая-то неведомая ерунда. В этом случае вначале полезно оценить, чем она может быть: устойчивым словосочетанием, свободным словосочетанием, опечаткой или именем собственным. Погуглите целиком непонятное выражение в кавычках:  если точное совпадение не встречается совсем или дает очень мало результатов — значит, это окказионализм, свободное словосочетание; если нашлось много релевантных результатов — значит, это устойчивое терминологическое выражение; если «Гугл» предлагает исправить ошибку — оцените это предложение (часто предлагается исправить правильное на неправильное). Наконец, названия компаний и прочие имена собственные можно выявить по контексту страниц, на которых эти слова находятся поиском.

Для поиска перевода терминологических словосочетаний очень эффективен метод «плюс и»: иноязычное словосочетание заключается в кавычки, после чего в запрос добавляется . Таким образом, выполняется поиск страниц, на которых встречается искомый термин в русском контексте, — с большой вероятностью там найдется перевод этого термина. Можно также искать иноязычные слова в зоне ru (site:.ru) или на русских страницах с суффиксом &lr=lang_ru. Мне «плюс и» нравится больше.

Если вы знаете, как перевести одно из слов в терминологическом словосочетании, вставьте этот перевод вместо «и». Например, в выражении key agreement первое слово — точно «ключ». Попробуйте выполнить запрос “key agreement” +ключ. На первой же странице вы увидите несколько вариантов перевода: «соглашение о ключах», «согласование ключей», «выработка общего ключа» и даже просто «обмен ключами».

Для выбора из ряда правдоподобных вариантов каждый из них нужно отдельно поискать (уже без оригинального выражения) и оценить контексты, достоверность и надежность сайтов, использующих русский термин. Допустим, вы хотите выбрать один из вариантов перевода key agreement из предыдущего примера. Для этого воспользуемся поиском по сайту одного из крупнейших российских криптопровайдеров cryptopro.ru. Видно, что запрос соглашение о ключах site:cryptopro.ru выдает лицензионные соглашения и прочие нерелевантные страницы, а запрос согласование ключей site:cryptopro.ru возвращает именно то, что нужно. Это хороший аргумент за использование этого термина.

Достоверность
  • Не забывайте, что ранжирование сайтов на странице результатов не отражает уровень их надежности или достоверности. Первым результатом поиска, полностью соответствующим поисковому запросу, может оказаться полная чушь.
  • Количество результатов совершенно не гарантирует правильности словоупотребления или написания. Сколько найдется результатов по запросу исчо?
  • Оцените надежность источника, хотя бы бегло. Если вы ищете узус по теме потребительского кредитования, сайт «Сбербанка» — более достоверный источник, чем «Ответы Mail.ru».
  • Оцените качество сайта, особенно если это узкоспециализированный ресурс. Кривая верстка и орфографические ошибки на главной странице чаще всего означают, что и содержимое здесь соответствующего качества.
  • Старайтесь формулировать запросы так, чтобы в них не содержался ответ. Например, запрос height of tallest man was 7.5 feet плох тем, что поисковик легко найдет вам подтверждение самых невероятных фактов. Намного лучше искать просто height of tallest man или хотя бы height of tallest man was *  feet.
  • Если при поиске английского узуса на первых позициях появляются англоязычные тексты на русских сайтах — значит, вы ищете русизм.

Наконец, термин, найденный в Интернете, не стоит сразу вставлять в перевод. Проверьте его корректность другими запросами: убедитесь, что он используется в контекстах, аналогичных переводимому документу, и что вы выбрали лучший из найденных кандидатов.

Пара слов о безопасности
  • Не переходите бездумно подряд по всем сайтам в выдаче. Если аннотация (blurb) на странице результатов выглядит подозрительно, эту ссылку лучше пропустить.
  • Рекламные сети сравнительно слабо защищены: были случаи, когда вредоносный код вставлялся прямо в объявление, которое показывали сотни и тысячи партнерских сайтов. Отключение рекламы и скриптов повышает и скорость, и защищенность браузера. Хорошей практикой будет использование отдельного браузера для регулярного поиска, и отдельного — для банков, почты и подобных доверенных сайтов. В этом случае в браузер для поиска стоит установить расширение-блокировщик: NoScript, uBlock Origin или их аналог.
Рекомендуемые ссылки

Ищите и найдете!

Поиск в Интернете для переводчиков

вт, 28/02/2017 - 19:43

Это не первое руководство по интернет-поиску и не первое для переводчиков. Однако, посмотрев разные материалы по этой теме, я обнаружил, что где-то рассказывается про тактику поиска, где-то про стратегию, и нигде обо всем вместе. Попробую свести в единый материал все рекомендации по использованию интернет-поиска в работе переводчика.

Опытным интернетчикам многое здесь покажется разжевыванием прописных истин. Не забывайте: нет старых анекдотов, а есть старые люди: для новорожденного каждый анекдот новый.

Как это все работает

Интернет — мощнейший инструмент переводчика. Никакая коллекция офлайновых словарей, не говоря уже о бумажных, не заменит грамотный поиск по Сети. При этом не забывайте, что:

  • не все сайты в Интернете индексируются поисковиками. Некоторые сайты запрещают индексацию, некоторые защищены паролем на вход;
  • не все страницы на сайте индексируются: например, содержимое, встраиваемое с других сайтов, в индекс не попадет;
  • не все слова на странице индексируются: у каждого поисковика есть список стоп-слов, которые не включаются в индекс. О британской группе The the ничего было нельзя найти в Интернете, пока «Гугл» не добавил для нее отдельное исключение в алгоритм индексации.
Поиск внутри и снаружи пузыря

Все крупные поисковики выдают разным пользователям разные результаты поиска. Страница результатов формируется на основе того, что поисковик знает о вас, вашем расположении, истории поиска и истории переходов по страницам. Таким образом, вам показывают не объективную картину мира, а то, что, по мнению системы, вам будет интересно увидеть. Поскольку людям свойственно чаще переходить не по случайным ссылкам, а по тем, что их заинтересовали, это формирует замкнутый круг: на странице результатов все чаще появляется то, что вам и так уже интересно, а все остальное уходит в гетто невидимости. Такая практика адаптивных результатов получила название «информационный пузырь» (filter bubble). Деление информации на «свою» и «чужую» применяется при поисковых запросах на любую тему, но особенно хорошо заметно на общественно-политических материалах.
Как же выполнить поиск за пределами своего пузыря? Для «Гугла» можно добавить в конец поисковой строки суффикс &pws=0, например так (да, pws означает personalized web search). Для «Яндекса» такой параметр мне неизвестен, но, если открыть браузер в режиме инкогнито, любая персонализация сбрасывается — как будто вы впервые зашли на поисковик.

Локализация, то есть учет языка браузера и IP-адреса, оказывает на гугловские результаты не меньшее, а то и большее влияние, чем персонализация. Поиски на google.ru  и google.com существенно разнятся. Поиск английских терминов и контекстов в «русском» Гугле малоэффективен — чтобы перейти на международную версию поисковика, наберите google.com/ncr (no country redirect). В то же время Bing почти не подмешивает русские сайты в общую выдачу, может быть, просто из-за того, что их очень немного в индексе «Бинга».

Оперируем операторами

По умолчанию поисковые системы просто выводят список страниц, содержащих искомые слова. Для управления выдачей у каждой системы есть свой набор команд, или поисковых операторов, которые можно добавить к запросу. Подробное руководство по синтаксису поиска ищите на сайте самих поисковых систем, а я перечислю те операторы, которые могут быть полезны в переводческом поиске.

  • “Текст в кавычках” — наверно, самый известный оператор, выполняющий дословный поиск фразы: слова в найденных страницах будут располагаться в том же порядке и той же форме, что и в запросе. Изначально кавычки были предназначены для поиска цитат, но со временем им нашлось множество применений.
  • Минус (-) удаляет результаты, содержащие указанное слово. Обратите внимание, что перед минусом должен стоять пробел, а между минусом и исключаемым словом пробела быть не должно. Этот оператор удобен для отфильтровывания омонимов: сальса рецепт -музыка -танец. Таким же образом можно исключать из результатов поиска определенные сайты. Например, на сайте Aliexpress/Alibaba.com широко используется машинный перевод — добавьте в запрос -alibaba.com, чтобы убрать его из поисковой выдачи.
  • Звездочка (*) заменяет одно или несколько пропущенных слов во фразе. Этот оператор незаменим в проверке фразовых глаголов при переводе на английский: A quick brown fox jumps * the lazy dog.
  • Оператор site: выполняет поиск по определенному сайту или на сайтах определенной зоны (между site: и адресом сайта не должно быть пробела). Пример: Trados Studio site:slovotolk.com. Это один из самых полезных операторов, способный сократить временные затраты на поиск в разы. Вы переводите на английский и нужно проверить разницу между британским и американским словоупотреблением? Выполните поиск сомнительного слова с фильтром site:.uk. Ищете иноязычные термины на русских сайтах? Site:.ru вам в помощь.
  • Оператор related: перед URL-адресом найдет сайты с похожим содержимым. Скажем, вам нужны сайты на тему защиты информации, а вы знаете только «Касперского»? Попробуйте запрос related:kaspersky.ru.
  • Тильда (~) означает поиск не только по заданному термину, но и по всем его синонимам. Это может быть полезно в сочетании с поиском по сайту (site:). Скажем, вы переводите текст по консалтингу и хотите найти разные рекламные материалы на клиентском портале — попробуйте запрос site:example.com ~consulting.
  • Оператор define: возвращает или, по крайней мере, пытается вернуть словарное определение слова или выражения в запросе: define:horse.
  • Восклицательный знак (!) работает только в «Яндексе» и позволяет искать только точную словоформу, указанную в запросе. Например, по запросу
    !лукоморья найдется только родительный падеж.

Продолжение следует.

Маленькие хитрости

пн, 30/01/2017 - 17:30

Ваше любимое бюро выиграло очередной тендер, и вы получили первый заказ для нового конечного клиента — например, руководство пользователя, страниц так на сто. Ни ТМ, ни термбазы нет (это же новый клиент). Вы принимаетесь за работу и на первой странице читаете примерно следующее: The new model incorporates numerous technical improvements that enhance quality and reliability. It replaces Professional 1234 in the Company’s model range.

Вот здесь нужно остановиться и задуматься: если новая модель приходит на замену старой, значит, старая уже давно продается и, возможно, руководство к ней кто-то уже переводил. А документация к похожим моделям различается несильно. Просто введите в поисковик что-то вроде «Company Professional 1234 руководство пользователя» — и, если вам повезет так, как в этой ситуации повезло мне, вы найдете и оригинал, и готовый перевод руководства для прежней модели. Останется только загрузить их в WinAlign или в любое другое средство «выравнивания» параллельных текстов — и ТМ готова. Потратив пару часов на «выравнивание», вы не только сократите общий объем работы в несколько раз за счет подстановки сегментов из ТМ, но и продемонстрируете великолепное владение терминологией нового клиента :-)