Интервью с Дональдом ДеПальма (CSA Research) – часть 2
Сергей: Давайте теперь поговорим о переводах – точнее, о «последней миле» переводческого процесса. Я читал ваши доклады – там замечательный, живой язык. Ясно, что вам не чуждо лингвистическое искусство. Но когда-то давно вы сказали мне: «Не волнуйся – что бы ты ни предпринимал, из перевода сделают типовой товар». Существует мнение, что в нюансах тщательного ручного перевода нет ценности –
переводчики всегда воспринимали такое мнение в штыки, хотя сегодня мы слышим все меньше несогласных голосов. Но недавно я наткнулся на статью Антонио Тораля (Antonio Toral) «Язык постредактирования как ломаный переводческий» (Post-editese is an exacerbated translationese (https://arxiv.org/pdf/1907.00900.pdf)) и был приятно удивлен. Это именно то, о чем переводчики говорили все это время! Статья разделяет «язык постредактирования» и «язык перевода», заявляя, что материал, подвергнутый постредактированию после машинного перевода, всегда уступает по качеству ручному переводу (который, в свою очередь, всегда хуже оригинала). Тораль использует в своем исследовании набор комплексных показателей – например, лексическое богатство и лексическое разнообразие. Насколько я знаю, это первый случай, когда кто-то из «структуральнейших лингвистов» представил отрасли такую точку зрения и обосновал ее результатами вычислительного эксперимента на реальных данных. Для меня и моих коллег это отличная новость – мы ведем работу с аналитическими и комплексными стандартами. Тораль объясняет, почему комплексный подход в лингвистике не только обоснован, но и необходим, а также – почему он необходим в оценке качества.
Может ли подход Тораля закрепиться в отрасли? От чрезмерного использования МП снижается эффект, производимый на конечного потребителя, сам язык постепенно упрощается, становится сухим, унифицируется – и я бы хотел, чтобы люди это понимали. Специалист-переводчик выдает качественный материал, с которым не сравнится постредактируемый текст: можно сказать, что комплексный подход выделяет и подчеркивает ценность талантливых кадров. Как вы думаете – обречены ли мы на постредакторское будущее, или подход Тораля еще проявит себя в нашей сфере?
Как ваша компания популяризует принцип ценности талантливых кадров в переводческой отрасли? Как вы отвечаете на заявления о всемогуществе и экономности МП? Разработки нейросетевых решений для МП сильно повлияли на сферу перевода – они обычно превосходят необученных, неопытных переводчиков и коллективный перевод. При этом хорошие переводчики тоже остаются без заказов, потому что клиенты часто не замечают разницу между плохим и хорошим переводом. МП все еще не способен честно соревноваться с ними в качестве – несмотря на то, что эта технология будоражила умы с 50-х годов. Как вы думаете, произойдет ли это когда-нибудь в будущем? И как нам бороться с угрозой профессиональному переводу в настоящем?
Дон: Расскажу о случае, о котором мне напомнил ваш вопрос о МП. Лет двенадцать назад я проводил презентацию на конференции Общества технической коммуникации в Тель-Авиве. Речь шла о коллективном переводе (краудсорсинге) – тогда он широко обсуждался. Кто-то из аудитории задал вопрос: придется ли нам в будущем «усреднить» перевод и неукоснительно следовать общепринятым единственно верным вариантам? Я думаю, похожие вопросы поднимаются в отношении любой новой технологии или измененного процесса.
Упомяну для контекста, что в университете я изучал лингвистику, американскую и русскую литературу, а потом стал учить чешский и другие славянские языки. Можно сказать, что лингвистика – это мое призвание.
Статья Тораля описывает самую главную задачу перевода. Хороший перевод должен передавать смысл оригинала, его дух и ощущения, которые он вызывает, в полной мере, не добавляя лишнего и не теряя ничего. Тораль поднимает различные темы – об универсалиях перевода, об упрощении, нормализации, рационализации – которые нельзя не упоминать, говоря о проблемах, с которыми сталкиваются переводчики. Конечно, эти проблемы усугубляются тем, что для перевода часто выделяют недостаточные сроки.
Переводчики, которые работают с художественной литературой, привыкают к этой сложности – она является неотъемлемой частью их искусства. Тем же, кто работает с технической и маркетинговой литературой, приходится обходить или удалять конструкции, которые мешают передавать смысл написанного. Все, что может оказаться непонятно читателю из-за культурных различий, приходится удалять, либо добавлять в текст развернутые объяснения. Кроме того, встречаются лингвистические структуры, которые неизбежно теряют смысл при переводе – происходит та самая потеря лексического богатства, о которой вы говорили. Может показаться, что в переводе текста, объясняющего, как пользоваться тем или иным продуктом или почему этот продукт лучше других, не может быть сложностей, но это не так.
Переводчики нехудожественных текстов стремятся подавать материал в прямой и целенаправленной форме, передавать суть, не обращая внимания на культурные, лингвистические и личные нюансы. При этом чрезмерное применение МП усугубляет упрощение, снижает ценность и богатство языка. Конечно, всесторонне передать оригинал – как это делается в хорошем литературном переводе – сложно. Эта сложность неотделима от переводческой деятельности, она возникает всегда, когда переводчик работает с текстом, призванным побуждать в читателе определенный отклик.
Я думаю, современные системы МП сильно проигрывают квалифицированным переводчикам в передаче нюансов.
Сергей: Я считаю, что серьезность проблемы злоупотребления МП нельзя преуменьшать – она такова, что стоит вопрос о выживании всей отрасли. Рад, что вы со мной согласны. У меня была переписка с Антонио Торалем и мы обсудили его работу. Оказалось, что он не распространяет проблему обеднения языка на технический перевод – но с этим я не согласился. Я объяснил, что, по моему мнению, существует несколько факторов, которые усугубляют эту проблему применительно к техническим переводам. Часто в технических текстах используется терминология, которой не существует в нашем языке, и во время перевода приходится изобретать её самому. Для многих определений и технических концепций приходится составлять объяснения. Некоторые свойства текста недоступны для процесса глубокого обучения. При этом определить, правильно ли в переводе передается смысл, способен только человек. Системы глубокого обучения тут не помощники – они могут дать на выходе текст, построенный грамматически правильно, но только и всего. Это даже мешает: читая качественно написанный текст, сложно заметить смысловые ошибки в переводе. Предыдущее поколение МП-систем считалось «ложным другом переводчика», но к нейросетевым системам это относится в еще большей степени. Вы обращаете внимание своих слушателей на эту проблему?
Дон: Я думаю, на эту тему стоило бы провести круглый стол. Качественный ручной перевод – сложная, штучная работа, вне зависимости от вида материала. Причины вы перечислили. Даже технический текст редко бывает однозначным по смыслу, как задача по физике – «заряд есть, заряда нет». Чтобы получить точный перевод, пригодный к применению, нужно учесть множество элементов.
Если переводится маркетинговый материал, то переводчик должен сохранить воздействие, которое он оказывает на потребителя. Если текст литературный, нужно передавать эмоциональную нагрузку произведения. Хороший перевод всегда «цепляет» заинтересованного и внимательного читателя – такого эффекта сложно добиться, но именно в нем заключена выгода для заказчиков. Нужно постоянно убеждать их в том, что преимущества качественного перевода перекрывают экономию средств при использовании МП и других дешевых вариантов.
Из-за того, что сегодня доступен широкий выбор лингвистических услуг, кажется, что получить качественный перевод очень просто – можно связаться с любым бюро, выполняющим переводы за час, и сразу получить готовый тест. Неопытный заказчик не способен оценить качество работы, но считает, что такой перевод «сойдет».
Есть и другие факторы: например, цена и объем материала. Пропускная способность отрасли не позволяет переводить всё, что хотелось бы перевести. Компаниям приходится анализировать их целевые рынки, анализировать контент, который они производят, и определять нужный уровень перевода для каждого вида контента.
Повторюсь: контента, который мог бы переводиться, но не переводится, действительно огромное количество. Я уже упоминал наше исследование трех тысяч сайтов с высоким трафиком. Они предназначены для международной аудитории, но при этом переводятся – самое большее – на пять-шесть языков. Этого явно недостаточно.
Сегодня большая часть существующей информации не переводится, что повышает привлекательность технологий МП. Мы уже говорили об их слабых и сильных сторонах, но следует понимать: качество перевода не так важно, если единственная альтернатива – его отсутствие. Без перевода пользователь не купит продукт – такова экономика ситуации. Но в ситуациях, когда нужно создать лучшее ценностное предложение, когда нужно обойти конкурентов в техническом плане, когда нужно уговорить потребителей обратить внимание на предлагаемые технологии, необходим качественный перевод. Дешевый МП-перевод может сэкономить средства в краткосрочной перспективе, но в долгосрочной – повредить всему бренду. Руководители компаний обязаны иметь это в виду.
Сергей: Согласен. Нельзя недооценивать сложность проблематики современного перевода. Сейчас НМП все шире распространяется по отрасли, и даже за ее пределами: люди, никак не связанные с переводческой деятельностью, постоянно применяют НМП. И, несмотря на это, рост отрасли продолжается уже много лет. Краудсорсинговый перевод уже потерял смысл: качество текста на выходе НМП-алгоритмов выше.
С одной стороны, интересно наблюдать за тем, какие у людей бывают опасения и страхи, связанные с НМП. С другой – люди часто восхищаются этой технологией, не разбираясь в том, что она выдает. В тексте, переведенном НМП, труднее искать смысловые ошибки, чем в выходе предыдущих поколений МП. Широкое распространение НМП идет уже около двух лет, и это – следующая проблема, которую я бы хотел обсудить. Статистические и основанные на правилах системы МП были доступны и раньше, но это не мешало отрасли расти на 5-7% каждый год – быстрее, чем экономический рост государств. Сейчас вся отрасль находится под давлением из-за сочетания факторов, которые склоняют нас к превращению услуги перевода в обезличенный товар – и НМП входит в их число. Как вы думаете, продолжится ли наш рост, или распространение НМП понизит спрос на платный перевод? Какие еще ключевые отраслевые факторы, по вашему мнению, влияют сейчас на рост?
Дон: Да, НМП очень хорошо привлекает к себе внимание. Перевод с использованием НМП – это товар с фиксированной стоимостью, который может использоваться вместо человеческого перевода. Но во многих случаях с помощью НМП переводятся те материалы, которые в ином случае остались бы без перевода. Это очень важно. Поэтому следует разделить перевод в целом на два направления.
Первое – это важные материалы, качество которых отражается на бренде заказчика. Их перевод не должен содержать ошибок и неточностей, поэтому в интересах заказчика – не жалеть времени и средств на человеческий перевод.
Второе – это материалы, которые не так важны, и поэтому обычно остаются без перевода. Для них не критична точность: мы просто хотим, чтобы они были доступны на различных языках. Такой перевод может звучать, например, как «нажмите кнопку» вместо «далее нажмите кнопку, пожалуйста»: можно передавать минимально достаточную информацию максимально прямым способом. Для рынка, на котором недоступны качественные переводы, этого достаточно. Но руководители компаний осознают, что для важных материалов нужен именно качественный перевод – это одна из причин того, что НМП не захватил всю отрасль.
Другая причина заключается в том, что эта технология еще не вполне готова. Вы спрашивали, когда это произойдет – точного ответа я дать не могу, хотя срок ближе скорее к пяти, чем к пятистам годам. Развитие НМП – и сектора лингвистических технологий в целом – ускоряется за счет вложений в машинное обучение, нейронные сети, семантические сети и другие новые технологии. Похожий процесс происходил и с предыдущим поколением МП, работавшим на статистических методах. Можно вспомнить, что серьезные исследования технологий ИИ начались именно с обработки естественного языка.
Сейчас промышленные компании – такие, как GE или Snecma – извлекают выгоду из ИИ-технологий, используя системы машинного обучения. Они собирают данные по своим изделиями – например, авиационным двигателям – и определяют всевозможные важные показатели, к примеру, среднее время между поломками, и прогнозируют с их помощью вероятные события. Примерно 10-15 лет назад кто-то решил применить статистические методы и методы обработки больших массивов данных к МП. И это сработало – ценность МП подскочила вверх. Это совпало с падением ожидаемого качества языка в общении (это тогда все стали использовать смайлики ).
Язык постоянно развивается, и одни атрибуты всегда важнее других. Переводчики должны понимать, в чем состоит цель их работы: они обеспечивают представление ценностного предложения заказчика на международных рынках. НМП – это относительно новый инструмент. Он позволит им увеличить масштаб обработки материала, переводить больше текстов на большее количество языков. Кроме того, он продолжит развиваться за счет вложений в машинное обучение. Технологии и инструменты, используемые в НМП, будут постепенно совершенствоваться. Но для обучения алгоритмов всегда будут нужны люди.
Роль профессиональных переводчиков должна измениться и стать в большей степени стратегической для компаний. Это – одна из задач, которые нам предстоит решить. Я считаю, что структура и рабочий процесс лингвистической отрасли должны развиваться. Не стоит пытаться заморозить её в том состоянии, в котором она находится сейчас – это игра с нулевой суммой. Нужно признать, что НМП – это полезный инструмент, который позволит частным и государственным компаниям и отдельным переводчикам обрабатывать больше текстового материала и переводить на множество языков. Люди-переводчики никуда не исчезнут: всегда нужно будет проверять результаты, наблюдать за работой систем и обучать их.
Таково современно направление развития. Компании в лингвистической отрасли – например, австралийская Appen или Lionbridge – организуют у себя группы по исследованию машинного обучения. Недавно Apple обвиняли в том, что для обучения Siri используются разговоры людей, не уведомленных об этом. Теперь Apple обучает Siri с участием лингвистических компаний, потому что для интерпретации данных требуются специалисты. Я думаю, интерфейсы, подобные Siri, которые позволят человеку взаимодействовать с компьютером с помощью естественного языка – устного или письменного – обеспечат отрасли огромный потенциал для роста. Для таких систем будут нужны лингвисты. Так отрасль сможет сохранить темп роста, о котором вы говорили. Нужно только понять, какие шаги делать дальше.
Сергей: Конечно. Я бы хотел добавить еще несколько важных факторов. Во-первых, надо отметить очевидный рост значимости терминологии. Во-вторых, нужно иметь в виду, что НМП часто играет роль «ложного друга» владельца контента – чаще, чем предыдущее поколение МП. Это усложняет отношения между клиентом и переводчиком, и об этом нужно постоянно напоминать: многие не понимают, что то, что мы сейчас называем ИИ – это не искусственный разум. Система НМП не может гарантировать правильную передачу смысла, она не способна проверять сама себя. Это одна из ключевых проблем, и ее недооценка ведет к падению качества переводов.
НМП привлекателен для переводческих компаний, которым требуется снизить расходы и ускорить процесс. Это ведет к падению качества перевода. Некоторые известные аналитики заявляют, что сегодня качество воспринимается как должное, но мы знаем, что это не так. Можно установить какое-нибудь мобильное приложение, издатель которого обещает 20 языков, и наткнуться на плохую локализацию – и об этом пишут в докладах те же самые аналитики. Очевидно, что разделение на хороший и плохой перевод никуда не исчезло – и плохого перевода сейчас очень много. Можете ли вы дать совет клиентам: как определять качество выполненной работы? Наша отрасль сейчас находится в состоянии парадокса. Из-за рыночного давления стало бесполезно заявлять о том, что вы предлагаете качественные переводы. При этом – из-за того же давления – многие переводчики, включая наших партнеров, иногда поставляют халтуру. Все ожидают хороших переводов, но немногие согласны надлежащим образом платить за них. Как бы вы разрешили этот парадокс?
Дон: Я думаю, в этом утверждении есть истина, хотя и не совсем по тем причинам, о которых заявляют аналитики. Независимо от того, кто, где и что покупает, покупатель ожидает, что продукт будет качественным. Конечно, если вы покупаете дешевый зонтик в ларьке за минуту до ливня, то вас интересует только его краткосрочная полезность – но за продукты, которые будет использоваться в долгосрочной перспективе, вы будете готовы заплатить больше. Всегда существует баланс между краткосрочными потребностями, которые мы стараемся удовлетворить как можно быстрее и с наименьшими затратами, и постоянными долгосрочными потребностями. Сегодня многие компании обращают внимание на ту область потребительского опыта, в которой лежат долгосрочные потребности, качество и полезность продуктов, и создают контент на языке клиента, способствующий его продвижению по «пути потребителя».
Когда клиент начинает использовать любой технологический продукт – программу, автомобиль, электронное устройство, стриминговый сервис – его путь не завершается. Это только середина: он прошел стадию, на которой ему известно о продукте, стадию, на которой он желает купить продукт, и стадию, на которой он покупает продукт. Далее следуют стадии получения поддержки в использовании продукта и становления клиента в качестве повторного покупателя, и любой компании необходимо привести как можно больше людей к завершению этого пути. Качественное обслуживание клиентов на их родном языке служит здесь отличным подспорьем. Международный потребитель должен получать информацию в форме, доступной для него.
Компании, которые предлагают справочную информацию на родном языке клиентов, привлекают больше повторных покупателей – наши исследования это подтверждают. Фирмы и правительственные учреждения заказывают переводы различного уровня для разных видов контента – например, за перевод маркетинговых текстов они часто готовы платить больше, чем за перевод FAQ. Заказчикам не обязательно, чтобы каждый переведенный текст был высшего качества – он должен лишь соответствовать своему назначению, что позволяет сократить расходы. Именно поэтому некоторые компании предлагают услуги неквалифицированных переводчиков задешево. При этом профессиональные переводчики рискуют остаться без заказов, потому что они не умеют делать низкокачественные переводы – в этом и состоит парадокс.
Мы наблюдали за тем, как это обычно происходит. Руководство компании решает использовать только один уровень редактуры-корректуры и требует, чтобы переводчики выдавали материал качеством ниже, чем их обычная работа. Такое требование в принципе противоречит рабочей этике профессиональных переводчиков – они всегда стараются выдавать материал лучшего качества, на которое способны. Я думаю, эта проблема возникает из-за того, что многие компании не привыкли работать в глобальном масштабе. Они не понимают, что качественный перевод – это необходимое условие для прохождения через все этапы пути клиента (или воронки продаж).
Конечно, эти же компании – независимо от того, работают ли они только в Интернете, или у них есть физические филиалы – понимают, что им нужно мотивировать клиентов. Каждый клиент имеет свой набор требований и ожиданий, включая лингвистические и культурные. Если не принимать их во внимание, он уйдет к другой компании. Нам нужно донести до переводческих компаний тот факт, что их продукция – это не просто текст, а жизненно важная часть процесса взаимодействия с клиентом. Она определяет, станет ли он покупателем, а затем – повторным покупателем.
Продолжение следует.
Сергей Гладков, компания Амберит