Интервью с Доном ДеПальма (Don DePalma) (CSA Research) для Московского переводческого клуба.

Сергей Гладков, компания Logrus Global (logrusglobal.ru)

Часть I.

Сергей: Добрый день, Дон. Спасибо вам за замечательную презентацию на прошлогодней конференции Московского переводческого клуба 7 декабря. В этом году конференция пройдет 6 декабря, и мы посвятим её обсуждению стратегий будущего и перспектив в нашей отрасли.

Наше интервью войдет в подготовительную программу этой конференции. Спасибо, что согласились участвовать.

Давайте начнем с компании, которую вы создали, и рассмотрим её исследовательские методики. Итак, CSA Research – эта компания раньше называлась Common Sense Advisory. Она завоевала солидную репутацию за годы занятия отраслевой аналитикой и опубликовала множество докладов и отчетов об исследованиях. Как за это время изменились методы аналитической работы? Какие методы вы применяете, чтобы обеспечить надежность собираемой информации? Продолжаете ли вы опираться на опросы?

Дон: Конечно, опросы – это не единственный наш инструмент. Мы уже давно сочетаем их с брифингами и интервью. Наш метод можно назвать количественным анализом: мы собираем данные с людей, имеющих отношение к исследуемому рынку, чтобы определить баланс мнений. С помощью масштабных опросов мы определяем методы, модели поведения и предпочтения большой группы людей – штатных и внештатных специалистов, руководителей. Прямо сейчас мы проводим международное исследование переводческой отрасли, которое охватывает сегмент из 14 языков. В нем участвует несколько тысяч человек, и с их помощью мы получаем данные о передовых методах и предпочтениях в этом сообществе.

Когда мы хотим перейти к новой теме исследования или получить представление о развивающемся рынке, мы берем интервью у специалистов и директоров – то есть, людей с реальным опытом работы в отрасли.

Они рассказывают нам о том, какие задачи решали, о правильных и неправильных решениях, о сложностях, которые им приходилось преодолевать. Мы обрабатываем собранную информацию и составляем доклад. Мы описываем работу специалистов этой отрасли и их впечатления о ее состоянии и развитии. Сейчас я как раз работаю над таким докладом: в нем используются рассказы представителей различных компаний об их рабочем опыте. Мы собираем количественные данные с помощь опросов, а качественные – с помощью интервью: такое сочетание – классический метод рыночных исследований. Для того, чтобы собрать наибольшее возможное количество данных с помощью опросов, мы популяризуем их, приглашая тысячи людей и компаний, однако интервью проводятся только по приглашениям.

Сергей: Спасибо. Но ведь есть статистические данные из открытых источников – например, государственных. Что именно делает данные CSA Research более ценными по сравнению с ними?

Дон: Мы занимаемся первичными исследованиями. То есть, мы сами проводим опросы и интервью, при этом полагаясь на официальные источники данных по экономической статистике – например, Всемирного банка, Международного Союза Электросвязи и МВФ. К таким данным относятся показатели ВВП стран, данные переписей по количеству людей, говорящих на определенных языках и принадлежащих к определенным народностям, и так далее. Мы публикуем ежегодные доклады с анализом суммы данных из этих источников, включая показатели цифрового ВВП, а также данные глобальной оценки вебсайтов. Мы ведем наблюдение за набором из трех тысяч сайтов с высоким трафиком с помощью автоматического алгоритма, который собирает данные о поддержке языков и состоянии локализации. Данные, конечно, проверяются опытными аналитиками. Полученная информация сопоставляется с экономическими показателями, что позволяет определить, какие языки наиболее важны с экономической точки зрения. Мы ежегодно обновляем список языков, которые наиболее широко применяются в цифровом пространстве, анализируя данные различных правительственных и многосторонних организаций и совмещая их с результатами наших исследований. Как мы выяснили, сегодня для общения с 90% населения Интернета требуется 15 языков – но эта цифра изменяется каждый год, поэтому мы продолжаем составлять ежегодные доклады и списки, которые находят широкое применение.

Сергей: Вы описываете гигантский источник данных, набор, составляющий целостное множество рыночной информации отрасли. То есть, каждый год вы рассматриваете эти данные с различных точек зрения, чтобы получить аналитическую картину отрасли. Кстати, насчет данных: я хотел передать вам вопрос от Светланы Световой – директора T-Service, российского дистрибутора Trados компании SDL. Что вы думаете о сравнении текущих значений показателей с историческими, и как вы учитываете изменения? Я знаю, что в какой-то мере это делается в большинстве ваших докладов. Как вы относитесь к созданию ретроспективного доклада, в котором можно было бы рассказать об изменениях в технологической среде, в прогнозах роста и в ценовых политиках за определённый период? Было бы интересно узнать о том, какие участники рынка чаще всего занимают ведущие роли, и о том, есть ли среди них стартапы и небольшие компании. Я думаю, такое историческое сравнение позволило бы сделать предположения о том, в каком направлении идет развитие отрасли, а также проверить, воплотились ли в жизнь аналогичные предположения, сделанные ранее.

Дон: Да, это отличная идея, и мы работаем над похожим проектом. Мы уже проанализировали крупнейшие из компаний, а теперь проводим анализ всей отрасли в целом. Скорее всего, вы уже видели график, на котором мы последние 12 лет ведем учет «топ-10» наиболее влиятельных поставщиков лингвистических услуг. Кроме того, у нас есть проверенные данные о крупнейших компаниях в отрасли за последние 10 лет.

Конечно, у нас много сравнительных данных о компаниях. Мы планируем создать для них более систематизированное представление. Возможно, ценность данных о поддержке различных языков на вебсайтах и о соответствии значения ВВП стран и применения языка проявится при составлении прогнозов. В каждом случае, когда ценность одних языков растет, а других – падает, задействованы определенные факторы, и за ними очень интересно наблюдать. Мы рассчитываем, что дистилляция собранных данных поможет пролить свет на проблемы в экономике – и не только.

Сергей: Спасибо. Теперь хотелось бы спросить о судьбе данных, которые ваша компания собрала за прошедшие годы. Существует ли систематизированное хранилище, к которому ваши подписчики могли бы получить доступ для самостоятельной работы с данными? Представляют ли эти данные ценность сами по себе? Или вы не собираетесь предоставлять к ним доступ?

Дон: Здесь нужно решить несколько задач. Первая связана с реализацией такого хранилища, вторая – с предоставлением доступа и монетизацией. Работа над хранилищем с похожими возможностями уже идет. Мы провели опросы на тему покупательных предпочтений и поведения потребителей (как людей, так и компаний) в десяти неанглоязычных странах. Мы протестировали доступное для клиентов хранилище данных с несколькими участниками нашей исследовательской программы. Расширенные возможности по обработке данных с помощью инструментов бизнес-аналитики и визуализации им очень понравились. В нашу команду входит эксперт по анализу и обработке данных и эксперт по статистике, и я работаю с ними напрямую, чтобы выбрать такие методы представления и визуализации данных, которые подойдут нашим клиентам.

Так, мы используем решение для визуализации данных Tableau в сочетании со статистическим ПО SAS, которым мы пользуемся. Предоставление доступа к данным – это действительно сложная задача. Требуется модель данных, которая включала бы в себя множество опросов. Кроме того, надо ответить на различные вопросы: какова основная задача хранилища? Какие запросы нужно открыть для клиентов? Какую информацию можно получить, работая с хранилищем? Данные за прошедшие годы также нужно нормализовать. Некоторые вопросы, которые мы задаем сейчас, ранее задавались в иной форме (или не задавались вообще). Весь массив данных нужно будет привести к общей структуре.

Я хорошо знаю, по каким принципам раньше создавались корпоративные базы данных, и какой путь развития они прошли: до того, как я начал заниматься рыночными исследованиями в Forrester, я работал в этой сфере. Даже компаниям, которые создают наилучшие возможные архитектуры данных, рано или поздно приходится реагировать на неожиданные изменения. Нам предстоит решить похожую задачу с нашим массивом собранных данных, хотя теперь у нас есть подходящие инструменты. В общем, работа идет.

Сергей: Я соглашусь. Создание подходящей модели данных – очень сложная задача. А визуализация данных – это одна из недавних инновационных разработок в управлении данными. Было бы очень интересно посмотреть на подобное решение от CSA. Но для такой разработки нужна большая команда, у вас она есть?

Дон: Человек 20 постоянных сотрудников, плюс эксперты по обработке и анализу данных и статистике. У нас самая крупная команда исследователей в отрасли. И еще сотрудники, которые отвечают за ведение расчетов, обслуживание клиентов, продажи и оперативное управление.

Сергей: Это много.

Дон: Я участвовал в нескольких стартапах. Успех всегда сильно зависел от кадров, а раньше – еще и от инфраструктуры, но сейчас она не так важна. Я помню, как в первом стартапе, в котором я работал, приходилось тратить по $30,000 на оборудование для каждого сотрудника – столько стоили хорошие рабочие станции Apollo или Sun, при этом приходилось отводить отдельную комнату под серверную. Двое сотрудников были полностью заняты IT, а обслуживать оборудование приходили люди из Apollo и Sun. А теперь мощный ПК стоит всего $1,500 – с ума сойти можно. Мы активно работаем в облаке – используем файл-сервер Egnyte, Salesforce, конференции Zoom. Облачные технологии позволяют мелким компаниям представлять себя так, как это не было возможно даже 10 лет назад, и работать с огромной отдачей. Конечно, переводческий сектор это также затрагивает.

Сергей: Это впечатляет! Жаль только, что большинство людей не понимает, какая сложная работа на самом деле происходит «за кулисами».

Продолжение следует. Во второй части беседы мы поговорим собственно о переводе и современных проблемах отрасли.