Lingvo, PDF Transformer, FineReader. Интервью с компанией ABBYY

От редакции: Яна Смотряева трагически погибла в автокатастрофе под Ригой. Приносим свои соболезнования родственникам и друзьям погибшей коллеги...


Предисловие


За последнее время в самой компании ABBYY и в линейке ее продуктов произошли некоторые изменения. Прежде всего, открылся новый офис - ABBYY Россия. Помимо того, что вышла новая версия хорошо всем известного словаря Lingvo 10, появилась абсолютно новая редакция Home не менее известного продукта FineReader. Вдобавок ко всему этому появился еще один новый продукт - ABBYY PDF Transformer. О новинках софтверных и политических мы попросили рассказать Яну Смотряеву, главу отдела по связям с общественностью, и Сергея Фенева, генерального директора ABBYY Россия.

Интервью



Алексей Доля: Недавно вышла новая десятая версия вашего замечательного продукта Lingvo. Какие нововведения вы бы особо выделили?

Яна Смотряева: Думаю, стоит говорить не просто о нововведениях, а о целом новом направлении в развитии продукта. Lingvo все более становится образовательной программой. Теперь это не просто словарь, пусть даже самый полный и очень удобный. Это целая академия на полке. В десятую версию мы добавили несколько вещей, которые будут весьма полезны тем, кто только начинает изучать языки. В первую очередь, это новое приложение для пополнения словарного запаса - Lingvo Tutor. Кроме того, появился новый лингвострановедческий словарь США "АМЕРИКАНА-II" (в девятой версии уже был лингвострановедческий словарь Великобритании), значительно вырос общий объем словарей, добавились новые тематические словари и т.д.


Алексей Доля: Превращение Lingvo из простого словаря в образовательное средство для изучения языка планировалось компанией ABBYY заранее? На каком этапе потребность в такой трансформации продукта стала очевидна?

Яна Смотряева: Изучение языка - это очень многосторонний, многоступенчатый процесс. Lingvo Tutor - это приложение для пополнения словарного запаса, оно предназначено для очень частной задачи - заучивания слов. В целом же мы не планируем превращать Lingvo в обучающую программу, никакой методики по изучению иностранного языка внедрять не собираемся.


Алексей Доля: Расскажите, пожалуйста, о Lingvo Tutor. Что собой представляет это средство и как оно может помочь увеличить словарный запас пользователя?

Яна Смотряева: Lingvo Tutor основан на методе запоминания слов по "карточкам". Основной режим работы - проверка написания слова по заданному переводу и подсказкам. Lingvo Tutor ведет статистику: сколько всего слов, сколько из них уже выучено и сколько еще осталось. Учебные карточки содержат переводы, транскрипцию, примеры. Это удобное приложение, которое добавляет в процесс выучивания слов элемент и игры и соревнования. Пожалуй, освоить Lingvo Tutor можно быстрее, чем описать его функционал :).



Вот как выглядит наставник из Lingvo


Алексей Доля: Что такое лингвострановедческий словарь? Чем он отличается от стандартных и специализированных словарей Lingvo? Какую пользу из него можно извлечь?

Яна Смотряева: Лингвострановедческий словарь, включенный в Lingvo 10 -"АМЕРИКАНА-II" содержит более 21 тыс. словарных статей по истории, государственному, экономическому и социальному устройству, литературе и искусству, а также повседневной жизни Соединенных Штатов Америки, биографии известных американцев, обширную информацию по географии США. Эти сведения могут быть полезны переводчикам, историкам, политологам, экономистам, социологам, представителям бизнеса, журналистам, студентам, да и вообще всем, кто интересуется Соединенными Штатами Америки и американской культурой.


Алексей Доля: Скажите, пожалуйста, как вам удается расширять общий объем словарей от версии к версии? Вы не могли бы привести динамику изменения общего объема словарей за последние, например, три версии?

Яна Смотряева: Мы включаем в Lingvo новые общие и специализированные словари разных авторов, а также добавляем словарные статьи в собственные словари ABBYY (такие как LingvoUniversal). Динамику легко проследить на примере многоязычного словаря Lingvo версий 8.0 - 10. Восьмая версия включала 2400000 словарных статей в 40 словарях, девятая - 3500000 словарных статей в 49 словаря (в Lingvo 9.0 был добавлен испанский язык), "десятка" содержит уже 4500000 словарных статей в 78 словарях.



Удобно представленные "Формы слова" будут действительно полезны. Их давно не хватало


Алексей Доля: Работает ли компания над уточнением уже существующей словарной базы? Добавлением новых вариантов перевода, уточнением уже имеющихся. Ведь язык развивается постоянно!

Яна Смотряева: Да, безусловно. Лингвист, лексикограф - это постоянно открытые вакансии в ABBYY. Они у нас в цене не меньше, чем хорошие программисты. Да и пользователи помогают - присылают комментарии и пожелания к содержанию словарей.


Алексей Доля: Почему ваша компания выпустила версию 10, а не скажем 9.1 или 9.5? В продуктовых линейках вашей компании вообще бывают дробные версии?

Яна Смотряева: Дробные версии у нас бывают крайне редко. Как правило, дробная версия означает, что продукт претерпел некоторые изменения, но не слишком сильные - то есть на новую версию не тянет. У нас такое было от силы пару раз. Если уж мы выпускаем продукт, значит, мы над ним хорошенько поработали, и в нем действительно много нового и полезного. Десятая версия Lingvo настолько отличается от "девятки", что о дробях просто не приходится говорить - только объем словарей увеличился в полтора раза, не считая остальных дополнений и улучшений.


Алексей Доля: Где можно купить Lingvo 10 и сколько он стоит?

Яна Смотряева: Купить Lingvo можно много где - и в Интернет-магазине ABBYY, и в компьютерных салонах, и в палатках (заметьте, в палатках тоже продается легальная версия). Рекомендованная нами цена англо-русской версии Lingvo 10 - 465 рублей, многоязычной версии - 955 рублей.


Алексей Доля: И как вам удается продавать Lingvo по таким низким ценам? Хотя, наверное, даже при таких ценах вы страдаете от пиратов.

Яна Смотряева: Эти цены можно назвать оптимальными. Объемы продаж словаря растут от версии к версии. При этом Lingvo гораздо меньше страдает от пиратов, чем дорогие программы. Продавать пиратскую копию качественной программы, лицензионная версия которой стоит около 30$ - просто нет смысла. Более того, в ноябре 2004 года мы вместе с 1С выпустили серию словарей для начинающих "Lingvo 10 Первый шаг". Стоимость одного из 5 словарей (отдельные английский, немецкий, французский, испанский и итальянский словари) - 3,6$, т.е. около 100 рублей. Сейчас 1С издает и очень успешно продает "Первый шаг" через мощнейшую региональную сеть.


Алексей Доля: Расскажите, пожалуйста, об абсолютно новом продукте - ABBYY PDF Transformer. Что он умеет и для кого предназначен?

Яна Смотряева: PDF Transformer преобразовывает в редактируемые форматы Microsoft Word, Microsoft Excel, HTML или TXT все типы PDF-файлов, даже те, у которых нет "текстового слоя" - так называемые файлы Image only. По нажатию одной кнопки вы получаете PDF-документ в своём любимом офисном приложении с полным сохранением оформления. PDF Transformer можно считать универсальным продуктом, так как с ним работают как дома, так и в офисе - в PDF хранят и пересылают статьи, брошюры, руководства пользователя, отчёты, договоры и листовки, в общем, самые разные документы. Так что наша программа, думаю, пригодится практически всем.



PDF Transformer - узкоспециализированный, но полезный инструмент. Подробнее он будет рассмотрен ниже


Алексей Доля: Правильно ли я понимаю, что те же задачи можно выполнять с помощью ABBYY FineReader? То есть PDF Transformer - урезанная версия FineReader, заточенная под конкретные задачи?

Яна Смотряева: FineReader 7.0 Professional Edition действительно включает в себя все функции PDF Transformer. Это продукт, решающий конкретную задачу преобразования PDF-файлов. Однако не совсем верно говорить, что PDF Transformer - урезанная версия FineReader. Professional - это, прежде всего, профессиональный продукт для распознавания бумажных документов, и преобразование PDF-файлов является его дополнительной функцией.


Алексей Доля: Сколько стоит ABBYY PDF Transformer и где его можно купить?

Яна Смотряева: PDF Transformer продается по тем же каналам, что и Lingvo. Стоит он 29 долларов.


Алексей Доля: Недавно вышла новая редакция известной системы распознавания - ABBYY FineReader Home Edition. Чем она отличается от редакции Professional? Для кого предназначена?

Яна Смотряева: FineReader Home Edition, как видно из названия, предназначен для домашних пользователей. От версии Professional домашняя версия отличается незамысловатостью (в хорошем смысле слова) интерфейса и отсутствием некоторых профессиональных настроек и функций. Что же касается ядра распознавания, то оно то же самое, что и в профессиональных вариантах FineReader. Соответственно точность распознавания такая же. В то же время домашнему пользователю с Home Edition будет проще найти общий язык - настолько легко с ним управляться.



FineReader Home Edition позиционируется, как продукт для тех пользователей, которым приходится распознавать текст от случая к случаю. При этом им вовсе не нужны сложные технические настройки редакции Professional


Алексей Доля: Нельзя ли подробнее о тех функциях, которые реализованы в FineReader Professional 7.0, но отсутствуют в Home?

Яна Смотряева: Конечно можно. Специальные функции версии Professional: открытие и распознавание PDF-файлов, система проверки орфографии и полнотекстового морфологического поиска для 34 языков, инструменты для разбиения изображения, которые помогают в работе с документами, включающими сложную графику, распознавание штрих-кодов. FineReader Home Edition может сохранять результаты распознавания в основных текстовых форматах: RTF, DOC, XLS, HTML, TXT, PDF. Но версия Professional все же немного его опережает: она может сохранять еще и в DBF, CSV, Unicode CSV, Microsoft Word 2003 XML и Microsoft PowerPoint 2003/XP. Как видите, это в основном форматы для "продвинутых" пользователей.


Алексей Доля: Сколько стоит ABBYY FineReader Home Edition и где он продается?

Яна Смотряева: FineReader Home Edition продается по тем же каналам, что и Lingvo с PDF Transformer. Его цена - 15 долларов.


Алексей Доля: Можно ли использовать ABBYY FineReader Home Edition для распознавания PDF-файлов? Ведь таким образом пользователь может сэкономить на продукте PDF Transformer.

Яна Смотряева: Home Edition может только сохранять результаты распознавания в PDF-формате. А вот преобразовывать PDF-файлы в редактируемый формат программа не может. Это эксклюзив от PDF Transformer. Согласитесь, странно с нашей стороны было бы выпустить два продукта, один из которых полностью заменяет другой и стоит при этом дешевле.


Алексей Доля: Теперь хотелось бы задать несколько вопросов Сергею Феневу. Какую вы занимаете должность? Что входит в круг ваших обязанностей?

Сергей Фенев: Я пришел в ABBYY летом 2004 года на должность генерального директора нового офиса ABBYY Россия. Новый офис был образован путем перехода части служб и департаментов головного московского офиса в отдельное подразделение. Основными задачами ABBYY Россия стали маркетинг, продвижение и продажи всей линейки продуктов ABBYY на территории России, СНГ, а также в таких регионах как Азия, Южная Америка, Ближний Восток, Австралия, Африка и страны Балтии (Латвия, Литва, Эстония).


Алексей Доля: То есть вся обитаемая планета кроме Северной Америки и Европы? С чем связано подобное разделение функций?

Сергей Фенев: Появление ABBYY Россия - шаг, призванный упорядочить внутреннюю корпоративную структуру и оптимально распределить ресурсы компании. Головной офис ABBYY в Москве, из которого образовался ABBYY Россия, теперь занимается только разработкой продуктов и координацией действий группы компаний в целом.
В плане же "разделения мира" ничего нового не произошло. В зону ответственности российского офиса вошли те страны и регионы, с которыми традиционно работали московские менеджеры ABBYY. Помимо этого, у ABBYY есть и другие региональные офисы, занимающиеся маркетингом и продажами в стратегически важных точках. За Северную Америку у нас отвечает офис ABBYY USA (расположен в штат Калифорния). В Европе находится два региональных офиса ABBYY - в Германии и в Великобритании. Офис ABBYY Ukraine занимается продажами и маркетингом на Украине, в Восточной и Центральной Европе и в Турции.


Алексей Доля: С чем связано ваше назначение на этот пост?

Сергей Фенев: Я очень давно и хорошо знаю компанию ABBYY, а основанная мной компания CPS - старинный партнер ABBYY. Поэтому и меня в ABBYY давно и хорошо знают. Я с удовольствием согласился на предложенную мне должность. Было весьма лестно возглавить региональное отделение ABBYY. В такой динамично развивающейся фирме открываются большие перспективы, можно по-настоящему много сделать.


Алексей Доля: Правильно ли я понимаю, что у Lingvo сегодня нет конкурентов в России? Есть ли у него конкуренты на мировом рынке? Кого бы вы выделили?

Сергей Фенев: Ну почему же, конкуренты у Lingvo в России есть - без них было бы скучно жить :). А так, есть постоянный стимул развиваться и не останавливаться на достигнутом. Вообще, на российском рынке представлено достаточно много электронных словарей разного уровня, например словарь VerDict от компании Промт. Тем не менее, на сегодня доля рынка Lingvo - значительно больше, чем у конкурентов (от 55 до 87% по разным оценкам), и она постоянно увеличивается.
Что касается конкуренции на мировом рынке, то пока об этом говорить рано - на мировом рынке Lingvo представлен незначительно, мы еще не ставили такой задачи. Поэтому сейчас нашим словарем пользуются за границей, чаще всего, наши же бывшие сограждане. В целом мы знаем, что мировой рынок электронных словарей развит очень хорошо, на нем существуют мощнейшие брэнды, такие как Oxford, Collins и т.д.


Алексей Доля: Как обстоят дела с конкурентами на мировом рынке у FineReader? Увеличилась ли доля рынка этой системы распознавания за последние годы?

Сергей Фенев: В данный момент на мировом рынке мы лидируем, если так можно сказать, технологически - у нас достаточно большая доля рынка технологий, более половины всех сканеров и МФУ в мире поставляются с продуктами на основе нашей технологии FineReader. В рознице мы продолжаем потихоньку "откусывать" части рыночного пирога у нашего главного соперника - достаточно известной на Западе системы OmniPage. На сегодня в разных странах наша доля составляет от 10 до 90%. Эта доля постоянно растет - возможно, не всегда так быстро, как хотелось бы, но надо учитывать, что данная ниша уже была прочно занята, когда мы туда пришли, поэтому нам приходится выдавливать нашего конкурента с насиженного места - это процесс сложный и долгий.


Алексей Доля: Планирует ли компания выходить на новые рынки?

Сергей Фенев: С одной стороны, на всей огромной территории, за которую отвечает ABBYY Россия, можно, так или иначе, приобрести наши программы. Но, несмотря на значительные успехи, нам, конечно, еще есть, над чем работать. Если, например, в Индии или ЮАР наши программы известны очень широко, то в Южной Америке перед нами стоят еще большие задачи. Поэтому организация в каждом регионе эффективно работающей партнерской сети - это наша приоритетная задача. Можно сказать, что наша основная цель - грамотное освоение уже существующих рынков.

ABBY PDF Transformer


Так как со словарями Lingvo и системами распознавания текстов FineReader ("Словари, системы распознавания текстов и ввода форм", "Lingvo 9: слово о словаре") наши читатели уже знакомы, мы подробно остановимся на ABBYY PDF Transformer.

Запустить программу проще простого: щелчок правой кнопкой мыши на любом pdf-файле и выбор пункта меню "PDF Transformer" приведет к появлению дополнительного контекстного меню, представленного на картинке ниже.



C помощью этого меню можно распознать текст и сохранить результат в приемлемом формате


Работа программы строится по шагам, которые представляют собой диалог с пользователем. Первый шаг представлен на следующей картинке.


Шаг 1. Первый шаг является информационным


На первом шаге надо лишь нажать кнопку "Далее". Второй шаг: пользователю необходимо определиться, что делать с результатом распознавания. Можно открыть результат в Microsoft Word или Excel, а можно сразу же его сохранить в одном из предлагаемых форматов.



Шаг 2. Форматы, с которыми работает PDF Transformer, представлены на картинке

Если вы не уверены в качестве распознавания и планируете править текст, то целесообразно сразу же открыть результат в Word. В противном случае очень удобно сохранить результат, как документ Word или HTML-страницу, так как PDF Transformer полностью сохраняет форматирование исходного текста.

Следующий, третий, шаг позволяет настроить процесс распознавания и выбрать те языки, которые будет распознавать программа, количество обрабатываемых страниц (например, все). Раздел опций позволяет выделить среди языков основной и дополнительный (например, первый - русский, второй - английский), сохранять или не сохранять оформление (по умолчанию оформление сохраняется), а также выбрать параметры изображения (например, разрешение). Все эти настройки представлены на картинке ниже.



Шаг 3. Настройки PDF Transformer

Далее происходит уже сам процесс распознавания, который занимает некоторое время. Следует отметить, что программа работает довольно быстро и распознает на вполне приличном уровне. Однако к ее настройкам все же стоит отнестись внимательнее, несмотря на то, что их так мало. Прежде всего, не имеет никакого смысла задавать второй язык распознавания, если текст написан только на английском языке. То же относится к коду программы, который может быть отсканирован из книги. Там все операторы и переменные представлены только латинскими символами.

Все же PDF Transformer иногда ошибается. Этих ошибок довольно мало, и они носят специфический характер. Например, маленькая латинская буква "l" часто путается с единицей - "1", а ноль ("0") - с буквой "O". Однако когда речь идет о лингвистическом тексте (что случается намного чаще - технические документы, статьи, пресс-релизы), программа не поставит ноль прямо посредине слова. Проблемы могут возникнуть при распознавании исходного кода программ или специально подобранных фрагментов, где много цифр и букв.

В целом PDF Transformer оставляет самые приятные впечатления. Продукт может пригодиться домашним пользователям, которым действительно часто приходится работать с чужими документами в формате PDF, а также корпоративным клиентам, где подобные документы используются повсеместно. Однако если у пользователя уже имеется FineReader Professional, PDF Transformer уже не понадобится. FineReader отлично справится с любым pdf-документом.