Распознавание паспортных данных. Распознаём паспорта — сравниваем, тестируем, выбираем

«Принёс посылку! Только я вам её не отдам! Потому что у вас доку́ментов нету.»

Печкин

Когда мы реализуем наши проекты, мы постоянно сталкиваемся с задачей ввода и распознавания различных документов – формализованных и неформализованных, построенных по каким-либо шаблонам, созданным по утверждённым формам. Одним из классов являются удостоверяющие личность документы. Этот особый класс документов стоит немного особняком – документы там достаточно формализованы, распознаваемых данных немного, присутствуют графические объекты, такие как подпись и фотография. Тексты на удостоверяющих документах слабо верифицируются по словарям, так как содержат фамилии, имена, топонимы, наименования пунктов выдачи. При этом, в распознавании удостоверяющих документов важна точность и минимизация ошибок, так как эти данные могут поступать напрямую в учётные системы.

Я неоднократно встречался со сценариями ввода различных удостоверений личности в информационные системы. Например, система выдачи пропусков:

  1. Сотрудник на внутреннем портале заказывает пропуск для посетителя. Заявка попадает в службу охраны.
  2. Когда посетитель приходит на проходную, то предъявляет удостоверение личности, его сканируют, система распознавания удостоверений личности извлекает из сканированного образа всё, что можно извлечь.
  3. По фамилии находится соответствующая заявка, автоматически печатается согласие на обработку персональных данных.
  4. Выдаётся пропуск. Заявка закрывается.
  5. В архиве сохраняется сканированный образ документа посетителя, данные удостоверения личности, время входа-выхода и так далее.

Также, распознавание удостоверяющих документов может быть использовано в банковской сфере, в присутственных местах, где требуется предъявление документов. Посетитель предъявляет паспорт или иное удостоверение, система распознавания определяет ключевые параметры документа:

  • номер, серию;
  • дату выдачи, орган выдавший документ;
  • MRZ – machine-readable zone (машинно-читаемая зона для паспортов) и др.

Клиент автоматически находится в базе данных, сравниваются его предыдущие данные с паспортными, изменения, производится проверка на корректность данных. При необходимости можно сравнивать или демонстрировать оператору фотографию с паспорта и фото, сохранённое ранее – это позволит повысить защиту от мошенничеств, связанных с подделкой документов (хотя и не исключит возможность подделки полностью, на 100%).

Автоматизация ввода удостоверяющих документов может быть внедрена в гостиницах, страховых компаниях, автосервисах, магазинах, туристических агентствах; в поликлиниках, особенно при оказании платных услуг; при продаже билетов, где требуется идентификация человека, например, продажа билетов на футбол. Сфера применения систем распознавания такого рода документов огромна, а внедрение таких решений значительно ускоряет обслуживание посетителя!

Данные паспортов могут автоматически контролироваться по соответствующим перечням органов внутренних дел, выдавших паспорт, номеру/серии паспорта и коду подразделения. Все эти вещи взаимосвязаны и могут быть автоматически проверены для контроля подлинности документа.

На российском рынке сегодня представлено два основных решения по распознаванию удостоверений личности:

  • ABBYY PassportReader SDK. Комплексное решение от известного разработчика систем распознавания, компании Аби. http://www.passportreader.ru/
  • Smart IDReader. Достаточно новое на рынке, встраиваемое решение от компании SmartEngines. http://smartengines.ru/smart-idreader/

Как мы тестировали

Для тестирования нами был создан стенд, представляющий собой веб-сайт, в котором можно было выбрать механизм распознавания; загрузить один или несколько образов; отсканировать документ и получить результаты. Приложение замеряло время полного цикла и непосредственно процесса распознавания образа.

Сайт был запущен на рабочей станции Intel i7 6700 4 core / 3.4GHZ / 32Gb RAM.

В общем, всё просто, ничего лишнего!

ABBYY PassportReader SDK

Данный продукт представляет собой инструмент разработчика Software development kit, предназначенный для встраивания в конечное решение заказчика. Возможно встраивание в двух вариантах:

  1. Встраивание в толстый клиент. Лицензируется каждое рабочее место;
  2. Развёртывание как веб-сервис. Лицензируется сервер.

Размер развёрнутого веб-сервис решения составляет 346 Мб.


Для стенда нами был использован вариант развёртывания как веб-сервис. Обращение к веб-сервису распознавания удостоверений личности осуществляется по протоколу HTTP -SOAP из веб-сайта стенда.

ABBYY PR «из коробки» поддерживает различные удостоверения личности на нескольких языках, а также международный формат паспорта:

  • Заграничный паспорт (универсальный шаблон);
  • Паспорт гражданина Российской Федерации;
  • Отдельные страницы паспорта гражданина Российской Федерации;
  • Заграничный паспорт гражданина Российской Федерации;
  • Водительское удостоверение гражданина Российской Федерации;
  • Свидетельство о рождении гражданина Российской Федерации;
  • Удостоверение личности гражданина Азербайджана;
  • Заграничный паспорт гражданина Азербайджана;
  • Паспорт гражданина Белоруссии;
  • Удостоверение личности гражданина Казахстана;
  • Заграничный паспорт гражданина Казахстана;
  • Водительское удостоверение гражданина Казахстана;
  • Удостоверение личности гражданина Киргизии;
  • Водительское удостоверение гражданина Киргизии;
  • Паспорт гражданина Таджикистана;
  • Заграничный паспорт гражданина Таджикистана;
  • Заграничный паспорт гражданина Украины.

Выбор соответствующего типа документа для распознавания осуществляется передачей в механизм распознавания нужного типа документа. Соответственно, в пользовательском интерфейсе пользователь должен явно указать тип распознаваемого документа. Определять шаблон автоматически механизм распознавания не умеет.

ABBYY PR SDK представляет собой набор функций (порядка 10ка), обеспечивающий передачу изображения в движок распознавания и получения результатов. Результаты содержат найденные на удостоверении личности области (координаты областей), распознанные данные, качество (уверенность) распознавания в процентах.

Также движок распознавания умеет считывать машинно-читаемую зону загранпаспортов, что даёт возможность обрабатывать загранпаспорта всех стран, которые являются членами ИКАО (International Civil Aviation Organization, Международной организации гражданской авиации).

Машинно-читаемый паспорт

Машинно-читаемый паспорт - это машинно-читаемый документ путешественника (MRTD, machine-readable travel document), с данными, кодированными специально для оптического распознавания текста. Впервые, данное усовершенствование предложила международная организация гражданской авиации 1968 году. Машинно-читаемые документы должны были значительно ускорить выписку авиабилетов, прохождение границы, контроль паспортов. В 1980 году вышла первая версия документа Doc 9303 MRTD, описывающего формат MRZ (МЧЗ – машинно-читаемой зоны). Первый паспорт с кодированной информацией по стандарту Doc 9303 был выдан в 1981 году в Соединённых Штатах и с тех пор формат стал завоёвывать популярность.

Затем появился формат MRV – machine readable visas. В 2004 году предложен ePassport – электронный паспорт, основанный на сертификатах электронной подписи, полностью кодированный в электронном виде паспорт, то, что мы сейчас называем «биометрический паспорт». Однако, считывание биометрических данных не относится к распознаванию текста и требует специализированного оборудования, тут уже простым настольным сканером не обойтись. В России правила формирования машинно-читаемой зоны утверждены приказом ФМС от 15 октября 2012 года №320 и определены в приложении №15. Данные правила сходны с требованиями Doc 9303, однако, отличаются в некоторых деталях.

[свернуть]

Продукт хорошо документирован, описаны все функции, параметры вызовов, настроек и т.д.

Удобство встраивания ABBYY SDK можно условно оценить на 5.

При этом, существует ограниченная возможность управления процессом распознавания, управлять качеством изображения, очисткой и т.д.

Качество распознавания ABBYY PR SDK

Для оценки качества распознавания нами было протестировано распознавание 12 образцов паспортов РФ, которые были в наличии. Образцы не подготавливались специально, а были выбраны из тех что имелись ранее, часть из них были отсканированы, часть получены фотокамерой мобильного телефона. Расположение горизонтальное, без искажений.

  • 9 изображений были распознаны корректно;
  • Одно изображение не распознано с ошибкой;
  • Из трёх паспортов не была извлечена ключевая информация – фамилия, имя, отчество.

Данные извлекаются независимо от разрешения переданного изображения, однако при определённом пороге (порядка 150dpi) качество распознавания резко падает вплоть до 100% ошибок.

Распознавание образцов, полученных непосредственно со сканера, при настройке яркости и контрастности изображения позволяет обеспечить практически 100% извлечение данных.

Механизм распознавания ABBYY PR SDK чувствителен к повороту изображения в полях АДРЕС, КЕМ ВЫДАН. При повороте или наклоне изображения появляются ошибки извлечения данных.

Время обработки изображения – порядка 4000 – 5000мс. При оценке времени мы учитывали необходимость движку «разогнаться», считать лицензию и т.д., так как первый запуск мог быть значительно дольше, до десятков секунд.

Smart Engines Smart IDReader

Продукт Smart IDReader представляет собой набор разработчика Software Development Kit непосредственно встраиваемый в конечное решение. Возможен только вариант встраивания в код прикладного программного обеспечения, функционирование как отдельный веб-сервис из коробки невозможно. Однако, есть решение для мобильных продуктов — в AppStore и GooglePlay выложены демо:

Есть решения для распознавания из видеопотока, и на различных операционных системах, таких как iOS, MacOS, Windows, Linux, МЦСТ Эльбрус (Oh my God!!!).

Размер развёрнутого решения извлечения данных составляет 40 Мб.


Тестируемое программное обеспечение Smart IDReader, путём передачи соответствующих флагов в функцию распознавания позволяло обрабатывать:

  • Паспорт
  • СНИЛС
  • Водительские удостоверения
  • Свидетельство о регистрации транспортных средств (СТС)
  • Любые документы с машиночитаемой зоной (MRZ)
  • Банковские карты — кредитные и дебетовые

С сайта можно разработчика можно узнать, что Smart IDReader понимает водительские права, удостоверение о регистрации транспортного средства, СНИЛС, пластиковые карточки и другие документы. Правда, как включить это нигде не документировано. Анализ содержимого дистрибутива наводит на мысль, что шаблоны распознавания кодируются в виде описаний и правил на JSON, но, опять же, это нигде не документировано и инструментов настройки вендор не предоставляет. Правда разработчик готов сделать для вас любой шаблон по заказу под конкретный проект.

Решение для разработчика не документировано, передаётся как библиотека DLL и h-файл, для связывания с кодом С++.

С одной стороны, для людей неподготовленных, встраивание системы распознавания от Smart Engines может представлять некоторые трудности, с другой – разработчик гораздо более гибок в технической поддержке и готовности подстраивать продукт под ваши нужды.

Как недостаток, можно отметить отсутствие поддержки языков ближнего зарубежья – если вам потребуется такое решение, то выстроить его на Smart IDReader вряд ли быстро получится.

Удобство встраивания решения можно условно оценить на 3.

SmartID «из коробки» не обладает возможностью управления процессом распознавания, управлять качеством изображения, очисткой и т.д.

Качество распознавания Smart IDReader

Для оценки качества распознавания нами было протестировано распознавание тех же образцов паспортов РФ, которые были в наличии. Все изображения были распознаны, информация извлечена, процент ошибок незначительный.

Нами были протестированы ряд старых и новых образцов паспортов РФ. Распознавание образцов, полученных непосредственно со сканера, аналогично решению распознавания от Аби, при настройке яркости и контрастности изображения позволяет обеспечить практически 100% извлечение данных.

При определённом пороге (порядка 150dpi) качество распознавания резко падает вплоть до 100% ошибок.

Время обработки изображения – порядка 500-700мс., что существенно быстрее распознавания Abbyy PassportReader. Такое низкое время распознавания можно было бы объяснить прямым встраиванием библиотек в код тестового приложения. Не происходит маршалинг данных через SOAP, сериализация-десериализация и т.д. Однако, ради чистоты эксперимента мы протестировали встраивание Abbyy PassportReader в толстый клиент – время распознавания осталось примерно тем же, порядка 4-5 секунд. Это странно, но, видимо, такова специфика работы движка.

Выводы

Анализ двух механизмов распознавания приведён к баллам и обозначен в таблице:

№ п/п Критерий ABBYY PR Smart IDReader
1. Удобство встраивания 5 3
2. Документация 5 2
3. Качество распознавания случайных изображений 3 4
4. Качество распознавания изображений со сканера при соответствующей настройке 4 4
5. Время обработки изображения 3 5
6. Набор шаблонов и мультиязычность 5 3
7. Размер установленного решения 3 4
Итого 28 25

Оба механизма обладают примерно равными возможностями в части распознавания и извлечения данных. При этом можно отметить следующие отличительные особенности, важные конечному потребителю:

  • Abbyy PR распознаёт больше языков и форм документов;
  • Abbyy PR проще развёртывается и встраивается, более закончен как продукт, техническая поддержка на высоте. Компания Аби обладает непоколебимым авторитетом в области распознавания текстов.
  • Smart IDReader работает значительно быстрее, это может быть критичным на больших объёмах документов;
  • Декларировано, что Smart IDReader умеет распознавать видеопоток. Это может быть использовано в определённых сценариях;
  • Smart IDReader умеет работать на мобильных устройствах и различных, даже экзотических (МЦСТ «Эльбрус»!!!) операционных системах.

Конечно, в итоге надо принимать решение на основе вашей задачи и требований к создаваемому программному обеспечению, выделенного бюджета, модели лицензирования, существующей инфраструктуры.

Готовое решение для распознавания

документов в конфигурациях "1С:Предприятия".

Зачем много слов, лучше увидеть все своими глазами!

Описание решения.

Расширение позволяет распознавать документы удостоверяющие личность физического напряму в конфигурации "1С:Предприятия 8.3", без труда обрабатывать распознанные данные и сохранять их в информационной базе.

Интеграция расширения осуществляется типовым способом, без каких либо доработок основной конфигурации.

На текущий момент в расширении задано четыре, наиболее часто используемых, шаблона:

    Паспорт гражданина РФ;

    Водительское удостоверение РФ;

    СНИЛС РФ;

Необходимо понимать, что качество распознавания зависит только от качества распознаваемого файла и SDK, само расширение для 1С ни как не участвует в непосредственном распознавании документа.

Требования для работы расширения.

  1. конфигурация с интегрированной подсистемой "Физические лица" из конфигурации "Библиотека стандартных подсистем". Расширение протестировано и работает на типовых конфигурациях "Бухгалтерия предприятия ред 3.0" и "Зарплата и управление персоналом ред. 3.1" (есть реальные клиенты работающие с расширением);
  2. должна быть корректно установлена и корректно зарегистрированы библиотеки системы распознавания документов ABBYY PassportReader SDK;
  3. "битность" платформы "1С:Предприятия 8.3" должна соответствовать битности SDK.

Описание поставки.

В комплект поставки включено:

    Расширение конфигурации "Распознавание документов личности";

    Руководство пользователя (по настройке и работе с функционалом расширения).

Преимущества.

  1. Готовое решение.
  2. Интеграция не требует доработки основной конфигурации.
  3. Открытый код.
  4. При необходимости поможет добавить новые шаблоны документов.
  5. Бесплатное обновление обработки в течение 1 месяца.
  6. Подскажем и ответим на все вопросы касающиеся работы обработки бесплатно в течение 1 месяца.

Обработка для самостоятельной интеграции SDK.

Описание работы с примером.

1. Интегрируем обработку в конфигурацию (изменяем код под свои нужды или используем код как пример и вставляем его в нужную часть конфигурации) или просто её запускаем. Первый запуск, когда еще компонента не подключена, может занять до 30 сек.

2. Указываем вид распознаваемого документа.

3. Указываем шаблон распознаваемого документа (на форме это "Документ УЛ").

4. Указываем сканер, с которого необходимо получить изображение документа (тестировалось на сканере fujitsu fi-65f, также на canon с поддержкой драйвера twain) или путь к файлу с изображением документа.

5. Нажимаем кнопку "Распознать".

6. Идет обработка и заполняются поля формы, а также получаем изображение документа (качество распознавания зависит от качества отсканированного изображения).

7. На форме заполнятся поля, а которые не заполнятся, будут скрыты, для их просмотра необходимо нажать кнопку "Показать незаполненные поля".

Поддерживаемые виды документов.

Паспорта:

  • Паспорт гражданина Российской Федерации;
  • Заграничный паспорт гражданина Российской Федерации;
  • Заграничный паспорт гражданина Азербайджана;
  • Паспорт гражданина Белоруссии;
  • Заграничный паспорт гражданина Казахстана;
  • Паспорт гражданина Таджикистана;
  • Заграничный паспорт гражданина Таджикистана;
  • Заграничный паспорт гражданина Узбекистана;
  • Заграничный паспорт гражданина Украины.

Удостоверения личности:

  • Удостоверение личности гражданина Азербайджана;
  • Удостоверение личности гражданина Казахстана;
  • Удостоверение личности гражданина Киргизии.

Водительское удостоверения:

  • Водительское удостоверение гражданина Российской Федерации;
  • Водительское удостоверение гражданина Казахстана;
  • Водительское удостоверение гражданина Киргизии;
  • Водительское удостоверение гражданина Узбекистана.

Требования для работы примера.

  1. Любая конфигурация на платформе "1С:Предприятие 8.3".
  2. Должно быть установлено ПО ABBYY PassportReader SDK.
  3. Для распознавания со сканера, должен быть сканер с поддержкой драйвера TWAIN (большинство принтеров поддерживают).
  4. Разрядность - "битность" SDK должно соответствовать платформе "1С:Предприятие 8.3".
  5. Программист 1С, который понимает Клиент-Серверный режим работы.

Гарантия возврата денег

ООО "Инфостарт" гарантирует Вам 100% возврат оплаты, если программа не соответствует заявленному функционалу из описания. Деньги можно вернуть в полном объеме, если вы заявите об этом в течение 14-ти дней со дня поступления денег на наш счет.

Программа настолько проверена в работе, что мы с полной уверенностью можем дать такую гарантию. Мы хотим, чтобы все наши покупатели оставались довольны покупкой.

Your privacy is important to us. This privacy statement explains:

1. What personal data is collected by the owner of this web site or provided by you, through our interactions with you and your use of our web site (), apps and software

2. How your personal data will be used, where it is held, how long it will be kept and your rights.

Please read this privacy policy carefully.

1. DEFINITIONS AND INTERPRETATION

In this privacy, the following definitions are used:

Data controller means a person who (either alone or jointly or in common with other persons) determines the purposes for which and the manner in which any personal data are, or are to be, processed.

Data processor , in relation to personal data, means any person (other than an employee of the data controller) who processes the data on behalf of the data controller.

“You” , “your” or “data subject” means:
- Visitors to our website
- Subscribers to any service we offer through our site
-Users of our applications
- Prospective or existing clients corresponding with us by phone, e-mail or otherwise.

Data controller , “we” , “us” and “our” means:
LLC «Terminal solutions», its subsidiaries and its data processors;

Personal data means any information relating to an identifiable person who can be directly or indirectly identified in particular by reference to an identifier.

This definition provides for a wide range of personal identifiers to constitute personal data, including name, identification number, location data or online identifier, reflecting changes in technology and the way organisations collect information about people. The definition incorporates, where applicable, the definitions provided in General Data Protection Regulation.

2. CHANGES TO THIS PRIVACY POLICY

We reserve the right to update this Privacy Policy from time to time. Please review this policy periodically for changes. If you do not accept the amended Policy, please stop using this Website.

Who we are (Identity of the data controller)
LLC «Terminal solutions», with its registered address at Karl Marx Lane, 421, office 1, Izhevsk, Russian Federation, doing business as сайт, its affiliates, subsidiaries data processors collectively referred to as сайт.

3. PERSONAL DATA WE MAY COLLECT FROM YOU

We may collect and process the following data and personal information about you.

3.1 Personal Data you provide us voluntarily

We collect the information provided by you to operate effectively and provide you the best experiences with our Website, products and services. You provide some of this information voluntarily by filling in the contact forms on our website, creating an account at our Website or by corresponding with us by phone, e-mail or otherwise. This includes information you provide if you subscribe to any service we offer through our site, send us a query or feedback, sign up for information on events, upload a document with your enquiry, participate in discussion boards or other social media functions on our site, promotion or survey, or when you report a problem with our Website.

This information may include your:
First name, Surname, e-mail address, phone number.

3.2 Children

We do not sell any products or services for purchase by children. If you are under 16, you may use our Website only with the involvement of your holder of parental responsibility. We do not knowingly collect personal information from children below 16 without the consent of the child"s holder of parental responsibility.

3.3 Information you provide about others

In providing personal data about other individuals (such as someone in whose name you are registering an account or subscribing to our marketing promotions), you represent that you have notified them of (i) the purposes for which information will be used (ii) the recipients of their personal data and (iii) how they can access and correct the information. You further represent that You have obtained all necessary consents from them.

The data processing practices related to cases when we act as a data processor and process on behalf of our customers are described in our Data Processing Agreement and are not described this privacy policy.

4. INFORMATION WHICH MAY BE MADE AVAILABLE TO US OR COLLECTED AUTOMATICALLY WITH THE USE OF COOKIES OR ANALYTIC TOOLS

We might get some information from our visitors by recording how they interact with our Website with the use of cookies, analytics tools or obtain data from third parties.

5. TECHNICAL INFORMATION, INCLUDING PERSONALLY IDENTIFIABLE INFORMATION

Might include your device and connectivity information such as IP (Internet Protocol) address, unique device identifiers (such as the IMEI for phones)

6. NON-PERSONALLY IDENTIFIABLE INFORMATION

Might include your configuration data such as browser type, version and language setting, time zone setting, browser plug-in types and versions.

Details of how you used our Website, such as your search queries. Information about your visit, including the full Uniform Resource Locators (URL) clickstream to, through and from our site (including date and time); products you viewed or searched for; page response times, length of visits to certain pages, page interaction information (such as scrolling, clicks, and mouse-overs), and methods used to browse away from the page.

Log information, such as error reports, download errors, any problems you experience using our website and any phone number used to call our customer service number.
We do not match information collected automatically through cookies and analytics tools with other personally identifiable information you may have provided to us when you registered for our Products or submitted a form through our Website.

7. COOKIE POLICY

A cookie is a small file, typically of letters and numbers, downloaded on to a device when the user accesses certain websites. Cookies allow a website to recognise a user’s device.

Why does сайт use cookies?

Cookies allow us to improve the website"s content, functionality and speed, while their tracking ability also helps us to understand your likes and dislikes, which means we can respond quickly and adapt the site accordingly.

We might use cookies to recognize you when you visit our site or use our Services, remember your preferences, and give you a personalized experience:

Authentication cookies. If you"re signed in to our Services, these cookies will help us show you the right information and personalize your experience.

Session cookies. These cookies store the ID of a user’s session. The cookie is set when a user signs in and is used to restore the session without entering the personal data.

Security cookies. We use cookies for our security features, and to help us detect malicious activity.

Preferences, features and services. These cookies help us to customise your preferences, such as which language you prefer and what your communications preferences are or to fill out forms on our faster.

Performance, Analytics and Research. These cookies help us to analyse our web site performance. We use cookies to improve our products, features, and services, including to create logs and record when you access our site.

Third-party cookies. In order to improve the Website and the services we offer you, we may use (temporary and persistent) cookies, authorized third party cookies and/or other technologies to collect non-personally identifiable data. This non-personally identifiable data helps us to track browsing behavior, to create specific or tailor-made offers or advertisements, and to monitor and record the visits and use of the Website.

What can you do if you don"t want cookies to be set or want them to be removed.

Most browsers accept cookies automatically, however some people prefer not to allow cookies. You may change the security settings of your web browser in order to stop your device receiving and storing cookies, to allow receiving and storing cookies from selected websites you trust, or to be notified before receiving cookies. You may also delete cookies stored in your browser at any time. Information stored in such cookies will be removed from your device. However, that these settings may have negative effects on the web sites usability.

Browser manufacturers usually provide help pages relating to cookie management in their products. Please see below for more information:

For other browsers, please consult the documentation that your browser manufacturer provides.

You may opt-out of third party cookies from Google Analytics on its website.

You can opt out of interest-based targeting provided by participating ad servers through the Digital Advertising Alliance (youradchoices.com). In addition, on your iPhone, iPad or Android, you can change your device settings to control whether you see online interest-based ads.

7.1 Information we might obtain from third parties

We might insert advertising on our partner websites, social networks or Advertising networks who might categorize website visitors with similar characteristics or interests into non-personally identifiable data segments and offer these segments to their own clients, visitors and subscribers. For example, if a person expresses an interest in cryptocurrency or beauty products, they might see an advertising banner linking to similar service provider company website.

We might obtain and record information that an ad was requested or shown, how many times, the target geography of the ad (which will not include an IP address or specific personally identifiable location and any user interactions with the ad or the page where the ad appears. This information is used for analysis, reporting and troubleshooting.
We do not perform any visitors profiling activities.

7.2 Where Do We Store Your Information?

We take Client confidentiality and security very seriously. We are committed to protecting the Personal Data you share with us. We use a combination of industry-standard security technologies, procedures, and organizational measures to help protect your Personal Data from unauthorized access, use or disclosure.

The data processing consisting in hosting provider services (storage and maintenance of databases containing your personal data, protected by password) is performed on our behalf under written confidentiality agreements inside European Union Area.

The written agreements with the data processor guarantees that the requirements of the GDPR will be met and the rights of data subjects are protected. The Data Processor will only act on behalf of our documented instructions, have direct responsibilities under the GDPR and may be subject to fines or other sanctions if they don’t comply.
Once this contract is concluded, data processor will return data to us or transmit to another processor appointed by us, and erase any copy in its possession. However, the processor may keep the data locked to address possible administrative or jurisdictional responsibilities.

8. DATA RETENTION

We will keep your personal data During the performance of an oral or written contract between you and us or during the communication process related to the steps prior to entering a prospective verbal or written contract.

We may continue to retain such Personal Information even after the contract between parties terminates, as reasonably necessary to comply with our legal obligations or to protect our legitimate interests if applicable (Please see paragraph “Lawful basis and the purposes of the processing (Uses made of your personal information)”). We will use reasonable endeavours to ensure your data is up-to-date. As a data subject you have rights related to maintenance, storage and processing of your personal data. Please see paragraph “Your rights”.

Unless otherwise specified, where you have indicated to us that you are happy for us to send you the information about the services we offer and we feel may interest you or similar to those that you have already purchased or enquired about do so, we assume you are happy for us to keep your collected personal data. We may retain your Personal Information (contact details) for as long as your User Account is active or as otherwise needed to provide you with information our Services. As the data subject you have rights related to processing of your personal data and the option of withdrawing your consent to receive promotions at any time. Please see paragraph “Your rights”.

9. LAWFUL BASIS AND THE USES MADE OF YOUR PERSONAL INFORMATION

We process all personal data lawfully, fairly and in a transparent manner. We use the data we collect for the following basic purposes, described in more detail below.

9.1 To take steps at the request of the data subject prior to entering into a business relationship (oral or written contract)

By contacting us by means specified in paragraph “Personal Data you provide us voluntarily” we assume that processing is necessary for the performance of a business relationship (oral or written contract) or in order to take steps prior to entering into a business relationship (oral or written contract), and therefore the lawful basis is Contract and our Legitimate interests.

We will use the provided information to operate effectively and do our best to respond to your enquiry. Once you enter into a business relationship (oral or written contract) with us, we will invoice our services and offer you post-sales service and loyalty if required.

9.2 Holding information

We might hold your information for as long as is necessary to comply with our and legal obligations and in accordance with our legitimate interests as a data controller after the contractual relationship between you and us elapses. The lawful basis for such retention is Legitimate interests and Legal obligation. As the data subject you have rights related to maintenance, storage and processing of your personal data. Please see paragraph “Your rights”.

9.3 Communication

To send you communications, including promotional communications and advertising with your explicit consent or allow you to participate in interactive features of our service, when you choose to do so. The lawful basis for such processing is Consent.
If you wish not to receive such promotional emails, you may withdraw your consent at any time by contacting us as described in paragraph “Your rights” or follow the “unsubscribe” or instructions contained in the promotional communications you receive.

9.4 Website improvement

We might use your automatically collected data such as IP address and browser data for our Website improvement, such as:
To administer our site and for internal operations, including data security, troubleshooting, testing, statistical and survey purposes;
To ensure that content from our site is presented in the most effective manner for you and for your device. The lawful basis for such processing is Legitimate interests.

10. DISCLOSURE OF INFORMATION TO THIRD PARTIES

We do not rent, sell, or share personal information about you with other people or non-affiliated companies without your consent except to provide products or services you"ve requested, when we have your permission, or under the following circumstances:

1. We may disclose your information to third parties when we reasonably believe we are obligated to do so by law, and in order to investigate, prevent, or take action regarding suspected or actual prohibited activities, including but not limited to, fraud and situations involving potential threats to the physical safety of any person.

2. In the event we are acquired by or merged with a third party entity or undergo another change of control, we reserve the right to transfer information, including any PII and non-PII, to a successor entity. In this event, we will notify you by electronic means before information about you is transferred and becomes subject to a different privacy policy.

11. LAW ENFORCEMENT, LEGAL REQUESTS AND DUTIES

We may disclose or otherwise allow others access to your Personal Information pursuant to a legal request, such as a subpoena, legal proceedings, search warrant or court order, or in compliance with applicable laws, if we have a good faith belief that the law requires us to do so, with or without notice to you. Your details may also be disclosed to the police and law enforcement agencies for the purpose of fraud detection, crime prevention and national security.

You have the following rights in accordance with the General Data Protection Regulation:

The right to be informed. In this privacy statement we supply you detailed information related to your personal data storage, maintenance and processing.

The right to access information held about you.

The right to rectify your personal data if it is inaccurate, incomplete or out-of-date.

The right to erasure (delete or remove) your personal data.

The right to restrict (block) processing. When processing is restricted, we will store your personal data, but not further process it.

The right to data portability which allows individuals to obtain and reuse their personal data for their own purposes across different services. It allows them to move, copy or transfer personal data easily from one IT environment to another in a safe and secure way, without hindrance to usability.

Rights related to automated decision making including profiling.

We are not making any decisions which might produce a legal effect on you based on automated processing.

The right to withdraw your consent (object) to direct marketing.

The right to lodge a complaint with a supervisory authority.

You have The right to lodge a complaint with your local supervisory authority if you have a concern about our information rights practices.

«Принёс посылку! Только я вам её не отдам! Потому что у вас доку́ментов нету.»

Печкин

Когда мы реализуем наши проекты, мы постоянно сталкиваемся с задачей ввода и распознавания различных документов – формализованных и неформализованных, построенных по каким-либо шаблонам, созданным по утверждённым формам. Одним из классов являются удостоверяющие личность документы. Этот особый класс документов стоит немного особняком – документы там достаточно формализованы, распознаваемых данных немного, присутствуют графические объекты, такие как подпись и фотография. Тексты на удостоверяющих документах слабо верифицируются по словарям, так как содержат фамилии, имена, топонимы, наименования пунктов выдачи. При этом, в распознавании удостоверяющих документов важна точность и минимизация ошибок, так как эти данные могут поступать напрямую в учётные системы.

Я неоднократно встречался со сценариями ввода различных удостоверений личности в информационные системы. Например, система выдачи пропусков:

  1. Сотрудник на внутреннем портале заказывает пропуск для посетителя. Заявка попадает в службу охраны.
  2. Когда посетитель приходит на проходную, то предъявляет удостоверение личности, его сканируют, система распознавания удостоверений личности извлекает из сканированного образа всё, что можно извлечь.
  3. По фамилии находится соответствующая заявка, автоматически печатается согласие на обработку персональных данных.
  4. Выдаётся пропуск. Заявка закрывается.
  5. В архиве сохраняется сканированный образ документа посетителя, данные удостоверения личности, время входа-выхода и так далее.

Также, распознавание удостоверяющих документов может быть использовано в банковской сфере, в присутственных местах, где требуется предъявление документов. Посетитель предъявляет паспорт или иное удостоверение, система распознавания определяет ключевые параметры документа:

  • номер, серию;
  • дату выдачи, орган выдавший документ;
  • MRZ – machine-readable zone (машинно-читаемая зона для паспортов) и др.

Клиент автоматически находится в базе данных, сравниваются его предыдущие данные с паспортными, изменения, производится проверка на корректность данных. При необходимости можно сравнивать или демонстрировать оператору фотографию с паспорта и фото, сохранённое ранее – это позволит повысить защиту от мошенничеств, связанных с подделкой документов (хотя и не исключит возможность подделки полностью, на 100%).

Автоматизация ввода удостоверяющих документов может быть внедрена в гостиницах, страховых компаниях, автосервисах, магазинах, туристических агентствах; в поликлиниках, особенно при оказании платных услуг; при продаже билетов, где требуется идентификация человека, например, продажа билетов на футбол. Сфера применения систем распознавания такого рода документов огромна, а внедрение таких решений значительно ускоряет обслуживание посетителя!

Данные паспортов могут автоматически контролироваться по соответствующим перечням органов внутренних дел, выдавших паспорт, номеру/серии паспорта и коду подразделения. Все эти вещи взаимосвязаны и могут быть автоматически проверены для контроля подлинности документа.

На российском рынке сегодня представлено два основных решения по распознаванию удостоверений личности:

  • ABBYY PassportReader SDK. Комплексное решение от известного разработчика систем распознавания, компании Аби. http://www.passportreader.ru/
  • Smart IDReader. Достаточно новое на рынке, встраиваемое решение от компании SmartEngines. http://smartengines.ru/smart-idreader/

Как мы тестировали

Для тестирования нами был создан стенд, представляющий собой веб-сайт, в котором можно было выбрать механизм распознавания; загрузить один или несколько образов; отсканировать документ и получить результаты. Приложение замеряло время полного цикла и непосредственно процесса распознавания образа.

Сайт был запущен на рабочей станции Intel i7 6700 4 core / 3.4GHZ / 32Gb RAM.

В общем, всё просто, ничего лишнего!

ABBYY PassportReader SDK

Данный продукт представляет собой инструмент разработчика Software development kit, предназначенный для встраивания в конечное решение заказчика. Возможно встраивание в двух вариантах:

  1. Встраивание в толстый клиент. Лицензируется каждое рабочее место;
  2. Развёртывание как веб-сервис. Лицензируется сервер.

Размер развёрнутого веб-сервис решения составляет 346 Мб.


Для стенда нами был использован вариант развёртывания как веб-сервис. Обращение к веб-сервису распознавания удостоверений личности осуществляется по протоколу HTTP -SOAP из веб-сайта стенда.

ABBYY PR «из коробки» поддерживает различные удостоверения личности на нескольких языках, а также международный формат паспорта:

  • Заграничный паспорт (универсальный шаблон);
  • Паспорт гражданина Российской Федерации;
  • Отдельные страницы паспорта гражданина Российской Федерации;
  • Заграничный паспорт гражданина Российской Федерации;
  • Водительское удостоверение гражданина Российской Федерации;
  • Свидетельство о рождении гражданина Российской Федерации;
  • Удостоверение личности гражданина Азербайджана;
  • Заграничный паспорт гражданина Азербайджана;
  • Паспорт гражданина Белоруссии;
  • Удостоверение личности гражданина Казахстана;
  • Заграничный паспорт гражданина Казахстана;
  • Водительское удостоверение гражданина Казахстана;
  • Удостоверение личности гражданина Киргизии;
  • Водительское удостоверение гражданина Киргизии;
  • Паспорт гражданина Таджикистана;
  • Заграничный паспорт гражданина Таджикистана;
  • Заграничный паспорт гражданина Украины.

Выбор соответствующего типа документа для распознавания осуществляется передачей в механизм распознавания нужного типа документа. Соответственно, в пользовательском интерфейсе пользователь должен явно указать тип распознаваемого документа. Определять шаблон автоматически механизм распознавания не умеет.

ABBYY PR SDK представляет собой набор функций (порядка 10ка), обеспечивающий передачу изображения в движок распознавания и получения результатов. Результаты содержат найденные на удостоверении личности области (координаты областей), распознанные данные, качество (уверенность) распознавания в процентах.

Также движок распознавания умеет считывать машинно-читаемую зону загранпаспортов, что даёт возможность обрабатывать загранпаспорта всех стран, которые являются членами ИКАО (International Civil Aviation Organization, Международной организации гражданской авиации).

Машинно-читаемый паспорт

Машинно-читаемый паспорт - это машинно-читаемый документ путешественника (MRTD, machine-readable travel document), с данными, кодированными специально для оптического распознавания текста. Впервые, данное усовершенствование предложила международная организация гражданской авиации 1968 году. Машинно-читаемые документы должны были значительно ускорить выписку авиабилетов, прохождение границы, контроль паспортов. В 1980 году вышла первая версия документа Doc 9303 MRTD, описывающего формат MRZ (МЧЗ – машинно-читаемой зоны). Первый паспорт с кодированной информацией по стандарту Doc 9303 был выдан в 1981 году в Соединённых Штатах и с тех пор формат стал завоёвывать популярность.

Затем появился формат MRV – machine readable visas. В 2004 году предложен ePassport – электронный паспорт, основанный на сертификатах электронной подписи, полностью кодированный в электронном виде паспорт, то, что мы сейчас называем «биометрический паспорт». Однако, считывание биометрических данных не относится к распознаванию текста и требует специализированного оборудования, тут уже простым настольным сканером не обойтись. В России правила формирования машинно-читаемой зоны утверждены приказом ФМС от 15 октября 2012 года №320 и определены в приложении №15. Данные правила сходны с требованиями Doc 9303, однако, отличаются в некоторых деталях.

[свернуть]

Продукт хорошо документирован, описаны все функции, параметры вызовов, настроек и т.д.

Удобство встраивания ABBYY SDK можно условно оценить на 5.

При этом, существует ограниченная возможность управления процессом распознавания, управлять качеством изображения, очисткой и т.д.

Качество распознавания ABBYY PR SDK

Для оценки качества распознавания нами было протестировано распознавание 12 образцов паспортов РФ, которые были в наличии. Образцы не подготавливались специально, а были выбраны из тех что имелись ранее, часть из них были отсканированы, часть получены фотокамерой мобильного телефона. Расположение горизонтальное, без искажений.

  • 9 изображений были распознаны корректно;
  • Одно изображение не распознано с ошибкой;
  • Из трёх паспортов не была извлечена ключевая информация – фамилия, имя, отчество.

Данные извлекаются независимо от разрешения переданного изображения, однако при определённом пороге (порядка 150dpi) качество распознавания резко падает вплоть до 100% ошибок.

Распознавание образцов, полученных непосредственно со сканера, при настройке яркости и контрастности изображения позволяет обеспечить практически 100% извлечение данных.

Механизм распознавания ABBYY PR SDK чувствителен к повороту изображения в полях АДРЕС, КЕМ ВЫДАН. При повороте или наклоне изображения появляются ошибки извлечения данных.

Время обработки изображения – порядка 4000 – 5000мс. При оценке времени мы учитывали необходимость движку «разогнаться», считать лицензию и т.д., так как первый запуск мог быть значительно дольше, до десятков секунд.

Smart Engines Smart IDReader

Продукт Smart IDReader представляет собой набор разработчика Software Development Kit непосредственно встраиваемый в конечное решение. Возможен только вариант встраивания в код прикладного программного обеспечения, функционирование как отдельный веб-сервис из коробки невозможно. Однако, есть решение для мобильных продуктов — в AppStore и GooglePlay выложены демо:

Есть решения для распознавания из видеопотока, и на различных операционных системах, таких как iOS, MacOS, Windows, Linux, МЦСТ Эльбрус (Oh my God!!!).

Размер развёрнутого решения извлечения данных составляет 40 Мб.


Тестируемое программное обеспечение Smart IDReader, путём передачи соответствующих флагов в функцию распознавания позволяло обрабатывать:

  • Паспорт
  • СНИЛС
  • Водительские удостоверения
  • Свидетельство о регистрации транспортных средств (СТС)
  • Любые документы с машиночитаемой зоной (MRZ)
  • Банковские карты — кредитные и дебетовые

С сайта можно разработчика можно узнать, что Smart IDReader понимает водительские права, удостоверение о регистрации транспортного средства, СНИЛС, пластиковые карточки и другие документы. Правда, как включить это нигде не документировано. Анализ содержимого дистрибутива наводит на мысль, что шаблоны распознавания кодируются в виде описаний и правил на JSON, но, опять же, это нигде не документировано и инструментов настройки вендор не предоставляет. Правда разработчик готов сделать для вас любой шаблон по заказу под конкретный проект.

Решение для разработчика не документировано, передаётся как библиотека DLL и h-файл, для связывания с кодом С++.

С одной стороны, для людей неподготовленных, встраивание системы распознавания от Smart Engines может представлять некоторые трудности, с другой – разработчик гораздо более гибок в технической поддержке и готовности подстраивать продукт под ваши нужды.

Как недостаток, можно отметить отсутствие поддержки языков ближнего зарубежья – если вам потребуется такое решение, то выстроить его на Smart IDReader вряд ли быстро получится.

Удобство встраивания решения можно условно оценить на 3.

SmartID «из коробки» не обладает возможностью управления процессом распознавания, управлять качеством изображения, очисткой и т.д.

Качество распознавания Smart IDReader

Для оценки качества распознавания нами было протестировано распознавание тех же образцов паспортов РФ, которые были в наличии. Все изображения были распознаны, информация извлечена, процент ошибок незначительный.

Нами были протестированы ряд старых и новых образцов паспортов РФ. Распознавание образцов, полученных непосредственно со сканера, аналогично решению распознавания от Аби, при настройке яркости и контрастности изображения позволяет обеспечить практически 100% извлечение данных.

При определённом пороге (порядка 150dpi) качество распознавания резко падает вплоть до 100% ошибок.

Время обработки изображения – порядка 500-700мс., что существенно быстрее распознавания Abbyy PassportReader. Такое низкое время распознавания можно было бы объяснить прямым встраиванием библиотек в код тестового приложения. Не происходит маршалинг данных через SOAP, сериализация-десериализация и т.д. Однако, ради чистоты эксперимента мы протестировали встраивание Abbyy PassportReader в толстый клиент – время распознавания осталось примерно тем же, порядка 4-5 секунд. Это странно, но, видимо, такова специфика работы движка.

Выводы

Анализ двух механизмов распознавания приведён к баллам и обозначен в таблице:

№ п/п Критерий ABBYY PR Smart IDReader
1. Удобство встраивания 5 3
2. Документация 5 2
3. Качество распознавания случайных изображений 3 4
4. Качество распознавания изображений со сканера при соответствующей настройке 4 4
5. Время обработки изображения 3 5
6. Набор шаблонов и мультиязычность 5 3
7. Размер установленного решения 3 4
Итого 28 25

Оба механизма обладают примерно равными возможностями в части распознавания и извлечения данных. При этом можно отметить следующие отличительные особенности, важные конечному потребителю:

  • Abbyy PR распознаёт больше языков и форм документов;
  • Abbyy PR проще развёртывается и встраивается, более закончен как продукт, техническая поддержка на высоте. Компания Аби обладает непоколебимым авторитетом в области распознавания текстов.
  • Smart IDReader работает значительно быстрее, это может быть критичным на больших объёмах документов;
  • Декларировано, что Smart IDReader умеет распознавать видеопоток. Это может быть использовано в определённых сценариях;
  • Smart IDReader умеет работать на мобильных устройствах и различных, даже экзотических (МЦСТ «Эльбрус»!!!) операционных системах.

Конечно, в итоге надо принимать решение на основе вашей задачи и требований к создаваемому программному обеспечению, выделенного бюджета, модели лицензирования, существующей инфраструктуры.