ШІ системи розпізнавання документів (для України)

Оновлено: 17.10.2022

2022. Microsoft представила платформу ШІ-процесингу даних із документів



Два роки тому Microsoft представила сервіс SharePoint Syntex, який використовує штучний інтелект для автоматизації вилучення та класифікації даних із документів на основі існуючих сервісів SharePoint. Тепер цей сервіс перетворився на самостійну платформу Microsoft Syntex, яка містить набір інструментів для автоматизованого розпізнавання документів, включаючи анотування файлів та вилучення даних. Syntex зчитує, помічає та індексує вміст документів (чи цифрові чи фізичні) і робить ці дані доступними для пошуку та використання у програмах Microsoft 365, а також допомагає керувати життєвим циклом даних за допомогою інструментів безпеки та архівування.


2020. На Google Cloud з'явився ШІ-сервіс для отримання даних з документів і форм


Google запустив на своїй хмарній платформі новий когнітивний API-сервіс Document AI, який дозволяє автоматично витягувати інформацію, що міститься у цифрових та друкованих документах, за допомогою машинного навчання. Передбачається використання двох процесорів загального призначення, перший – для звичайних документів, другий – для анкет/форм. Є також спеціалізовані процесори для фінансової документації, наприклад, можна обробляти заявки на видачу позичок чи рахунки-фактури. Головними конкурентами Google у цьому сегменті є компанія Amazon, яка пропонує подібний сервіс Textract на AWS, а також Microsoft зі своїм інструментом Form Recogniser.


2019. Amazon випустила ІІ-альтернативу Abbyy FineReader


Рівно 10 років тому компанія ABBYY запустила онлайн-сервіс розпізнавання тексту FineReader Online. Тепер подібний сервіс є і у Amazon Amazon Textract. Проте прогрес не стоїть на місці, і амазонівський сервіс уже вміє не лише розпізнавати текст, але й розуміти структуру документа (за допомогою ІІ). Наприклад, він враховує та коректно обробляє колонтитули, колонки, таблиці, заповнені форми і навіть визначає деякі формати даних (ім'я, номер паспорта, номер соціального страхування). Звісно, компанію ABBYY цим не здивувати. Вони самі собаку з'їли на технології штучного інтелекту. Їх двигун вже вміє навіть отримувати сенс із документів.