Сценарии ABBYY Compreno для CЭД/ECM-решений

18
Практические сценарии Compreno для расширения функционала СЭД/ECM-решений Сергей Полтев

Transcript of Сценарии ABBYY Compreno для CЭД/ECM-решений

Практические сценарии Compreno для расширения функционала СЭД/ECM-решений

Сергей Полтев

Зачем нужно расширять функционал?

Какие три самые распространенные проблемы в использовании CЭД? Исследование проекта DOCFLOW, 2014

Поиск информации

В среднем 50% рабочего времени

Поиск необходимой информации

ABBYY COMPRENO

4

уникальная технология понимания и анализа текстов на естественном языке

применения технологий ABBYY Compreno

5

Извлечение данных из неструктурированных документов

Интеллектуальный поиск в информационной системе

Классификация потока документов

• Оптимизация ввода документов в СЭД и другие системы

• Поддержка принятия решений за счет сбора и анализа значимых фактов и событий

• Снижение проектных рисков путём анализа документации

• Поиск по смыслу, а не по ключевым словам - для полного сбора данных

• Быстрый доступ к документу за счет поиска по его атрибутам

• Оптимизация процесса обработки входящей документации

• Поиск по категориям

Новые возможности для СЭД/ECM?

• Извлечение данных

• Рубрикация, установка связи между объектами

• Сценарии автоматической обработки вновь поступающих материалов в зависимости от содержания

• Поисковые запросы на естественном языке

Практические сценарии

1.«Находимость» данных и документов Автоматическое заполнение атрибутов документа Автоматическая рубрикация поступающих документов Поиск по словоформам и синонимам

2.Определение и группировка дубликатов документов

Автоматическое заполнение атрибутов документа

Данные из структурированных

полейНазвание документа: Договор купли-продажи транспортного средства (номерного агрегата)

Характеристики ТС:Идент. № (VIN): WWWATTGAJATT05515

Марка, модель: Volkswagen Golf Тип ТС: легковая комби Модель, № двигателя: АТТ05515Цвет: синий № кузова: ТТ05515№ шасси (рамы): б/нПаспорт ТС: серия АТ №573322Выдан: Смоленской таможней 01.04.2000Год выпуска: 2000

Данные из неструктурированных полей

Дата договора: 25.06.2007

Место: г. Смоленск

Информация о продавце:

ФИО: Андреев Виталий Витальевич

Паспорт: серия 66 02 номер 670101

Выдан: Промышленным РОВД г. Смол…

Дата выдачи: 12.03.2003

Адрес проживания: . Смоленск, ул. Кирова, д. 226, кв. 341

Тел. (4812) 92-51-51

Информация о покупателе:

ФИО: Новиков Игорь Александрович

Паспорт : серия 67 04 номер 451203

Выдан: Заднепровским РОВД г. Смол…

Дата выдачи: 16.09.2004

Адрес проживания: . г. Смоленск,ул. Попова, д. 102, кв. 21

Тел. (4812)95-14-84

Извлечение значимой информации из документов

9

0

Метаданные: Автор: Иванов И.И. Название файла: Догоров_КП_авто.docx Дата создания: 1.07.2014 …

Обработка документов – рубрицирование

Обработка текстов

?

Поиск аналогичных материалов

Обработка документов – связывание дубликатов

??

?

?

Определение и связывание одинаковых документов

Отличающиеся сообщения от одного адресата

регистрируются отдельно

!

?

Есть ли сложности?

• Предварительная настройка с представителями ABBYY• Скорость индексации

Сравнение документов

Сравнение документов

В печатной версии текст изменен

Cравнение версий документа

Сравнение документовРешение

17

Спасибо за внимание!

https://www.facebook.com/EOSblog www.eos.ru