Data Extraction Platform

Процесс сбора данных вручную занимает много времени, стоит дорого, а также в нем не хватает прозрачности. Наше автоматизированное решение - Data Extraction Platform.

Data Extraction Platform – это универсальное промышленное программное решение, которое приходит на смену процессам ручного сбора данных, а также существующим системам, которые сейчас используются для сбора данных из различных финансовых документов и ценных бумаг.

Основываясь на результатах различных исследований и разработок, Data Extraction Platform автоматически находит необходимые цифры или текст в не полностью структурированном электронном документе в режиме реального времени. При этом, сохраняется связь с оригинальным документом для обеспечения полной прозрачности процесса сбора данных. С помощью Data Extraction Platform, детализированная информация может быть выбрана из различных документов, например:

• Ценные бумаги
• Налоговая и бухгалтерская отчетность
• Другие отчеты предприятий и организаций

 

Data Extraction Platform может выполнять обработку документов, представленных в различных форматах, например:

  • • Текстовые файлы ASCII
  • • E-mail сообщение
  • • XML-документы
  • • HTML-документы
  • • PDF-документы

 

Некоторые данные проверяются на качество и корректность, после чего вносятся в существующую схему базы данных. Следующим шагом, данные предоставляются пользователю в формате XML (или в любом другом формате, определенном техническими спецификациями).

С помощью ссылок на оригинальные документы Data Extraction Platform позволяет выполнить простой переход от каждой цифры или текстового значения до его точного местонахождения в исходном изображении - удовлетворяя таким образом требование прозрачности процесса сбора данных.

Data Extraction Platform состоит из нескольких функциональных блоков, обеспечивающих эффективную и слаженную работу данного инструмента, таких как Extraction Template Builder, Document Repository, Text Model Builder, System Administration и других важных компонентов.

Document Repository 

Модуль Document Repository предоставляет пользователю возможность внесения документов в систему и их подготовки к дальнейшему процессу сбора данных.

Text Model Builder

Приложение Text Model Builder предназначен для построения математических моделей сбора данных. При обработке документа модель выполняет отбор нужного значения для определенного бизнес-показателя. Это приложение позволяет пользователю редактировать дерево решений, а также оптимизировать отдельные части дерева.


 

Извлечение данных из текста


Построение моделей для извлечения данных

Партнеры