Semantic Analyzer

Веб додаток Semantic Analyzer призначений для автоматичного семантичного аналізу текста з метою виявлення змістовних одиниць даного тексту. Додаток дозволяє структурувати текстові дані з можливістю подальшого їх використання. 

Веб додаток складається з трьох частин: панель вводу тексту, панель експертів та панель результатів аналізу.

Панель вводу тексту це текстове поле, призначене для вводу, редагування тестової інформації та подальшого аналізу. Натиснувши кнопку Add bookmark на вкладці (мал. 3) весь текст в модулі буде збережено в базу даних. Переглянути та додати збережений текст можна за допомогою кнопки Bookmarks (мал. 4). 

Малюнок 3 Вкладки: Bookmarks – Додати введений текст до вкладки Add bookmark - Переглянути вкладки


Малюнок 4 Вкладки Semantic Analyzer

 

Експерти

 Панель експертів – це таблиця з іменем експерта в одній з колонок та його визначенням в іншій (мал. 5). Експерт має накопичену базу знань за певною тематикою, що дає можливість легко аналізувати текст, використовуючи одного експерта чи групу. 


Малюнок 5 Панель експертів

 За допомогою «загального» меню над таблицею можна створити та відрегувати експерта, що бере участь в аналізі. Загальне меню використовується для створення, видалення та редагування будь-яких записів, які необхідні для роботи веб додатку. 

Щоб зробити аналіз тексту, необхідно вибрати експерта з певною базою знань. В іншому випадку, в нижньому правому кутку екрану з’явиться повідомлення: 

 

Малюнок 6 Інформаційне повідомлення 

Для вибору всіх експертів використайте кнопки «Select All» и «Deselect All». Щоб виділити вибіркові експерти, натисніть кнопку «Ctrl» та лівою кнопкою миші виберіть потрібних експертів. 

 

Результат аналізу

Панель результату аналізу (мал. 7) складається з семантичного дерева, яке відображає структуру семантичних зв’язків у тексті. Назва дерева визначає значення окремої частини тексту. Вузол, який не входить до жодного дерева, є таким, що непроаналізовано. 

 

Малюнок 7 Панель результата аналізу

 

Початок роботи  

Для проведення аналізу даного тексту, необхідно провести підготовку експертів. На прикладі створення експерта по датам, розглянемо проведення підготовки додатку для аналізу. 

Натиснувши кнопку меню «Створити запис», з’являється діалогове вікно з текстовими полями Name та Description. Створюємо експерта, що спеціалізується по датам, заповнюючи текстові поля, як на мал. 8. Зберігаємо запис. 

 

Малюнок 8 Створення експерта

  

Навчання  

Тепер необхідно навчити експерта знанням, які допоможуть йому вирізняти дату та час в тексті. Для цього скористаємося інструментами панелі вводу тексту (мал. 2). Скопіюємо текст, який ми будемо аналізувати, в поле вводу (мал. 9). Виділимо в таблиці експертів тільки що створеного експерта по датам. Щоб навчити експерта що таке місяць, необхідно виділити слово December в тексті та натиснути на нього лівою кнопкою миші. Заповняємо текстове поле Value в меню, що з’явилось, як на мал. 9, та натискаємо клавішу Enter. Таким чином ми співвставили слову December значення month. Отже, наш аналізатор знає, що в даному тексті December означає місяць. 

 

Малюнок 9 Навчання експерта

 

Аналіз тексту  

Після того як експерт чи група експертів навчена можна сміливо починати аналіз. Вводимо необхідний для семантичного аналізу текст, вибираємо експертів та настискаємо кнопку Analyze. Після завершення аналізу на панелі інструментів буде збудовано дерево семантики тексту. 

Отож, використовуючи експерта по датам, проведемо аналіз речення:  " As of December 31, 2005, we employed approximately 1,300 full-time people, of whom over 400 were outside the United States" ( * ), але вже з новою базою знань. Як можна побачити з малюнка 12, аналізатор розпізнав 31 грудня як дерево під назвою date, з розгалуженням на місяць, день та рік. 

 

Малюнок 12 Результат семантичного аналізу в Semantic Analyzer. 

Для того щоб переглянути та відредагувати базу знань експерта, можна скористатись пунктом редагування загального меню (мал 13). На екрані знову з’явиться діалогове вікно, але з важливим доповненням – таблицею бази знань. 

За допомогою загального меню можна редагувати, додавати, та видаляти чи дублювати знання, як і експертів (мал. 5). 

 

Малюнок.13 Редагування експерта

 

Загальні знання  

База знань експерта може включати в себе знання інших експертів. Наприклад, ми навчили експерта по валютам (мал. 14). 

 

Малюнок 14 База знань 

База знань експерта по валютам включає в себе такі поняття: назва валюти, долар, як грошова одиниця та зображення долара. Вершина ієрархічної структури знань – сутність currency, потім – назва валюти (currency_name) та її кількість, далі – dollar. Окрім долара, currency_name може включати в себе евро та швейцарський франк, фунт стерлінг и так далі. Але в даному випадку Currency Expert знає, що є така валюта як долар. Крім того, ми маємо ще одного експерта Financial Data Expert. 

 

Малюнок 15 База знань експерта 

Створимо ще одного експерта під назвою Financial Expert. Навчимо його розпізнавати розповсюджену в фінансових документах фразу: total revenues of $2.02 billion.  

Надрукуємо цю фразу в текстовому полі та виберемо Financial Expert в таблиці і натиснемо лівою кнопкою на виділене слово. В текстовому полі Value вкажемо total_revenues. В базі знань Financial Expert зявилась сутність total_revenues. 

 

Малюнок 16 Редагування знань 

З мал.16 зрозуміло, що текст «$2.02 billion» розпізнається експертом як валюта (мал. 14). Після аналізу схожого тексту трьома експертами ми отримали наступну структуру даних. 

 

Малюнок 17 Результат семантичного аналізу

 

Партнери