Dokumentumelemzés, automatikus dokumentumosztályozás statisztikai alapon


Az információk döntő többsége még ma is strukturálatlan, szöveges dokumentumokban található, amelyek száma már közepes méretű intézményeknél, vállalatoknál is több ezres, sőt akár milliós nagyságrendű lehet.

Hogyan tudjuk ezt az óriási mennyiségű dokumentumot áttekinthetően rendezni, osztályozni, tárgyszavakkal ellátni?

  • És ha hatalmas munkával elvégeztük ezt a feladatot, mit tehetünk, amikor új, korábban nem ismert rendszerezési szempont merül fel?
  • Melyek azok a kulcsszavak, fogalmak és kifejezések, amelyek legjobban jellemeznek egy adott dokumentumot vagy dokumentum-halmazt?
  • Ha új dokumentum – például ügyleírás – érkezik, és szeretnénk megtudni: vannak-e már hasonló tartalmú anyagaink, hogyan találjuk meg őket?

E kérdések megválaszolása nyilván jelentős üzleti előnnyel jár, a feladat emberi erővel való megoldása azonban általában megfizethetetlen.

A megoldás

Az Information Access System statisztikai alapon képes nagy mennyiségű dokumentum feldolgozására, kiértékelésére. Az eredmény az egyes dokumentumokra legjellemzőbb kifejezések, szavak beazonosítása. Ezeket változatlanul, vagy emberi szűrés után jól használhatjuk a dokumentumok jellemzésére. A meglévő anyagok osztályozásának ismeretében a rendszer megtanítható automatikus osztályozásra, arra, hogy az újonnan érkezett dokumentumokat mely osztály(ok)ba sorolja.

Jelentős előrelépést hozhat a SmartFinder rendszer bevezetése vállalati portálokon vagy marketing célokra, minden olyan területen, ahol fontos az automatikus osztályozás, a felhasználói profilok kialakítása, az eset alapú működés. Architektúrájából adódóan a rendszer építőkockaként is használható komplex megoldások kialakításában.

Hogyan működik?

A dokumentumok szókincsének statisztikai jellemzőit használva a szoftver jó hatásfokkal, nagy megbízhatósággal megtalálja a hasonló szövegeket, s elvégzi az osztályozást. Minél több a dokumentum, annál pontosabban dolgozik a rendszer. A rendszer számos nyelvhez tartalmaz szótövesítő nyelvi modult – köztük a magyarhoz is.

Asszociatív keresés

A hagyományos szöveges keresés mellett a rendszer támogatja az asszociatív keresést, amely nem ragaszkodik mereven a kérdésben megfogalmazott kritériumokhoz. Ezáltal hasonló dokumentumokat is megtalálunk. Ily módon az Infomation Access Suite értékké, kiaknázhatóvá teszi a meglévő, de korábban kihasználatlanul heverő, kezelhetetlen dokumentumhalmazt.

Felhasználási, alkalmazási területek

  • nagy mennyiségű dokumentum kiértékelése, elemzése
  • jellemző kifejezések és fogalmak meghatározása egyes dokumentumokból, vagy dokumentumok halmazából
  • hasonló dokumentumok megtalálása
  • kifejezések és fogalmak szerinti keresés
  • felhasználói profilok kialakítása, kezelése
  • esetek alapján történő automatikus osztályozás
  • tudásmenedzsment megoldások
  • call center megoldások: az aktuális kérdésre vonatkozó információk elérése a vállalati tudástárból
  • hírportálok

Többet szeretne tudni? Írjon nekünk, vagy hívjon minket.

Informatikai értékesítő állás!

Csatlakozz hozzánk, ahol nagyvállalati kötöttségek-től mentesen a munkádra tudsz koncentrálni és élvonalbeli szoftvermeg-oldások létrehozásában vehetsz részt. >>tovább