A 2000-es években indult Big Data forradalom óta folyamatosan sokszorozódik a digitális tartalom. A jelenség kutatók tízezreit sarkallja szerte a világon a nagy mennyiségű adatból kinyerhető új és hasznos információk megszerzésére. A tömérdek digitalizált dokumentum szövegében rejlő rejtett összefüggések feltárására matematikai, statisztikai, valószínűségszámítási és számítástudományi algoritmusok léteznek, vagy lehet akár egyedi algoritmust is fejleszteni. Adatbányászati módszerekkel viszonylag egyszerű az olyan dokumentumok szövegkorpuszának elemzése, amely azonos vázzal, közel szabványos módon, formanyomtatvány jelleggel rendelkezik. Ilyen iratok például az oktatásban is használt jegyzőkönyvek vagy a bíróságok által hozott határozatok. Az ezekhez hasonló, félig strukturált szövegek automatikus feldolgozására kezdtünk el egy adatbányászati alapokon nyugvó saját algoritmust fejleszteni, amelyet később önálló döntéshozásra szeretnénk „rábírni”. Módszerünket a bírósági határozatokra, mint szövegkorpuszokra munkáltuk ki, azok közül is azokon szeretnénk a tesztelést elvégezni, amelyek könyvszakértőt említenek.