مرکز منطقه ای اطلاع رساني علوم و فناوري - First-order Frequent Patterns in Text Mining

DocumentCode :

2253876

Title :

First-order Frequent Patterns in Text Mining

Author :

Blaták, Jan

Author_Institution :

Fac. of Informatics, Masaryk Univ. in Brno

fYear :

2005

fDate :

5-8 Dec. 2005

Firstpage :

344

Lastpage :

350

Abstract :

In this paper a universal framework for mining long first-order frequent patterns in text data is presented. It consists of RAP, an ILP system for mining maximal first-order frequent patterns, and two types of predefined background knowledge. Two methods of using generated patterns for solving text mining tasks are described: propositionalization and CBA (class based association). A new variant of the CBA rule based classifier is proposed. The framework is used for solving three text mining tasks: information extraction from biomedical texts, context-sensitive text correction of English and morphological disambiguation of Czech. The distributed mining of frequent patterns is described and its influence on mining in text is discussed. It is shown that frequent patterns as new features for propositionalization usually provide better results than CBA

Keywords :

data mining; natural language processing; text analysis; Czech language; English language; ILP system; RAP; biomedical texts; class based association; context-sensitive text correction; information extraction; maximal first-order frequent pattern mining; morphological disambiguation; text mining; Data mining; Distributed computing; Genetic algorithms; Informatics; Intelligent networks; Logic programming; Neural networks; Neurons; Text mining; Transaction databases; Artificial Intelligence; Genetic Algorithms; JASTAP; Neural Networks; Spiking Neuron Models;

fLanguage :

English

Publisher :

ieee

Conference_Titel :

Artificial intelligence, 2005. epia 2005. portuguese conference on

Conference_Location :

Covilha

Print_ISBN :

0-7803-9366-X

Electronic_ISBN :

0-7803-9366-X

Type :

conf

DOI :

10.1109/EPIA.2005.341307

Filename :

4145985

Link To Document :

https://search.ricest.ac.ir/dl/search/defaultta.aspx?DTC=49&DC=2253876