مرکز منطقه ای اطلاع رساني علوم و فناوري - CMAR: accurate and efficient classification based on multiple class-association rules

DocumentCode :

2334981

Title :

CMAR: accurate and efficient classification based on multiple class-association rules

Author :

Li, Wenmin ; Han, Jiawei ; Pei, Jian

Author_Institution :

Sch. of Comput. Sci., Simon Fraser Univ., Burnaby, BC, Canada

fYear :

2001

fDate :

2001

Firstpage :

369

Lastpage :

376

Abstract :

Previous studies propose that associative classification has high classification accuracy and strong flexibility at handling unstructured data. However, it still suffers from the huge set of mined rules and sometimes biased classification or overfitting since the classification is based on only a single high-confidence rule. The authors propose a new associative classification method, CMAR, i.e., Classification based on Multiple Association Rules. The method extends an efficient frequent pattern mining method, FP-growth, constructs a class distribution-associated FP-tree, and mines large databases efficiently. Moreover, it applies a CR-tree structure to store and retrieve mined association rules efficiently, and prunes rules effectively based on confidence, correlation and database coverage. The classification is performed based on a weighted χ² analysis using multiple strong association rules. Our extensive experiments on 26 databases from the UCI machine learning database repository show that CMAR is consistent, highly effective at classification of various kinds of databases and has better average classification accuracy in comparison with CBA and C4.5. Moreover, our performance study shows that the method is highly efficient and scalable in comparison with other reported associative classification methods

Keywords :

associative processing; data mining; learning (artificial intelligence); pattern classification; tree data structures; very large databases; CMAR; CR-tree structure; Classification based on Multiple Association Rules; FP-growth; UCI machine learning database repository; associative classification method; biased classification; class distribution-associated FP-tree; classification accuracy; database coverage; efficient classification; frequent pattern mining method; large database mining; mined association rules; mined rules; multiple class-association rules; multiple strong association rules; overfitting; single high-confidence rule; unstructured data; weighted χ² analysis; Association rules; Classification tree analysis; Councils; Data mining; Databases; Electronic mail; Information retrieval; Machine learning; Predictive models; Training data;

fLanguage :

English

Publisher :

ieee

Conference_Titel :

Data Mining, 2001. ICDM 2001, Proceedings IEEE International Conference on

Conference_Location :

San Jose, CA

Print_ISBN :

0-7695-1119-8

Type :

conf

DOI :

10.1109/ICDM.2001.989541

Filename :

989541

Link To Document :

https://search.ricest.ac.ir/dl/search/defaultta.aspx?DTC=49&DC=2334981