عنوان مقاله :
بهبود الگوريتم انتخاب ديد در پايگاه داده تحليلي با استفاده از يافتن پرس و جوهاي پرتكرار
عنوان به زبان ديگر :
An Improved View Selection Algorithm in Data Warehouses by Finding Frequent Queries
پديد آورندگان :
صباغ گل، ريحانه دانشگاه تربيت دبير شهيد رجايي، تهران - دانشكده مهندسي كامپيوتر , دانشپور، نگين دانشگاه تربيت دبير شهيد رجايي، تهران - دانشكده مهندسي كامپيوتر
كليدواژه :
پايگاه داده تحليلي , پرس و جوهاي پرتكرار , خوشه بندي , ذخيرهسازي ديد
چكيده فارسي :
پايگاه داده تحليلي منبعي براي ذخيرهسازي دادههاي تاريخي جهت تحليل است. بهطورمعمول زمان پاسخ به پرسوجوهاي تحليلي، زماني طولاني است. استفاده از ديد به جاي دسترسي مستقيم به پايگاه داده، سرعت پاسخگويي را بهبود ميدهد. راهكارهاي مختلفي براي ذخيرهسازي ديد وجود دارد؛ كه مناسبترين راهكار براي ذخيرهسازي ديد، ذخيرهسازي ديدهاي پراستفاده و پركاربرد است. پرسوجوهايي كه درقبل مورد استفاده پايگاه داده تحليلي بودهاند، حاوي اطلاعات مهمي هستند كه بهاحتمال زياد در آينده نيز مورد استفاده خواهند بود. اين مقاله، الگوريتمي براي ذخيرهسازي ديدهاي پركاربرد ارائه ميدهد. اين الگوريتم با استفاده از پرسوجوهاي قبلي، ديدهاي پركاربرد را يافته و آنها را ذخيره ميكند. اين ديدها توانايي پاسخگويي را به بسياري از پرسوجوهايي كه در آينده اتفاق خواهند افتاد، دارند. روش پيشنهادي اين مقاله از الگوريتم Index-BittableFI براي يافتن ديدهاي پرتكرار استفاده كرده است كه باعث بهبود روشهاي قبلي و كاهش زمان پاسخ به پرسوجوها شده است. آزمايشهاي انجامشده نشان ميدهند كه الگوريتم پيشنهادي از لحاظ زماني نسبت به الگوريتمهاي قبلي 23 درصد و از لحاظ فضاي ذخيرهسازي 50 درصد بهبود داشته است
چكيده لاتين :
A data warehouse is a source for storing historical data to support decision making. Usually analytic queries take much time. To solve response time problem it should be materialized some views to answer all queries in minimum response time. There are many solutions for view selection problems. The most appropriate solution for view selection is materializing frequent queries. Previously posed queries on the data warehouse have profitable information. These queries probably will be used in the future. So, previous queries are clustered using clustering algorithms. Then frequent queries are found using data mining algorithms. Therefore optimal queries are found in each cluster. In the last stage optimal queries are merged to produce one (query) view for each cluster, and materializes this view. This paper proposes an algorithm for materializing frequent queries. The algorithm finds profitable views using previously posed queries on the data warehouse. These views can answer the most of the queries being posed in the future. This paper uses Index-BittableFI algorithm for finding frequent views. Using this algorithm improves previous view selection algorithms and reduces the response time. The experiments show that the proposed algorithm has %23 improvement in response time and %50 improvement in storage space.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها