عنوان مقاله :
بهبود ارزيابي كيفيت و تركيب دادههاي پيوندي با رويكرد مديريت تعارضات دادهاي
عنوان به زبان ديگر :
Improving Linked Data Quality Assessment and Fusion by a Conflict Resolution Approach
پديد آورندگان :
خودي زاده نهاري، محمد دانشگاه صنعتي اصفهان - دانشكده مهندسي برق و كامپيوتر، اصفهان، ايران , قديري مدرس، ناصر دانشگاه صنعتي اصفهان - دانشكده مهندسي برق و كامپيوتر، اصفهان، ايران , براآني دستجردي، احمد دانشگاه صنعتي اصفهان - دانشكده مهندسي كامپيوتر، اصفهان، ايران , سك، جورج آر دانشگاه كارلتون - دانشكده علوم كامپيوتر، اتاوا، كانادا
كليدواژه :
وب معنايي , دادههاي پيوندي , كيفيت دادهها , تركيب دادهها , مديريت تعارضات , ناسازگاري دادهاي
چكيده فارسي :
امروزه فنّاوري وب معنايي و دادههاي پيوندي همچنين استنتاجها، تصميمات و برنامهريزيهاي مبتني بر آنها از رشد روزافزوني برخوردار هستند. دادههاي پيوندي، بهصورت متمركز مديريت نميشوند بنابراين اطمينان از كيفيت آنها يكي از موضوعات مهم است. اين دادهها عمدتاً توسط گروههاي مختلف با روشها و ابزارهاي متفاوت توليد ميشوند. درنتيجه تنوع كيفي چنين دادههايي بيشتر از دادههايِ تحت كنترلِ سازماني است. در اين مقاله، ابتدا ابعاد مختلف كيفيت دادهها بخصوص دادههاي پيوندي موردبررسي قرار ميگيرد. سپس يك چارچوب كاري براي تركيب دادهها با لحاظ كردن كيفيت آنها معرفي ميشود. بهطور طبيعي ارزش هر مجموعه اطلاعاتي وقتي با ساير اطلاعاتِ مرتبط تركيب ميشود بيشتر خواهد شد ولي بايد نقش دادههاي كمكيفيت را نيز در نظر گرفت. در ادامه روشهايي جديد در خصوص ارزيابي كيفيت دادهها معرفي ميشود كه ناسازگاريهاي ظاهري دادهها را مديريت و نمره كيفي صحيحتري را استفاده ميكند. براي محك زدن اين روشها، مجموعه دادههاي مكاني مرتبط شناسايي و يك معيار ارزيابي جديد با عنوان GLQM معرفيشده است كه بر اساس سطح ريزدانگي دادهها، اقدام به ارزيابي كيفيت دادهها مينمايد. درنهايت با استفاده از دادههاي پيوندي بهدستآمده از چند منبعِ معروف شناساييشده و اعمالِ پيشپردازشهاي لازم روي آنها، آزمايشهايي در خصوص ارزيابي و تركيب دادههاي پيوندي انجامشده است.
چكيده لاتين :
The semantic web technology and decision making based on the linked data is progressing every day. The linked data are managed as decentralized sources, and their quality is a serious concern. The assessment of the quality of linked data is a key to adopting them in different fields because each data set has been developed by a different group, using various methods and tools. The qualitative and quantitative diversity of such data is higher than those generated by official organizations and firms. In this paper, we first overview and evaluate the dimensions and measures for the quality assessment of data especially linked data. Then, we present a novel framework as a solution for improving linked data quality assessment and data fusion. The good quality data make good result in data fusion. Finally, we introduce six rules for handling data conflicts and a new metric for assessment of granularity level of data (GLQM) and adopt several tools to assess the quality of data using the proposed framework.
عنوان نشريه :
مهندسي برق دانشگاه تبريز