شماره ركورد
1372174
عنوان مقاله
دادهكاوي و استقرار دادگان اصطلاحنامه چندزبانۀ فرهنگي ايران (اصفا) در چهارچوب كريسپ
پديد آورندگان
اكبري داريان ، سعيده سازمان اسناد و كتابخانه ملي ايران
از صفحه
58
تا صفحه
82
كليدواژه
دادهكاوي , اسكاس , مارك ايران , گراف آر.دي.اف. مهندسي مجدد , اسكاسموس , اصطلاحنامه اصفا
چكيده فارسي
هدف: نظام سادۀ سازماندهي دانش (اسكاس) يك مدل دادهاي رايج براي بهاشتراكگذاري و پيونددهي نظامهاي سازماندهي دانش از طريق وب است. اسكاس، مسير مهاجرت استاندارد و كمهزينه را براي انتقال نظامهاي سازمان دانش موجود به وب معنايي ارائه ميدهد. پيوستن اصفا به جريان وب معنايي نيازمند تبديل و استقرار دادگان اصفا براساس اسكاس در قالب گراف آر.دي.اف. است. به اين منظور بايد ركوردهاي مبتني بر مارك ايران مهندسي مجدد شوند. هدف پژوهش حاضر، مهندسي مجدد دادگان اصفا با دادهكاوي آنها در چهارچوب كريسپ و استقرار آنها بر روي پلتفرم اسكاسموس است.روش: اين پژوهش از نوع توسعهاي – كاربردي است و از روششناسي كريسپ-دي.ام.، از نوع بدون نظارت و خوشهبندي سلسلهمراتبي براي دادهكاوي استفاده شده است. در مرحلۀ اول درك كسب و كار، هدف اصلي تبديل دادگان اصفا به مدل دادهاي اسكاس در قالب گراف آر.دي. اف. تعيين شد. در مرحلۀ درك داده، دادههاي ميراثي اصفا شامل 11006 ركورد ذخيره شده در قالب مارك ايران و شامل 18 حوزه، آموزش و پرورش، ادبيات، ارتباطات، اقتصاد، تاريخ، تصوف و عرفان، جامعهشناسي، جغرافيا، حقوق، روانشناسي، زبانشناسي، دين، علوم سياسي، فلسفه، فناوري و علوم تجربي، كتابداري و اطلاع رساني، مديريت و فرهنگ و هنر است. در مرحلۀ سوم آمادهسازي داده، دادههاي مفقود و پرت شناسايي و ويرايش شد. براي انتخاب ويژگيها در لايۀ پيشپردازش مهندسي داده، عناصر ضروري براي تبديل به اسكاس شناسايي و جدول انطباق آنها با فيلدهاي مارك ايران تدوين گرديد. در مرحلۀ مدلسازي، مقادير ويژگي هدف با تكنيك خوشهبندي سلسلهمراتبي و با استفاده از ماكروكد در اكسل توليد شد. ارزيابي مدل با تكنيك بررسي بصري و روش نمونهگيري تصادفي مورد تاييد قرار گرفت. در مرحلۀ ششم تبديل دادههاي مارك ايران به اسكاس در قالب گراف آر.دي.اف. با استفاده از ابزار اسكاسپلي انجام و دادهها به بستر پلتفرم ووكبنچ انتقال يافت. با استفاده از قالب تورتل، دادگان اصفا در پلتفرم اسكاسموس مستقر شد.يافتهها: يافته اصلي پژوهش، استقرار و توسعۀ دادگان اسكاس اصفا در پلتفرم منبع باز اسكاسموس به نشاني skosmos.nlai.ir است. مجموع ركوردها پس از ايجاد ركوردهاي مربوط به حوزه و مجموعه براي خوشهبندي به 11880 ركورد افزايش يافت. در مرحلۀ آمادهسازي داده يكي از يافتههاي مهم، تدوين جدول انطباق بين عناصر هستۀ اسكاس و فيلدهاي مارك ايران بود.نتيجهگيري: در اين پژوهش با بهرهگيري از علم داده، روش نوآورانهاي براي دادهكاوي دادگان اصطلاحنامهاي بهكار رفت. روششناسيهاي بهكار رفته در ادبيات اين پژوهش تنها در دو مرحلۀ آمادهسازي و استقرار و توسعه از شش مرحلۀ بهكار رفته در اين پژوهش جا گرفتند.
عنوان نشريه
مطالعات كتابداري و سازماندهي اطلاعات
عنوان نشريه
مطالعات كتابداري و سازماندهي اطلاعات
لينک به اين مدرک