• شماره ركورد
    1372174
  • عنوان مقاله

    داده‌كاوي و استقرار دادگان اصطلاحنامه چندزبانۀ فرهنگي ايران (اصفا) در چهارچوب كريسپ

  • پديد آورندگان

    اكبري داريان ، سعيده سازمان اسناد و كتابخانه ملي ايران

  • از صفحه
    58
  • تا صفحه
    82
  • كليدواژه
    داده‌كاوي , اسكاس , مارك ايران , گراف آر.دي.اف. مهندسي مجدد , اسكاسموس , اصطلاحنامه اصفا
  • چكيده فارسي
    هدف: نظام سادۀ سازماندهي دانش (اسكاس) يك مدل داده‌اي رايج براي ‌‌به‌اشتراك‌گذاري و پيونددهي نظام‌هاي ‌‌‌سازماندهي دانش از طريق وب است. اسكاس، مسير مهاجرت استاندارد و كم‌هزينه را براي انتقال نظام‌هاي سازمان دانش موجود به وب معنايي ارائه مي‌دهد. پيوستن اصفا به جريان وب معنايي نيازمند تبديل و استقرار دادگان اصفا براساس ‌اسكاس در قالب گراف آر.دي.اف. است. به اين منظور بايد ركوردهاي مبتني بر مارك ايران مهندسي مجدد شوند. هدف پژوهش حاضر، مهندسي مجدد دادگان اصفا با داده‌كاوي آنها در چهارچوب كريسپ و استقرار آنها بر روي پلتفرم اسكاسموس است.روش: اين پژوهش از نوع توسعه‌اي – كاربردي است و از روش‌شناسي كريسپ-دي.ام.، از نوع بدون نظارت و خوشه‌بندي سلسله‌مراتبي براي داده‌كاوي استفاده شده است. در مرحلۀ اول درك كسب و كار، هدف اصلي تبديل دادگان اصفا به مدل داده‌اي اسكاس در قالب گراف آر.دي. اف. تعيين شد. در مرحلۀ درك داده، داده‌هاي ميراثي اصفا شامل 11006 ركورد ذخيره‌ شده در قالب مارك ايران و شامل 18 حوزه، آموزش و پرورش، ادبيات، ارتباطات، اقتصاد، تاريخ، تصوف و عرفان، جامعه‌شناسي، جغرافيا، حقوق، روان‌شناسي، زبان‌شناسي، دين، علوم سياسي، فلسفه، فناوري و علوم تجربي، كتابداري و اطلاع‌ رساني، مديريت و فرهنگ و هنر است. در مرحلۀ سوم آماده‌سازي داده، داده‌هاي مفقود و پرت شناسايي و ويرايش شد. براي انتخاب ويژگي‌ها در لايۀ پيش‌پردازش مهندسي داده، عناصر ضروري براي تبديل به اسكاس شناسايي و جدول انطباق آنها با فيلدهاي مارك ايران تدوين گرديد. در مرحلۀ مدل‌سازي، مقادير ويژگي هدف با تكنيك خوشه‌بندي سلسله‌مراتبي و با استفاده از ماكروكد در اكسل توليد شد. ارزيابي مدل با تكنيك بررسي بصري و روش نمونه‌گيري تصادفي مورد تاييد قرار گرفت. در مرحلۀ ششم تبديل داده‌هاي مارك ايران به اسكاس در قالب گراف آر.دي.اف. با استفاده از ابزار اسكاس‌پلي انجام و داده‌ها به بستر پلتفرم ووك‌بنچ انتقال يافت. با استفاده از قالب تورتل، دادگان اصفا در پلتفرم اسكاسموس مستقر شد.يافته‌ها: يافته اصلي پژوهش، استقرار و توسعۀ دادگان اسكاس اصفا در پلتفرم منبع باز اسكاسموس به نشاني skosmos.nlai.ir است. مجموع ركوردها پس از ايجاد ركوردهاي مربوط به حوزه و مجموعه براي خوشه‌بندي به 11880 ركورد افزايش يافت. در مرحلۀ آماده‌‌‌سازي داده يكي از يافته‌هاي مهم، تدوين جدول انطباق بين عناصر هستۀ اسكاس و فيلدهاي مارك ايران بود.نتيجه‌گيري: در اين پژوهش با بهره‌گيري از علم داده، روش نوآورانه‌‌‌اي براي داده‌كاوي دادگان اصطلاحنامه‌‌‌اي به‌كار رفت. ‌‌روش‌شناسي‌هاي به‌كار رفته در ادبيات اين پژوهش تنها در دو مرحلۀ آماده‌‌‌سازي و استقرار و توسعه از شش مرحلۀ به‌كار رفته در اين پژوهش جا گرفتند.
  • عنوان نشريه
    مطالعات كتابداري و سازماندهي اطلاعات
  • عنوان نشريه
    مطالعات كتابداري و سازماندهي اطلاعات