شماره ركورد كنفرانس :
4803
عنوان مقاله :
ارائه خزشگر مبتني بر آنتولوژي براي وب سايتهاي خبري فارسي
پديدآورندگان :
مظاهري ويدا دانشجوي كارشناسي ارشد مهندسي فناوري اطلاعات، گروه كامپيوتر، دانشكده فني ومهندسي، واحد تهران غرب، دانشگاه آزاد اسلامي، تهران، ايران , دل آرا چنگيز delara.c@wtiau.ac.ir استاديار، گروه كامپيوتر، دانشكده فني ومهندسي، واحد تهران غرب، دانشگاه آزاد اسلامي، تهران، ايران , دانشجو پريسا استاديار، گروه كامپيوتر، دانشكده فني ومهندسي، واحد تهران غرب، دانشگاه آزاد اسلامي، تهران، ايران
كليدواژه :
وب كاوي , خزشگر , آنتولوژي , xpath.
عنوان كنفرانس :
ششمين همايش ملي مديران فناوري اطلاعات ايران
چكيده فارسي :
اطلاع از نحوه انعكاس اخبار براي مسئولان دولتي، صاحبان صنايع، تجار و سرمايه گذاران از اهميت بالايي برخوردار است. با توجه به حجم بالاي اخبار توليد شده تصور ارزيابي و تحليل اين حجم خبري توسط نيروي انساني غير ممكن بوده و ابزارها و روش هايي نو براي مديريت آن مورد نياز است. تاكنون روشهاي زيادي براي ايجاد خزشگر براي وب سايتهاي خبري به زبان انگليسي ارائه شده است. ولي اغلب اين روش ها وابسته به زبان بوده و براي وب سايتهاي خبري فارسي قابل استفاده نيستند. در اين تحقيق خزشگري براي استخراج اطلاعات از وب سايتهاي خبري فارسي با استفاده از آنتولوژي ارائه گرديده است. نتايج حاصل از اين پژوهش نشان ميدهد كه اين روش، متن اصلي صفحات خبري وب را با دقت بالايي استخراج ميكند.