شماره ركورد كنفرانس :
4162
عنوان مقاله :
ارائه الگوريتم جديد optimized-RAKE براي استخراج عبارات كليدي
پديدآورندگان :
محمدي حسن كياده علي دانشجوي كارشناسي ارشد، دانشگاه علم و صنعت ايران , پارسا سعيد دانشيار دانشكده مهندسي كامپيوتر، دانشگاه علم و صنعت ايران , شيخكانلوي ميلان قربان دانشجوي دكترا، دانشگاه آزاد اسلامي واحد شبستر
كليدواژه :
عبارت كليدي , پردازش زبان طبيعي , برچسب بخش كلامي , فراواني عبارت , متن كاوي , پردازش زباني , كلمات زائد
عنوان كنفرانس :
اولين همايش ملي كامپيوتر، فناوري اطلاعات و كاربردهاي هوش مصنوعي
چكيده فارسي :
استخراج عبارات كليدي به عنوان هسته پردازشهاي خودكاري است كه روي دادههاي متني انجام ميشود. بنابراين در الگوريتمهاي متنكاوي استخراج عبارات كليدي از اهميت ويژهاي برخوردار است. در واقع استخراج عبارات كليدي يك مرحله بنيادي از اكثر پروژههاي متنكاوي است، كه تحقيق بر روي آن و پيدا كردن بهترين روش استخراج عبارات كليدي كه دقت و سرعت مناسبي داشته باشد، اهميت ويژهاي دارد. در اين مقاله، الگوريتم جديدي ارائه ميگردد كه علاوه بر سرعت بالاي استخراج عبارات كليدي، داراي دقت مناسبي نسبت به ساير الگوريتمهاي موجود در اين زمينه ميباشد. در اين مقاله يك ليست بهينه و مناسب براي كلمات زائد ارائه ميشود كه دقت و سرعت حذف كلمات زائد از متن ورودي را افزايش ميدهد. همچنين براي استخراج عبارات كليدي مناسب از رويكرد پردازش زباني استفاده شده است، كه در اين رويكرد با دو روش نحوي و لغوي عبارات كانديد مناسب را جهت پردازش و استخراج عبارات كليدي، مشخص مينمايد. علاوه بر بهينهسازيهايي كه در بالا ذكر شد، در اين مقاله، بهينهسازيهايي روي الگوريتم RAKE انجام داده و الگوريتم جديدي به نام optimized-RAKE ارائه ميگردد. نتايج مقايسه الگوريتم مورد نظر با تعدادي از الگوريتمهاي مطرح در اين حوزه، حاكي از عملكرد بهتر اين الگوريتم ميباشد.