شماره ركورد كنفرانس :
4162
عنوان مقاله :
ارائه الگوريتم جديد optimized-RAKE براي استخراج عبارات كليدي
پديدآورندگان :
محمدي حسن كياده علي دانشجوي كارشناسي ارشد، دانشگاه علم و صنعت ايران , پارسا سعيد دانشيار دانشكده مهندسي كامپيوتر، دانشگاه علم و صنعت ايران , شيخكانلوي ميلان قربان دانشجوي دكترا، دانشگاه آزاد اسلامي واحد شبستر
تعداد صفحه :
20
كليدواژه :
عبارت كليدي , پردازش زبان طبيعي , برچسب بخش كلامي , فراواني عبارت , متن كاوي , پردازش زباني , كلمات زائد
سال انتشار :
1396
عنوان كنفرانس :
اولين همايش ملي كامپيوتر، فناوري اطلاعات و كاربردهاي هوش مصنوعي
زبان مدرك :
فارسي
چكيده فارسي :
استخراج عبارات كليدي به عنوان هسته پردازش­هاي خودكاري است كه روي داده­هاي متني انجام مي­شود. بنابراين در الگوريتم­هاي متن­كاوي استخراج عبارات كليدي از اهميت ويژه­اي برخوردار است. در واقع استخراج عبارات كليدي يك مرحله بنيادي از اكثر پروژه­هاي متن­كاوي است، كه تحقيق بر روي آن و پيدا كردن بهترين روش استخراج عبارات كليدي كه دقت و سرعت مناسبي داشته باشد، اهميت ويژه­اي دارد. در اين مقاله، الگوريتم جديدي ارائه مي­گردد كه علاوه بر سرعت بالاي استخراج عبارات كليدي، داراي دقت مناسبي نسبت به ساير الگوريتم­هاي موجود در اين زمينه مي­باشد. در اين مقاله يك ليست بهينه و مناسب براي كلمات زائد ارائه مي­شود كه دقت و سرعت حذف كلمات زائد از متن ورودي را افزايش مي­دهد. همچنين براي استخراج عبارات كليدي مناسب از رويكرد پردازش زباني استفاده شده ­است، كه در اين رويكرد با دو روش نحوي و لغوي عبارات كانديد مناسب را جهت پردازش و استخراج عبارات كليدي، مشخص مي­نمايد. علاوه بر بهينه­سازي­هايي كه در بالا ذكر شد، در اين مقاله، بهينه­سازي­هايي روي الگوريتم RAKE انجام داده و الگوريتم جديدي به نام optimized-RAKE ارائه مي­گردد. نتايج مقايسه الگوريتم مورد نظر با تعدادي از الگوريتم­هاي مطرح در اين حوزه، حاكي از عملكرد بهتر اين الگوريتم مي‌باشد.
كشور :
ايران
لينک به اين مدرک :
بازگشت