شماره ركورد كنفرانس :
3822
عنوان مقاله :
شناسايي ماكزيمم كلمات پرتكرار براي زبان هاي گوناگون
پديدآورندگان :
هاشم زاده بهاره گروه كامپيوتر، دانشكده فني و مهندسي، دانشگاه تربت حيدريه , عبدالرزاق نژاد مجيد گروه كامپيوتر، دانشكده فني و مهندسي، دانشگاه بزرگمهرقائنات , جوادي مقدم سيد محمد گروه كامپيوتر، دانشكده فني و مهندسي، دانشگاه بزرگمهر قائنات
كليدواژه :
شناسايي , كلمات پرتكرار , زبان , ماكزيمم.
عنوان كنفرانس :
چهارمين كنفرانس ملي فناوري اطلاعات، كامپيوتر و مخابرات
چكيده فارسي :
يكي از چالش¬هاي موجود بر سر راه شناسايي كلمات پرتكرار، وجود زبان¬هاي بسيار متنوع براي اطلاعات متني و وابستگي روش¬هاي موجود شناسايي كلمات پرتكرار به نوع زبان و ساختار كلامي آن زبان خاص مي¬باشد. لذا هدف اين پژوهش، طراحي الگوريتمي مستقل از زبان به منظور شناسايي كلمات پرتكرار مي¬باشد. از اين رو با تمركز روي خاصيت تكرار كلمات در هر متن و نسبت تكرار آن در ساير متون اين امر انجام شده است و در نهايت ماكزيمم بيشترين تكرار به عنوان كلمه پرتكرار انتخاب مي¬گردد. عملكرد الگوريتم پيشنهادي نيز توسط معيار نرخ دقت تشخيص مورد ارزيابي قرار گرفته است. لازم به ذكر است كه اين الگوريتم با الگوريتم مبتني بر گراف مقايسه گرديده است، كه نرخ دقت كلي الگوريتم پيشنهادي 82.2%درصد بوده است.