شماره ركورد كنفرانس :
4579
عنوان مقاله :
ارائه مدل دسته بندي متون فارسي با استفاده از تركيب مدل گوسين وبيزين
عنوان به زبان ديگر :
فاقد عنوان و چكيده لاتين
پديدآورندگان :
قاسمي مهسا دانشگاه صنعتي شاهرود , جعفري نژاد فاطمه دانشگاه صنعتي شاهرود
كليدواژه :
فركانس كلمه و معكوس سند , تئوري گوسين , تئوري بيزين , دسته بندي متون فارسي
سال انتشار :
:آذر 1398
عنوان كنفرانس :
پنجمين همايش پردازش سيگنال و سيستم هاي هوشمند
زبان مدرك :
فارسي
چكيده فارسي :
هدف از دسته بندي اسناد، نگاشت اسناد متني به چند دسته از قبل تعيين شده است. به دليل رشد روز افزون متون، توجه زيادي به دسته بندي اسناد شده است. اما تجميع نظر كارشناسان، امري چالش پذير بوده و باعث اتلاف زمان مي شود. بنابراين در سال هاي اخير الگوريتم هاي گوناگوني براي دسته بندي خودكار اسناد، پيشنهاد شده است كه البته اكثر آن ها در زمينه متون لاتين ارائه گرديده است و اخيرا به بررسي متون چيني و عربي و فارسي توجه شده است. هدف اين مقاله، بررسي دسته بندي داده هاي فارسي مي باشد كه از تركيب دو الگوريتم بيزين وگوسين، براي بهره بردن از مزيت هاي اين دو الگوريتم، استفاده كرده ايم. در روش ارائه شده، دسته بندي متون فارسي به وسيله ي پيكره ي همشهري 2 مورد آزمايش قرار داده شده است و با روش نرمال شده ي تكرار كلمه درمعكوس تكرارسند (TF-IDF) به ويژگي ها وزن داده مي شود و سپس مدل پيشنهادي پياده سازي مي شود. روش پيشنهادي براي دسته بندي اين پيكره به 6 دسته، به دقت 93.04 درصد رسيده است كه در مقايسه با ساير روش هاي ارائه شده براي متون فارسي دقت بيشتري داشته است.
كشور :
ايران
تعداد صفحه 2 :
5
از صفحه :
1
تا صفحه :
5
لينک به اين مدرک :
بازگشت