عنوان مقاله :
كاهش فضاي جستجو براي بازشناسي زيركلمات تايپي فارسي با استفاده از ويژگيهاي ساده، كوانتيزاسيون ويژگي و تركيب طبقهبندها
عنوان به زبان ديگر :
Search Space Reduction for Farsi Printed Subwords Recognition by Simple Features, Feature Quantization and Fusion of Classifiers
پديد آورندگان :
ميري، اسماعيل دانشگاه بيرجند - دانشكده مهندسي برق و كامپيوتر , رضوي، محمد دانشگاه بيرجند - دانشكده مهندسي برق و كامپيوتر , مهرشاد، ناصر دانشگاه بيرجند - دانشكده مهندسي برق و كامپيوتر
كليدواژه :
بازشناسي زيركلمات فارسي , بهينهسازي جمعيت ذرات , تركيب طبقهبندها , كاهش فضاي جستجو , كوانتيزاسيون ويژگي
چكيده فارسي :
در اين مقاله روشي براي كاهش فضاي جستجو در بازشناسي زيركلمات چاپي فارسي ارائه ميشود. ابتدا 10 ويژگي ساده از زيركلمه استخراج ميشود. با استفاده از مفهوم كوانتيزاسيون و با توجه به بازه تغييرات هر ويژگي روي همه دادههاي آموزشي ويژگيها كوانتيزه شده و به اعداد صحيحي تبديل ميشوند. با استفاده از هر ويژگي و فاصله آن تا ويژگي متناظر هر كدام از نمونههاي آموزشي، به هر كلاس امتيازي داده ميشود. با اعمال همه ويژگيها، هر كلاس به ازاي هر ويژگي يك امتياز دارد كه با تركيب اين امتيازات با اعمال جبري يك امتياز نهايي براي هر زيركلمه بدست ميآيد كه با مرتب كردن آنها و انتخاب تعدادي از آنها كه امتياز بيشتري دارند، فضاي جستجو محدود ميشود. از اعمال جبري جمع، ضرب، بيشينه، كمينه و جمع وزندار براي تركيب امتيازات استفاده شده است. روش جمع وزن دار، كه وزنهاي بهينه با الگوريتم بهينهسازي جمعيت ذرات تعيين شدهاند، بهترين پاسخ را داده است.
چكيده لاتين :
In this paper, a method is presented for search space reduction in Farsi Printed Subwords
recognition. First 10 simple features from subword are extracted. These features are quantized according to the
interval changes of each feature in training data, and are converted to integers. A score is given to every class,
using each feature and its distance to corresponding feature of each training sample. By applying all features,
each class has a score per feature. A final score is obtained, by fusion of these scores using algebra operations,
for each class. Search space is reduced using sorting of final scores and selection of some subwords with more
scores. For fusion of scores, sum, prod, max, min and weighted sum operations are used. The weighted sum
method, which Optimized weights are obtained by particle swarm optimization (PSO), has given the best
response.
عنوان نشريه :
رايانش نرم و فناوري اطلاعات