عنوان مقاله :
ارائه يك رويكرد تركيبي جديد براي يافتن بردارهاي پايه معنادار جهت بازنمايي صريح بردارهاي كلمه
پديد آورندگان :
پاكزاد ، عاطفه دانشگاه علم و صنعت ايران - دانشكده مهندسي كامپيوتر , آنالويي ، مرتضي دانشگاه علم و صنعت ايران - دانشكده مهندسي كامپيوتر
كليدواژه :
بردارهاي پايه , بازنمايي بردارهاي كلمه , بردارهاي كلمه تفسيرپذير , وزندهي دودويي , انتخاب ويژگي , وظيفه شباهت كلمه
چكيده فارسي :
هدف اصلي اين پژوهش بازنمايي صريح بردارهاي معنايي كلمه با ابعاد كم است. براي توليد بردارهاي معنايي كلمه صريح، بايستي مسئله ي يافتن تعداد محدودي بردار پايه معنادار به گونه اي حل شود كه با كاهش ابعاد بردارهاي كلمه افت دقت زيادي ايجاد نشود. ما در اين پژوهش يك رويكرد تركيبي براي يافتن بردارهاي پايه معنادار ارائه مي كنيم. در ابتدا، N بردار پايه را با روش هاي پيشنهادي 1-معيار نسبت شباهت كلمه به تكرار كلمه، 2-انتخاب ويژگي مبتني بر مقايسه ماتريس هاي فاصله، 3-وزن دهي دودويي مبتني بر الگوريتم BPSO بدست مي آوريم. سپس، براي بهرهگيري از خبرگي روشهاي 1و 2 به ميزان يكسان، نيمي از بردارهاي پايه بدست آمده با روش معيار نسبت شباهت كلمه به تكرار كلمه را با نيمي از بردارهاي پايه انتخاب شده با روش انتخاب ويژگي، تركيب كرده و بردارهاي پايه تركيبي اول را بدست مي آوريم. در مرحله بعدي، كلمات بافتار مشترك داراي وزن 1 بدست آمده با استفاده از روش BPSO را به بردارهاي پايه تركيبي اول حاصل از روش هاي نسبت شباهت كلمه به تكرار كلمه و روش انتخاب ويژگي مي افزاييم. بنابراين، بردارهاي پايه تركيبي دوم بدست ميآيند كه معنادار هستند و هر بردار پايه معادل يك كلمه بافتار آگاهي بخش است. لذا بردارهاي كلمه صريح توليد شده با استفاده از بردارهاي پايه معنادار، تفسيرپذير هستند. ما رويكرد پيشنهادي را با استفاده از پيكره UkWaC آموزش داده و بر روي وظيفه شباهت كلمه مورد ارزيابي قرار مي دهيم. هر دو بردارهاي پايه تركيبي اول و دوم سبب بهبود دقت ميگردند. اين افزايش دقت در بردارهاي پايه تركيبي اول بيشتر است. نتايج حاصل از ارزيابي بردارهاي كلمه صريح بدست آمده با بردارهاي پايه اول نشان مي دهد كه با وجود كاهش ابعاد بردارهاي كلمه از 5000 به 1511، ضريب همبستگي اسپيرمن بر روي مجموعه هاي آزمون MEN، RG-65 و SimLex-999 به ترتيب به ميزان 2.47%، 7.39% و 0.52% افزايش مييابد.
عنوان نشريه :
رايانش نرم و فناوري اطلاعات
عنوان نشريه :
رايانش نرم و فناوري اطلاعات