شماره ركورد كنفرانس :
5391
عنوان مقاله :
محليسازي ويديو در زبان فارسي با استفاده از شبكه مجاور زماني و تشخيص اشيا
پديدآورندگان :
پورزارع سرخي معصومه masoumepourzare@gmail.com گروه مهندسي كامپيوتر، واحدعلوم و تحقيقات، دانشگاه آزاد اسلامي , كوچاري عباس گروه مهندسي كامپيوتر، واحدعلوم و تحقيقات، دانشگاه آزاد اسلامي , محمدزاده جواد گروه مهندسي كامپيوتر، واحد كرج، دانشگاه آزاد اسلامي
كليدواژه :
بازيابي لحظه ويديويي , پردازش متني , محليسازي لحظهاي ويديويي
عنوان كنفرانس :
دهمين كنفرانس بين المللي هوش مصنوعي و رباتيك
چكيده فارسي :
محليسازي ويديو با زبان طبيعي، به عنوان يك روش بازيابي لحظهاي ويديو شناخته ميشود كه هدف آن مكانيابي لحظههاي هدف در يك ويديو است بطوريكه از نظر معنايي با جمله متني مورد جستجو، كه به آن جستار مي گويند، مطابقت دارد. با توجه به اينكه روشهاي موجود معمولا لحظههاي زماني را به صورت جداگانه در نظر ميگيرند و از وابستگي زماني غفلت ميكنند، هنوز نتوانستهاند به خوبي بر چالشهاي محلي سازي ويديو فائق آيند. در اين تحقيق، روشي براي محليسازي لحظههاي ويديويي در زبان فارسي، با استفاده از شبكه مجاور زماني و تشخيصاشيا، با هدف افزايش دقت و سرعت بازيابي ويديو پيشنهاد ميشود. روش پيشنهادي، روابط زماني بين لحظات ويدئويي را با يك نقشه دو بعدي مدل ميكند كه ميتواند لحظات ويدئويي متنوعي را با طولهاي زماني مختلف پوشش دهد و تشخيص اشيا را به بعد دوم اضافه ميكند تا حجم پردازش برروي ويدئو كاهش يابد و فقط بخشي از ويدئو كه شامل اشياي ذكر شده در جستار است، مورد پردازش قرار گيرد. نتايج ارزيابي نشان مي دهد كه ويژگي هاي استخراج شده بهترين كارايي را دارند و مدل پيشنهادي با ۲درصد بهبود در دقت، به دقت ۷۴. ۴۸ در رتبه ۵ و دقت ۴۶. ۹۲ در رتبه ۱ مي رسد.