مرکز منطقه ای اطلاع رساني علوم و فناوري - يادگيري برخط در فضاي ويژگي پويا

شماره ركورد كنفرانس :

5412

عنوان مقاله :

يادگيري برخط در فضاي ويژگي پويا

عنوان به زبان ديگر :

Online Learning in Dynamic Feature Space

پديدآورندگان :

ساجدي رضا r.sajedi@aut.ac.ir دانشجوي كارشناسي ارشد، دانشكده مهندسي كامپيوتر، دانشگاه صنعتي اميركبير، تهران، ايران , رزازي محمدرضا razzazi@aut.ac.ir استاد، دانشكده مهندسي كامپيوتر، دانشگاه صنعتي اميركبير، تهران، ايران

تعداد صفحه :

كليدواژه :

يادگيري برخط , طبقه‌بندي جويبارداده , تحول ويژگي , الگوريتم

سال انتشار :

1402

عنوان كنفرانس :

نهمين كنفرانس بين المللي وب پژوهي

زبان مدرك :

فارسي

چكيده فارسي :

امروزه غالب فعاليت‌هاي روزمره انسان بر بستر وب انجام مي‌شود. سرعت و حجم بالاي توليد داده در وب، استفاده از الگوريتم‌هاي برخط يادگيري ماشين در پردازش و تحليل جويبارداده را بسيار كارآمد جلوه داده است. بسياري از اين الگوريتم‌ها با فرض ثابت بودن فضاي ويژگي ارائه شده‌اند؛ اما در مسائل دنياي واقعي ممكن است چنين فرضي رعايت نشود و هر نمونه از جويبارداده ويژگي‌هاي متفاوتي داشته باشد. در اين پژوهش، اين مسئله جديد كه اخيراً توجه زيادي را به خود جلب كرده است بررسي مي‌شود. همچنين يك الگوريتم عمومي نوين براي طبقه‌بندي جويبارداده ارائه مي‌شود كه با كشف روابط بين ويژگي‌ها و تخمين مقادير مربوط به ويژگي‌هاي ناموجود، از حداكثر پتانسيل طبقه‌بند در پيش‌بيني بهره‌برداري مي‌كند. درنهايت با انجام آزمايش‌هاي تجربي و مقايسه نتايج آن با دو مورد از الگوريتم‌هاي اخير، نشان داده مي‌شود كه الگوريتم ارائه شده دقت بالاتري دارد.

چكيده لاتين :

Nowadays, most of our daily activities are carried out on the web. The high speed and volume of data production on the web have made the use of online machine learning algorithms in processing and analyzing data streams very efficient. Many of these algorithms have been developed assuming a fixed feature space; however, in real-world problems, this assumption may not hold and each instance of a data stream may have different features. In this study, this new problem that has recently attracted a lot of attention is investigated. Also, a novel general algorithm for data stream classification is proposed, which exploits the relationships between features and estimates the values of unavailable features to achieve the maximum potential classifier. Finally, through empirical experiments and comparison with two recent algorithms, it is shown that the proposed algorithm has higher accuracy.

كشور :

ايران

لينک به اين مدرک :

https://search.isc.ac/dl/search/defaultta.aspx?DTC=36&DC=358670