شماره ركورد كنفرانس :
5412
عنوان مقاله :
يادگيري برخط در فضاي ويژگي پويا
عنوان به زبان ديگر :
Online Learning in Dynamic Feature Space
پديدآورندگان :
ساجدي رضا r.sajedi@aut.ac.ir دانشجوي كارشناسي ارشد، دانشكده مهندسي كامپيوتر، دانشگاه صنعتي اميركبير، تهران، ايران , رزازي محمدرضا razzazi@aut.ac.ir استاد، دانشكده مهندسي كامپيوتر، دانشگاه صنعتي اميركبير، تهران، ايران
كليدواژه :
يادگيري برخط , طبقهبندي جويبارداده , تحول ويژگي , الگوريتم
عنوان كنفرانس :
نهمين كنفرانس بين المللي وب پژوهي
چكيده فارسي :
امروزه غالب فعاليتهاي روزمره انسان بر بستر وب انجام ميشود. سرعت و حجم بالاي توليد داده در وب، استفاده از الگوريتمهاي برخط يادگيري ماشين در پردازش و تحليل جويبارداده را بسيار كارآمد جلوه داده است. بسياري از اين الگوريتمها با فرض ثابت بودن فضاي ويژگي ارائه شدهاند؛ اما در مسائل دنياي واقعي ممكن است چنين فرضي رعايت نشود و هر نمونه از جويبارداده ويژگيهاي متفاوتي داشته باشد. در اين پژوهش، اين مسئله جديد كه اخيراً توجه زيادي را به خود جلب كرده است بررسي ميشود. همچنين يك الگوريتم عمومي نوين براي طبقهبندي جويبارداده ارائه ميشود كه با كشف روابط بين ويژگيها و تخمين مقادير مربوط به ويژگيهاي ناموجود، از حداكثر پتانسيل طبقهبند در پيشبيني بهرهبرداري ميكند. درنهايت با انجام آزمايشهاي تجربي و مقايسه نتايج آن با دو مورد از الگوريتمهاي اخير، نشان داده ميشود كه الگوريتم ارائه شده دقت بالاتري دارد.
چكيده لاتين :
Nowadays, most of our daily activities are carried out on the web. The high speed and volume of data production on the web have made the use of online machine learning algorithms in processing and analyzing data streams very efficient. Many of these algorithms have been developed assuming a fixed feature space; however, in real-world problems, this assumption may not hold and each instance of a data stream may have different features. In this study, this new problem that has recently attracted a lot of attention is investigated. Also, a novel general algorithm for data stream classification is proposed, which exploits the relationships between features and estimates the values of unavailable features to achieve the maximum potential classifier. Finally, through empirical experiments and comparison with two recent algorithms, it is shown that the proposed algorithm has higher accuracy.