عنوان مقاله :
راهكاري مبتني بر ساخت درخت دودويي تقريبي براي سرعتبخشيدن به جستجوي نزديكترين همسايگي در دادههاي حجيم
پديد آورندگان :
كلاته ، حسين دانشگاه تربيت دبير شهيد رجائي - دانشكده مهندسي كامپيوتر , دانشپور ، نگين دانشگاه تربيت دبير شهيد رجائي - دانشكده مهندسي كامپيوتر
كليدواژه :
بافر همپوشاني , دادههاي حجيم , درخت تصميم دودويي , طبقهبندي نزديكترين همسايگي
چكيده فارسي :
با توجه به سرعت روزافزون توليد اطلاعات و نياز تبديل اطلاعات به دانش، روشهاي يادگيري ماشين قديمي ديگر پاسخگو نيستند. هنگام استفاده از طبقهبنديها با روشهاي يادگيري ماشين قديمي، به ويژه استفاده از طبقهبنديهاي ذاتاً تنبل مانند روش k نزديكترين همسايگي (KNN)، عمليات طبقهبندي دادههاي حجيم بسيار كند است. نزديكترين همسايگي به دليل سادگي و دقت عملي كه ارائه ميدهد يك روش محبوب در زمينه طبقهبندي دادهها ميباشد. روش پيشنهادي مبتني بر مرتبسازي بردارهاي ويژگي دادههاي آموزشي در يك درخت جستجوي دودويي است تا طبقهبندي دادههاي بزرگ را با استفاده از روش نزديكترين همسايگي تسريع بخشد. اين كار با استفاده از يافتن تقريبي دو دورترين داده محلي در هر گره درخت انجام ميشود. اين دو داده به عنوان معيار براي تقسيم دادههاي موجود در گره فعلي بين دو گروه، مورد استفاده قرار ميگيرند. مجموعه دادههاي موجود در هر گره بر اساس شباهت آنها به اين دو داده، به فرزند چپ يا راست گره فعلي تخصيص داده ميشوند. نتايج آزمايشهاي متعدد انجامشده بر روي مجموعه دادههاي مختلف از مخزن UCI، ميزان دقت خوب با توجه به زمان اجراي كم روش پيشنهادي را نشان ميدهد.
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران