يك روش خوشه بندي توزيع شده مبتني بر Kmeans براي حفظ محرمانگي در انتشار داده هاي حجيم

پديدآورندگان

اشكوتي فاروق دانشگاه آزاد اسلامي، مهاباد، ايران , رشيدي رحيم دانشگاه آزاد اسلامي، مهاباد، ايران

تعداد صفحه

كليدواژه

گمنام سازي , مدل k-anonymity , مدل l-diversity , خوشه بندي سلسله مراتبي , فاصله اقيلدس , فاصله منهتن.

سال انتشار

1401

عنوان كنفرانس

اولين كنفرانس بين المللي و ششمين كنفرانس ملي كامپيوتر، فناوري اطلاعات و كاربردهاي هوش مصنوعي

زبان مدرك

فارسي

چكيده فارسي

يكي از مراحل اساسي در چرخه حيات داده ، انتشار آن براي تحليل گران داده جهت كشف الگوهاي مفيد و ناشناخته است. انتشار داده ممكن است، باعث افشاي ناخواسته اطلاعات افراد شود و مشكلاتي براي محرمانگي ايجاد كند. تحقيقات نشان داده است كه گمنام سازي داده براي برآورده كردن مدل هاي محرمانگي در داده هاي انتشاري يك روش كارا براي جلوگيري از افشاي اطلاعات محرمانه افراد است. در اين مقاله، براي گمنام سازي داده ها ، از خوشه بندي سلسله مراتبي داده ها جهت برآورده كردن مدل l-diversity استفاده مي شود. ما دو تابع فاصله جديد براساس فاصله منهتن و اقيلدس براي محاسبه فاصله ركوردها در الگوربتم خوشه بندي k-means ارايه داده ايم، كه اين توابع نيازهاي مدل محرمانگي l-diversity را داده هاي انتشاري برآورده مي كنند. يكي از نيازهاي روشهاي گمنام سازي برقراي مصالحه بين محرمانگي و ميزان استفاده از داده است. بنابراين در طراحي توابع فاصله پيشنهادي، از معيار نزديكي داده ها به همديگر، براساس مدل محرمانگي l-diversity استفاده شده، تا مصالحه بهتري بين محرمانگي و استفاده داده بوجود آيد. روش پيشنهادي اين مقاله، بصورت توزيع شده و با استفاده از برنامه نويسي RDDها در چهارچوب آپاچي سپارك ارايه شده است، تا چالش سرعت در عمليات گمنام سازي داده هاي حجيم و مقياس پذيري روش پيشنهادي را حل نمايد. در آخر پياده سازي و آزمايشات انجام شده كارايي و مفيد بودن روش پيشنهادي را نشان داده است.

كشور

ايران

لينک به اين مدرک

https://search.isc.ac/dl/search/defaultta.aspx?DTC=36&DC=365911