عنوان مقاله :
حفظ حريم خصوصي در برونسپاري دادههاي سامانههاي اطلاعاتي با تكيه بر سودمندي داده
عنوان به زبان ديگر :
Privacy in Database Publishing in the Presence of Adversary’s Background Knowledge
پديد آورندگان :
اميري، فاطمه دانشگاه صنعتي همدان، همدان، ايران
كليدواژه :
سامانه هاي اطلاعاتي , برون سپاري داده , انتشار داده , مدل حريم خصوصي , الگوريتم گمنامي
چكيده فارسي :
پژوهشهاي اخير نشان ميدهد كه داده يكي از ارزشمندترين سرمايههاي سازمانها و كسب كارها است. پردازش و تحليل دادهها به شركتها وسازمانها كمك ميكند تا بينش لازم را كسب كرده و از آن در راستاي تصميمگيري استراتژيك بهره گيرند. انتشار و فراهم كردن دسترسي باز به اطلاعات به يك فرايند متداول و نياز حياتي سازمانهاي دولتي و خصوصي مبدل شده است. دادههاي جمعآوري شده در سازمانها حاوي اطلاعات خصوصي افراد است كه انتشار آنها ميتواند منجر به افشاي اطلاعات حساس و نقض حريم خصوصي شود. اطلاعات حساس همچنين اسرار دولتي و اسرار تجاري را نيز شامل ميشود. چالش اصلي حوزه حفظ حريم خصوصي در انتشار داده، انتشار يك شكل تغييريافته از دادههاي جمعآوري شده است كه بتواند حريم خصوصي مالكان داده را حفظ نمايد و قابليت پاسخ به پرسوجوها و تحليلهاي دادهكاوي را با دقت مناسب داشته باشد. در سناريوي انتشار داده حفاظت از حريم خصوصي مالكان در حضور دانش پيشزمينه مهاجم مهم است. چارچوب گمنامي به عنوان يكي از راهبردهاي حفظ حريم خصوصي، سودمندي داده راكاهش ميدهد. در اين پژوهش برآنيم يك چارچوب گمنامي براي ممانعت از حمله دانش پيشزمينه، افشاي هويت و ويژگي مالكان طراحي كنيم كه سودمندي دادههاي گمنام را بيشينه كند. براي اين منظور بعد از مدلسازي دانش پيشزمينه مهاجم، مدل حريم خصوصي تعيين و در ادامه الگوريتم گمنامي ارائه ميشود. تمركز اين پژوهش بر مدلهاي حريم خصوصي نحوي مانند k- گمنامي و توسعههاي آن است. الگوريتم پيشنهادي ركوردها را به چندين گروه افراز ميكند به نحويكه در هرگروه مدل حريم خصوصي برآورده ميشود. نتايج به كارگيري چارچوپ پيشنهادي بر روي دو مجموعه داده ارزيابي و تحليل ميشود. براي ارزيابي كارايي چارچوب پيشنهادي از معيارهاي سودمندي و حريم خصوصي استفاده ميشود. نتايج آزمايشات نشان ميدهد چارچوب پيشنهادي از نظر سودمندي بر الگوريتم هاي ارائه شده در جديدترين پژوهشها برتري دارد.
چكيده لاتين :
Recent researches show that Data is one of the most valuable
and important assets of organizations and businesses. Privacy in the
dissemination of data is becoming increasingly challenging. Anonymity
as one of the privacy strategies on one side, conceals the relationship
between individuals and records in a metadata table and on the other side,
preserves the usefulness of the data for subsequent analysis. Preventing
information disclosure becomes difficult when the adversary possesses
background knowledge. We propose an anonymization framework to
protect against background knowledge attack, identity disclosure, and
feature disclosure. The anonymization algorithm creates equivalence
classes of records whose probability distributions extracted by background
knowledge are similar. Our proposed algorithm satisfies k-anonymity and
its extension too. The proposed anonymity algorithm tries to satisfy the
privacy model while preserving the usefulness of the anonymous data.
We verify the theoretical study by experimentation on two datasets.
Experimental results show that our proposed algorithm outperforms the
state of the art anonymization approaches in terms of loss of information.
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات