|
|
حفظ حریم خصوصی در رده بندی داده های توزیع شده عمودی
|
|
|
|
|
نویسنده
|
ابراهیمی دیشابی محمدرضا
|
منبع
|
رايانش نرم و فناوري اطلاعات - 1400 - دوره : 10 - شماره : 4 - صفحه:29 -42
|
چکیده
|
امروزه، حفظ حریم خصوصی داده های منتشر شده، از اهمیت زیادی برخوردار است. الگوریتمهای مختلفی برای حفظ حریم خصوصی داده ها ابداع شده است. مهمترین مشکلات این الگوریتمها، غیر قابل اثبات بودن حریم خصوصی آنها، اهمیت کم در نظر گرفته شده برای دانش پیش زمینه فرد متخاصم و عدم کاهش ابعاد داده های اولیه است. در این مقاله، برای اثبات حریم خصوصی داده ها از مفهوم حریم خصوصی تفاضلی در انتشار داده های توریع شده عمودی و رده بندی آنها استفاده شده است. در حریم خصوصی تفاضلی، دانش پیش زمینه فرد متخاصم در مورد داده های منتشر شده، اهمیت ندارد. همچنین، با استفاده از تبدیل موجک هار، ابعاد داده ها کاهش داده شده است. در نهایت، حریم خصوصی داده های منتشر شده به صورت ریاضی اثبات شده است، همچنین، دقت داده ها، با استفاده از الگوریتم رده بند «kنزدیکترین همسایه» نیز اندازه گیری شده است و به صورت ریاضی اثبات شده است که الگوریتم پیشنهادی، خدشه هایی با انحراف معیار کمتری را نسبت به الگوریتم مورد مقایسه، به داده ها اضافه میکند و در نتیجه دقت رده بندی بالاتری دارد. نتایج به دست آمده نشان دهنده امن تر بودن الگوریتم ارائه شده نسبت به الگوریتمهای مورد مقایسه است.
|
کلیدواژه
|
داده کاوی، رده بندی داده ها، تبدیل موجک هار، حریم خصوصی تفاضلی
|
آدرس
|
دانشگاه آزاد اسلامی واحد میانه, گروه کامپیوتر, ایران
|
پست الکترونیکی
|
mrebrahimy@m-iau.ac.ir
|
|
|
|
|
|
|
|
|
Privacy Preserving Classification in Vertically Distributed Datasets
|
|
|
Authors
|
Ebrahimi Dishabi Mohammad Reza
|
Abstract
|
Nowadays, preserving the privacy of data is an important issue during data mining techniques. several algorithms have been proposed to preserve the privacy of data. The most important problems with these algorithms are their unprovable privacy, the low importance of considering the adversary’s background knowledge and lack of dimensionality reduction process over the original data. In this paper, differential privacy mechanism has been used to prove the privacy of vertical distributed data to be used for classification. In differential privacy, it is no matter what background knowledge has an adversary about the published data. Also, Haar wavelet transform has been used for dimension reduction of the original data.The privacy of data has been proved mathematically and the accuracy of data measured using the KNN algorithm. Finally, it has been mathematically proved that the proposed algorithm adds noise with less standard deviation to the data than the compared algorithm, resulting in higher classification accuracy. The result shows that our algorithm has more secure compared to previous algorithms.
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|