|
|
روشی جدید برای حفظ حریم خصوصی دادهها مبتنی بر اساس تجزیه نامنفی ماتریس
|
|
|
|
|
نویسنده
|
علی احمدی پور لعیا ,ولی پور عزت
|
منبع
|
سيستم هاي فازي و كاربردها - 1401 - دوره : 5 - شماره : 2 - صفحه:73 -92
|
چکیده
|
نگرانی شرکت ها از افشا و نقض حریم خصوصی کاربران در حال افزایش است و این امر منجر به تمرکز بسیاری از محققان بر روی توسعه روش های حفظ حریم خصوصی داده ها شده است. این روش ها روی داده های اصلی تاثیر می گذارند و با حفظ ویژگی ها و ارتباط بین آن ها، داده را بصورت دیگری منتشر میکنند. در این مقاله با استفاده از روش خوشه بندی تجزیه نامنفی ماتریس ها، الگوریتمی برای تولید دادههایی با سطوح امنیتی متفاوت، جهت انتشار برای یک مجموعه داده اصلی پیشنهاد می شود. پیاده سازی ها با دو رویکرد متفاوت روی مجموعه دادههای متنوع استاندارد نشان می دهند که الگوریتم پیشنهادی علاوه بر تولید داده هایی با سطوح امنیتی مختلف، ساختار محدودیتهای دادهی اصلی را نیز حفظ می کند.روش مطرح شده در این مقاله روی مجموعه دادههای با ابعاد بالا پیاده سازی شده، در حالیکه برخی روشهای ریزتجمیع کننده مبتنی بر فازی قابلیت پیادهسازی روی آنها را ندارند. همچنین، نتایج تجربی با استفاده از روش -cمیانگین فازی نشان میدهد که میزان اطلاعات از دست رفته نیز بسیار ناچیز است. لذا، الگوریتم پیشنهادی می تواند داده هایی را منتشر کند که در عین حفظ حریم خصوصی، برای پردازشگران قانونی قابل استناد باشند.
|
کلیدواژه
|
حفظ حریم خصوصی داده، روش خوشهبندی تجزیه نامنفی ماتریس، داده ماسک شده، داده منتشر شده، اطلاعات از دست رفته
|
آدرس
|
دانشگاه شهید باهنر کرمان, دانشکده ریاضی و کامپیوتر, بخش علوم کامپیوتر, ایران, دانشگاه شهید باهنر کرمان, دانشکده ریاضی و کامپیوتر, بخش ریاضی کاربردی, ایران
|
پست الکترونیکی
|
valipour@uk.ac.ir
|
|
|
|
|
|
|
|
|
a new method for preserving data privacy based on the non-negative matrix factorization clustering
|
|
|
Authors
|
aliahmadipour laya ,valipour ezat
|
Abstract
|
companies are increasingly concerned about the disclosure and violation of users’ privacy, and this has led many researchers to focus on developing of data privacy methods. these methods affect the original data and publish the data in a different form by keeping their features and relationships. this paper suggests an algorithm to generate data for publishing with different privacy level for a given original data set based on non-negative matrix factorization clustering. implementation results with two different approaches to various standard data sets show that our proposed algorithm can satisfy the original data constraints in addition to generating data with different privacy levels. the method proposed in this article is implemented on high-dimensional datasets, while some fuzzy-based microaggregation methods cannot be implemented on them. also, the experimental results using fuzzy $c$-mean show that the information loss is very small. therefore, the proposed algorithm can publish data that can be relied on by legal users while preserving privacy.
|
|
|
|
|
|
|
|
|
|
|
|
|