>
Fa   |   Ar   |   En
   یک روش خوشه بندی توزیع شده مبتنی بر kmeans برای حفظ محرمانگی در انتشار داده های حجیم  
   
نویسنده اشکوتی فاروق ,رشیدی رحیم
منبع اولين كنفرانس بين المللي و ششمين كنفرانس ملي كامپيوتر، فناوري اطلاعات و كاربردهاي هوش مصنوعي - 1401 - دوره : 1 - اولین کنفرانس بین المللی و ششمین کنفرانس ملی کامپیوتر، فناوری اطلاعات و کاربردهای هوش مصنوعی - کد همایش: 01220-12911 - صفحه:0 -0
چکیده    یکی از مراحل اساسی در چرخه حیات داده ، انتشار آن برای تحلیل گران داده جهت کشف الگوهای مفید و ناشناخته است. انتشار داده ممکن است، باعث افشای ناخواسته اطلاعات افراد شود و مشکلاتی برای محرمانگی ایجاد کند. تحقیقات نشان داده است که گمنام سازی داده برای برآورده کردن مدل های محرمانگی در داده های انتشاری یک روش کارا برای جلوگیری از افشای اطلاعات محرمانه افراد است. در این مقاله، برای گمنام سازی داده ها ، از خوشه بندی سلسله مراتبی داده ها جهت برآورده کردن مدل l-diversity استفاده می شود. ما دو تابع فاصله جدید براساس فاصله منهتن و اقیلدس برای محاسبه فاصله رکوردها در الگوربتم خوشه بندی k-means ارایه داده ایم، که این توابع نیازهای مدل محرمانگی l-diversity را داده های انتشاری برآورده می کنند. یکی از نیازهای روشهای گمنام سازی برقرای مصالحه بین محرمانگی و میزان استفاده از داده است. بنابراین در طراحی توابع فاصله پیشنهادی، از معیار نزدیکی داده ها به همدیگر، براساس مدل محرمانگی l-diversity استفاده شده، تا مصالحه بهتری بین محرمانگی و استفاده داده بوجود آید. روش پیشنهادی این مقاله، بصورت توزیع شده و با استفاده از برنامه نویسی rddها در چهارچوب آپاچی سپارک ارایه شده است، تا چالش سرعت در عملیات گمنام سازی داده های حجیم و مقیاس پذیری روش پیشنهادی را حل نماید. در آخر پیاده سازی و آزمایشات انجام شده کارایی و مفید بودن روش پیشنهادی را نشان داده است.
کلیدواژه گمنام سازی، مدل k-anonymity، مدل l-diversity، خوشه بندی سلسله مراتبی، فاصله اقیلدس، فاصله منهتن.
آدرس , iran, , iran
 
     
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved