>
Fa   |   Ar   |   En
   برخی کاربردهای مدل فلگی‑سانتر در اتصال رکوردی  
   
نویسنده رضائی قهرودی زهرا ,موفقی اردستانی علیرضا
منبع شانزدهمين كنفرانس آمار ايران - 1401 - دوره : 16 - شانزدهمین کنفرانس آمار ایران - کد همایش: 01220-18271 - صفحه:0 -0
چکیده    امروزه با دسترسی روزافزون به پایگاه داده های اداری، روش های سنتی گردآوری و تحلیل داده ها کارایی لازمرا ندارند. بر این اساس، گذار از روش های آماری سنتی به روش های مدرن با رویکرد آمارهای ثبتی مبنا بیش از پیشمورد توجه تحلیلگران داده ها قرار گرفته است. در روش های ثبتی مبنا، ایجاد یک پایگاه دادۀ یکپارچه از طریق اتصالرکوردهای پایگاه داده های دستگاه های مختلف اهمیت ویژه ای دارد. بسیاری از الگوریتم های اتصال رکوردی بر پایۀنظریۀ فلگی و سانتر توسعه یافته است که در این مقاله به دو کاربرد استفاده از این نظریه پرداخته می شود. یکی ازنقص های مدل فلگی‑سانتر این است که به درون اطلاعات موجود در مقادیر متغیرها نفوذ نمی کند و مقادیر متغیرهایرشته ای (رایج بودن یا نادر بودن مقدار ویژگی موردنظر) در آن اهمیت ندارد. در این مقاله به معرفی روشی پرداختهمی شود که بتواند با اصلاح وزن های جورسازی مدل فلگی‑سانتر، این تفاوت ها را در مقادیر یک متغیر رشته ای درمدل فلگی‑سانتر القا کند.
کلیدواژه مدل فلگی‑سانتر، اتصال رکوردی، اصلاح وزن ها، تکراری یابی.
آدرس , iran, , iran
 
   applications of fellegi–sunter‘s model to record linkage  
   
Authors
Abstract    today, with the increasing access to administrative databases, the traditional methodsof data collection and analysis are not effective. accordingly, the transition from traditionalstatistical methods to modern methods with the register-based statistics approach hasreceived more and more attention from statistical data analysts. in register-based methods,it is especially important to create an integrated database by linking database records of differentorganizations. many record linkage algorithms have been developed using the modelproposed by fellegi and sunter. in this article, two applications of this theory are discussed.the fellegi-sunter model does not leverage information contained in field values and doesnot care about specific possible values of a string variable (more common and less commonvalues). in this paper, a method that can be able to infuse these differences in the specificpossible values of a string variable, by modifying matching weights obtained by fellegi–sunter‘s model, is presented.
Keywords fellegi-sunter model ,record linkage ,adjusting weights ,sampling frame ,duplicatedetection.
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved