بررسی روشهای موجود تطابق رکورد و بهبود بهره وری تشخیص تکرار
|
|
|
DOR
|
20.1001.2.9920149401.1399.5.1.52.9
|
نویسنده
|
نمکی وحیده
|
منبع
|
كنفرانس ملي كاربرد فناوري هاي نوين در علوم مهندسي - 1399 - دوره : 5 - پنجمین کنفرانس ملی کاربرد فناوریهای نوین در علوم مهندسی - کد همایش: 99201-49401
|
چکیده
|
روشهای متعددی برای تطبیق فیلدها و نحوة محاسبۀ میزان شباهت برای فیلدها مطرح است با توجه به این موضوع کهپایگاه دادهها متشکل از رکوردها میباشند و این رکوردها به نوبۀ خود از فیلدهای متنوعی ساخته میشوند، بنابراینتشخیص تکرار در سطح رکورد کاری بس دشوار و پیچیده نسبت به سطح فیلد میباشد. در این مقاله هدفمان بررسیروشهای مختلف برای تخمین میزان شباهت رکوردها در پایگاه داده ها می باشد. روشهای ذکر شده بطور گسترده به دودستۀ کلی تقسیم میشوند: روشهایی که مبتنی بر دادههای آموزشی هستند تا یاد بگیرند که چگونه رکوردها را باهمتطبیق دهند، مدلهای احتمالی و تکنیکهای یادگیری ماشین در این قسمت قرار میگیرند وروشهایی که مبتنی بر دانشدامنه و یا معیارهای فاصله برای تطبیق رکوردها هستند. این قسمت شامل رویکردهایی است که از زبانهای توصیفی برایتطبیق و همچنین روشهایی که از معیارهای فاصله،مناسب برای کار تشخیص تکرار استفاده میکنند. در این مقاله سعیخواهد شد روشها را ارائه و با یکدیگر مقایسه گردد.
|
کلیدواژه
|
svm. ، تطبیق، خوشه بندی
|
آدرس
|
دانشگاه ازاد اسلامی واحد شبستر, ایران
|
|
|
|
|
|
|