بهینهسازی هستههای چندگانه در ماشینبردارپشتیبان جفتی برای کاهش شکاف معنایی تشخیص صفحات فریبآمیز
|
|
|
|
|
نویسنده
|
زارع چاهوکی محمدعلی ,محمدی حمیدرضا
|
منبع
|
مهندسي برق دانشگاه تبريز - 1395 - دوره : 46 - شماره : 4 - صفحه:135 -145
|
چکیده
|
موتورهای جستجو با خزش صفحات موجود در اینترنت و شاخصگذاری آنها، قابلیت جستجوی سریع اطلاعات را به کاربران میدهند. یکی از چالشهای مهم در استفاده از این ابزار، صفحاتی هستند که از آنها بهعنوان صفحات فریبآمیز نام برده میشود. رویکردهای مختلفی جهت تشخیص صفحات فریب ابداع شده است که میتوان به روشهایی مانند سنجش میزان شباهت سبک کدهای صفحات، تحلیل الگوی زبانی صفحات و همچنین استفاده از روشهای یادگیری ماشین بر اساس ویژگیهای صفحات اشاره کرد. ازجمله الگوریتمهای یادگیری ماشین که در این حوزه استفاده شده است ولی نتایج قابلتوجهی را ارائه نکرده، الگوریتم ماشینبردارپشتیبان (svm) است. استفاده از هسته در ساختار طبقهبند svm باعث میشود که دادههایی که دارای الگوی غیرخطی هستند با نگاشت به فضایی با ابعاد بیشتر بتوانند با مدل خطی تفکیکپذیر شوند. این کار باعث افزایش دقت تفکیککنندگی مدل یادگیری ماشین میشود. اخیراً توسعهایی از svm با نام svm جفتی (tsvm) ارائه شده است که با تغییر در فرضیه اولیه آن، از دو اَبَرصفحه برای تفکیک نمونههای هر کلاس استفاده میکند و توانسته نتایج بهتری در طبقهبندی ارائه کند. به دلیل استفاده از دو ابرصفحه در tsvm، لذا بهتر است تا از هستههای چندگانه در ساختار آن استفاده شود. به دلیل اینکه توابع هسته در هر کاربرد اختصاصی هستند لذا نمیتوان از یک هسته عمومی برای همه کاربردها استفاده کرد. در این مقاله برای بهینهسازی ترکیبهای بهینه توابع هسته پایه، از روشی تکاملی مبتنی بر الگوریتم ژنتیک (ga) استفاده شده است که با بهرهگیری از آن در فرآیند تصمیمگیری هر اَبَرصفحه tsvm، بهبود در تشخیص صفحات فریب حاصل گردیده است. برای پیادهسازی و ارزیابی روش پیشنهادی، از مجموعه دادگان uk2006 و uk2007 استفاده شده است که نتایج حاصل بیانگر موثر بودن ایده پیشنهادی در این پژوهش است.
|
کلیدواژه
|
موتور جستجو، صفحات وبفریب، رتبهبندی، یادگیری ماشین، ماشینبردارپشتیبان جفتی، هستههای چندگانه، الگوریتم ژنتیک
|
آدرس
|
دانشگاه یزد, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه یزد, دانشکده مهندسی برق و کامپیوتر, ایران
|
پست الکترونیکی
|
mohammadi_6468@stu.yazd.ac.ir
|
|
|
|
|