>
Fa   |   Ar   |   En
   بهینه‌سازی هسته‌های چندگانه در ماشین‌بردارپشتیبان جفتی برای کاهش شکاف معنایی تشخیص صفحات فریب‌آمیز  
   
نویسنده زارع چاهوکی محمدعلی ,محمدی حمیدرضا
منبع مهندسي برق دانشگاه تبريز - 1395 - دوره : 46 - شماره : 4 - صفحه:135 -145
چکیده    موتورهای جستجو با خزش صفحات موجود در اینترنت و شاخص‌گذاری آن‌ها، قابلیت جستجوی سریع اطلاعات را به کاربران می‌دهند. یکی از چالش‌های مهم در استفاده از این ابزار، صفحاتی هستند که از آن‌ها به‌عنوان صفحات فریب‌آمیز نام‌ برده می‌شود. رویکردهای مختلفی جهت تشخیص صفحات فریب ابداع ‌شده است که می‌توان به روش‌هایی مانند سنجش میزان شباهت سبک کدهای صفحات، تحلیل الگوی زبانی صفحات و همچنین استفاده از روش‌های یادگیری ماشین بر اساس ویژگی‌های صفحات اشاره کرد. ازجمله الگوریتم‌های یادگیری ماشین که در این حوزه استفاده ‌شده است ولی نتایج قابل‌توجهی را ارائه نکرده، الگوریتم ماشین‌بردارپشتیبان (svm) است. استفاده از هسته در ساختار طبقه‌بند svm باعث می‌شود که داده‌هایی که دارای الگوی غیرخطی هستند با نگاشت به فضایی با ابعاد بیش‌تر بتوانند با مدل خطی تفکیک‌پذیر شوند. این کار باعث افزایش دقت تفکیک‌کنندگی مدل یادگیری ماشین می‌شود. اخیراً توسعه‌ایی از svm با نام svm جفتی (tsvm) ارائه‌ شده است که با تغییر در فرضیه اولیه آن، از دو اَبَرصفحه برای تفکیک نمونه‌های هر کلاس استفاده می‌کند و توانسته نتایج بهتری در طبقه‌بندی ارائه کند. به دلیل استفاده از دو ابرصفحه در tsvm، لذا بهتر است تا از هسته‌های چندگانه در ساختار آن استفاده شود. به دلیل اینکه توابع هسته در هر کاربرد اختصاصی هستند لذا نمی‌توان از یک هسته عمومی برای همه کاربردها استفاده کرد. در این مقاله برای بهینه‌سازی ترکیب‌های بهینه توابع هسته پایه، از روشی تکاملی مبتنی بر الگوریتم ژنتیک (ga) استفاده‌ شده است که با بهره‌گیری از آن در فرآیند تصمیم‌گیری هر اَبَرصفحه tsvm، بهبود در تشخیص صفحات فریب حاصل گردیده است. برای پیاده‌سازی و ارزیابی روش پیشنهادی، از مجموعه دادگان uk2006 و uk2007 استفاده ‌شده است که نتایج حاصل بیانگر موثر بودن ایده پیشنهادی در این پژوهش است.
کلیدواژه موتور جستجو، صفحات وب‌فریب، رتبه‌بندی، یادگیری ماشین، ماشین‌بردارپشتیبان جفتی، هسته‌های چندگانه، الگوریتم ژنتیک
آدرس دانشگاه یزد, دانشکده مهندسی برق و کامپیوتر, ایران, دانشگاه یزد, دانشکده مهندسی برق و کامپیوتر, ایران
پست الکترونیکی mohammadi_6468@stu.yazd.ac.ir
 
   Optimization of Multiple Kernels in Twin SVM for Decreasing Web Spam Page Detection Semantic Gap  
   
Authors
  
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved