|
|
شناسایی چالشهای برگردان اسامی فارسی به انگلیسی در پایگاه وب آو ساینس
|
|
|
|
|
نویسنده
|
کاوه مهسا ,میرزابیگی مهدیه ,ستوده هاجر ,مولودی امیرسعید
|
منبع
|
پژوهشنامه پردازش و مديريت اطلاعات - 1399 - دوره : 35 - شماره : 4 - صفحه:1063 -1093
|
چکیده
|
هدف پژوهش حاضر، شناخت چالشهای برگردان نامهای فارسی به انگلیسی و فراوانی این چالشها در پایگاه «وبآوساینس » است. این پژوهش به لحاظ هدف، کاربردی و از نظر نحوه گردآوری دادهها، کمّی از نوع پیمایشی است. جامعه پژوهش شامل نامهای نویسندگان ایرانی در پایگاه «وبآوساینس » است که در بازه زمانی هفتساله 2010 تا 2017 مقاله انگلیسی نگاشتهاند. تعداد 3110873 نام در ابتدا بازیابی شد که پس از پالایش و یکدستسازی اسامی به 11242 نام تقلیل یافت. بهمنظور پالایش، آمادهسازی و تحلیل دادهها از نرمافزار «بیباکسل »، «اکسل » و پایگاه «وبآوساینس » استفاده شد. یافتههای پژوهش نشان داد که در برگردان نامها از فارسی به انگلیسی چهار گروه چالشهای مربوط به «همخوانها »، چالشهای مربوط به «واکهها »، چالشهای مربوط به «حذف یا تکرار حروف »، و چالشهای «تلفظی » وجود دارد. در دسته اول، چالشهای همخوانها، نویسندگان و نگارندگان در برگردان نامها در یازده حرف (8 واج)، شامل حروف ق، غ، ژ، ع، و، ک، ج، ک، ث، س، ص، صورتهای مختلف نگارشی داشتهاند. در دسته دوم، چالش واکهها، صورتهای نگارشی مختلفی در برگردان واکههای (/u/ ،/i/، توالی واجهای /e/ و /o/ ،/j/) و پایانه (ِه) از فارسی به انگلیسی مشاهده شد. در دسته سوم، وجود حروف مشدد و حروف (ال) در برخی نامها موجب بهوجود آمدن چندگانگی در نگارش نامها شده است. و در نهایت، در در دسته آخر، آواهای اَ و اِ، و همچنین حذف برخی حروف بهعلت تفاوت در تلفظ نامها در گویشها و زبانهای مختلف دچار چندگانگی شدهاند. با توجه به اهمیت بازیابی اسامی در جستوجوی نویسندگان و همچنین در ارزیابی پژوهش، راهکارهایی همچون استفاده از عملگرهای بولی و نویسه جایگزین بین صورتهای نگارشی غالب، ایجاد ساندکس زبان فارسی، مجهزکردن پایگاه به ابزارهای دانشی ویژه نام جهت یکدستی در برگردان نامها ضرورت دارد.
|
کلیدواژه
|
بازیابی اطلاعات، پایگاه وبآوساینس، برگردان انگلیسی به فارسی، چالشهای برگردان نامها
|
آدرس
|
دانشگاه شیراز, ایران, دانشگاه شیراز, ایران, دانشگاه شیراز, ایران, دانشگاه شیراز, بخش زبانهای خارجی و زبانشناسی, ایران
|
پست الکترونیکی
|
amirsaeid.moloodi@gmail.com
|
|
|
|
|
|
|
|
|
The Challenges of Transliteration of Persian Names to English, and their Impact on the Recall of Web of Science’s Retrieved Results
|
|
|
Authors
|
Kaveh Mahsa ,Mirzabeigi Mahdieh ,Sotudeh Hajar ,Moloodi Amirsaeid
|
Abstract
|
The present study investigated the challenges of transliteration of Persian names to English ones, and the impact of these challenges on the recall of web of science rsquo;s retrieved results. This study is applied in terms of objectives and quantitative (i.e., survey) in terms of data collection procedure. The population included the names of Iranian authors who had published an English article in Web of Science between 2010 and 2017. First of all, 3110873 names were retrieved. It was reduced to 11, 242 after homogenization process. Data was collected through Bibexcel and Excel software and Web of Science database. The findings showed that there were three types of challenges (i.e., vowels, consonants, and omitted or double consonants) in transliteration of Persian names to English ones. They resulted in nonhomogenous and different written forms. In addition, the results of Chisquare test showed that the frequency of all forms of the mentioned challenges had a significant effect on the recall of the retrieved results. Considering the importance of retrieving the names in retrieval studies as well as research studies rsquo; evaluation, some solutions such as using Boolean operators and wildcards between the prevailing typographical forms, creating Persian soundex, and equipping the database with the thesaurus are suggested.
|
Keywords
|
Recall ,Information Retrieval ,Studies’ Evaluation ,Transliteration of Persian Names to English ,Names Transliteration Challenges
|
|
|
|
|
|
|
|
|
|
|