|
|
همبستگی میان معیارهای آماری در زبان بشر: بررسی موردی ترجمههای انجیل
|
|
|
|
|
نویسنده
|
مهری علی ,سبزعلی جماعتی ابهری مریم
|
منبع
|
كنفرانس فيزيك ايران - 1399 - دوره : 36 - کنفرانس فیزیک ایران ۱۳۹۹ - کد همایش: 99200-93529 - صفحه:0 -0
|
چکیده
|
همبستگیهای بلندبرد آماری از نمودهای پیچیدگی سامانه های بس ذره ای به شمار می آیند. قوانین زیف و هیپس، رفتار فرکتالی و محتوای اطلاعاتی (آنتروپی) پیچیدگی زبان بشر به عنوان پیشرفته ترین ابزار ارتباطی را آشکار میسازند. ما برای آشکار رابطه میان نمای زیف، نمای هیپس، بعد فرکتالی و آنتروپی در زبان بشر، برای صد ترجمه از کتاب انجیل آنها را استخراج نمودیم و ضریب همبستگی پیرسون را برای هر جفت ممکن از چهار معیار ذکر شده محاسبه نمودیم. با توجه به هم-بستگی/پادبستگی میان معیارها میتوان گفت که غنای ذخیره واژگانی زبان (بزرگ بودن نمای هیپس) توزیع ناهمگن تر واژگان در نوشتار (کوچک بودن آنتروپی و بزرگ بودن بعد فرکتالی) را در پی دارد.
|
کلیدواژه
|
فیزیک آماری ,متن کاوی ,همبستگی
|
آدرس
|
دانشگاه صنعتی نوشیروانی بابل. babol noshirvani university of technology, دانشگاه صنعتی نوشیروانی بابل. babol noshirvani university of technology
|
|
|
|
|
|
|
|
|
|
|
Correlation between statistical metrics in human language: A case study of the Bible translation
|
|
|
Authors
|
Mehri Ali ,Sabzali Jamaati Abhari Maryam
|
Abstract
|
Long-range statistical correlations are manifestations of complexity in many-body systems. Zipf’s and Heaps’ laws, fractality and information content (entropy) reveal the complexity of human language as the most advanced communication system. To identify the relationship between Zipf’s exponent, Heaps’ exponent, fractal dimension and entropy in human language, we extract them from one hundred translations of the holy Bible and calculate Pearson correlation coefficient for each possible pair of the mentioned statistical criteria. Due to the correlation/anti-correlation between the criteria, it can be concluded that the rich vocabulary of language (high Heaps’ exponent) leads to more heterogeneous distribution of words in the text (low entropy and high fractal dimension).
|
Keywords
|
|
|
|
|
|
|
|
|
|
|
|