شماره ركورد :
1046663
عنوان مقاله :
همبستگي هاي بلندبرد آماري در زبان بشر: بررسي موردي زبان پارسي
عنوان به زبان ديگر :
Long-Range Statistical Correlations in Human Language: A Case Study in Persian Language
پديد آورندگان :
مهري، علي دانشگاه صنعتي نوشيرواني - دانشكده علوم - گروه فيزيك، بابل
تعداد صفحه :
11
از صفحه :
123
تا صفحه :
133
كليدواژه :
متن كاوي , همبستگي بلندبرد , قانون زيف , قانون هيپس , آنتروپي , بعد فركتالي
چكيده فارسي :
ساختار پيچيده زبان انسان، توانايي تبادل اطلاعات پيچيده را به ما ميدهد. اين سامانه ارتباطي از برخي قواعد آماري غيرخطي پيروي ميكند. ما چهار ويژگي آماري زبان پارسي را بررسي ميكنيم. يافته هاي ما با محاسبات روي شش اثر ارزشمند از انديشمندان پارسي گوي به دست آمده اند. دو قانون تواني زيف و هيپس در زبان پارسي برقرار هستند و با هم يك رابطه معكوس دارند. محتواي اطلاعاتي نوشتار، ناشي از چيدمان واژه‌ها توسط نويسنده، به كمك آنتروپي اندازه گيري ميشود. از اين معيار ميتوان در مرتب سازي واژه ها بر حسب ارتباطشان با موضوع نوشتار بهره برد. همچنين ما بعد فركتالي هر واژه در نوشتار را با روش جعبه شماري محاسبه ميكنيم. بعد فركتالي هر واژه، كه يك مقدار مثبت كوچكتر يا مساوي يك است، توزيع مكاني واژه در نوشتار را نمايش ميدهد. به طور كلي ميتوان ادعا كرد كه زبان پارسي مانند ديگر زبانهاي بررسي شده در پژوهش هاي پيشين از قوانين آماري ذكر شده پيروي ميكند.
چكيده لاتين :
Complex structure of human language enables us to exchange very complicated information. This communication system obeys some common nonlinear statistical regularities. We investigate four important statistical features of Persian language. We perform our calculations for adopted works of six famous Persian litterateurs. Zipf’s law and Heaps’ law, which imply well-known power-law behaviors, are established in this language, showing a qualitative inverse relation with each other. Furthermore, the informational content associated with the words ordering, is measured by using an entropic metric. This metric can be applied in words relevancy ranking process. We also calculate fractal dimension of words in the text by using box counting method. The fractal dimension of each word, that is a positive value less than or equal to one, exhibits its spatial distribution in the text. Generally, we can claim that the Persian language follows the mentioned statistical laws, like the other languages studied in previous works.
سال انتشار :
1397
عنوان نشريه :
پژوهش سيستم هاي بس ذره اي
فايل PDF :
7574329
عنوان نشريه :
پژوهش سيستم هاي بس ذره اي
لينک به اين مدرک :
بازگشت