ويژگيهاي آماري زبان پارسي

عنوان به زبان ديگر

Statistical Features of Persian Language

پديدآورندگان

مهري علي alimehri197@gmail.com گروه فيزيك، دانشكده علوم، دانشگاه صنعتي نوشيرواني، بابل؛ , جماعتي مريم m.sjamaati@gmail.com دانشكده فيزيك، دانشگاه علم و صنعت، تهران؛ , محمدپور سحر S.mohamadpoor1@yahoo.com گروه فيزيك، دانشكده علوم، دانشگاه صنعتي نوشيرواني، بابل؛

تعداد صفحه

كليدواژه

متن كاوي , قانون تواني , آنتروپي , بعد فركتالي , Text Mining , Power Law , Entropy , Fractal Dimension , 05 , 80 , 89

سال انتشار

1395

عنوان كنفرانس

كنفرانس فيزيك ايران 1395

زبان مدرك

فارسي

چكيده فارسي

ساختار پيچيده زبان انسان، توانايي تبادل اطلاعات پيچيده را به ما مي دهد. اين سامانه ارتباطي از برخي قواعد آماري غيرخطي پيروي مي كند. ما چهار ويژگي آماري زبان پارسي را بررسي مي كنيم. دو قانون تواني زيف و هيپس در زبان پارسي برقرار هستند و با هم يك رابطه ي معكوس دارند. محتواي اطلاعاتي نوشتار، ناشي از چيدمان واژه‌ها توسط نويسنده، به كمك آنتروپي اندازه گيري مي شود. همچنين ما بعد فركتالي هر واژه در نوشتار را با روش جعبه شماري محاسبه مي كنيم. يافته هاي ما با محاسبات روي شش اثر ارزشمند از انديشمندان پارسي گوي به دست آمده‌اند.

چكيده لاتين

Complex structure of human language enables us to exchange very complicated information. This communication system obeys some common nonlinear statistical regularities. We investigate four important statistical features of Persian language. We perform our calculations for adopted works of six famous Persian litterateurs. Zipf’s law and Heaps’ law, which imply well-known power-law behaviors, are established in this language, showing a qualitative inverse relation with each other. Furthermore, the informational content associated with the words ordering, is measured by using an entropic metric. We also calculate fractal dimension of words in the text by using box counting method.

كشور

ايران

لينک به اين مدرک

https://search.isc.ac/dl/search/defaultta.aspx?DTC=36&DC=228456