معرفي پيكره «كودك علامه»: نخستين پيكره زبان گفتاري و نوشتاري كودكان فارسي‌زبان

عنوان به زبان ديگر

Introducing KUDAKE Allameh Corpus: The First Speech and Writing Corpus of Persian Speaking Children

پديدآورندگان

طاهري قلعه‎نو الهه elahetaheri96@yahoo.com دانشجوي دكتري زبان‌شناسي، دانشگاه علامه طباطبائي؛ , دبيرمقدم محمد mdabirmoghaddam@gmail.com عضوهيأت علمي دانشگاه علامه طباطبائي؛

تعداد صفحه

كليدواژه

پيكره زبان كودك , پيكره گفتاري , پيكره نوشتاري , كودك فارسي‏زبان , زبان فارسي

سال انتشار

1398

عنوان كنفرانس

سومين همايش ملي زبان شناسي پيكره اي

زبان مدرك

فارسي

چكيده فارسي

هدف از نگارش اين مقاله معرفي پيكره «كودك علامه» پيكرۀ زبان گفتاري و نوشتاري كودكان فارسي‌زبان و شيوه گردآوري داده‌هاي آن است. براي جمع‌آوري داده‌هاي اين پيكره از 4 آزمون استفاده شد؛ دو آزمون گفتاري (خلق و بازگويي داستان) و دو آزمون نوشتاري (خلق و بازنويسي داستان). تمامي كودكان 7-12 ساله دختر و پسر شركت‌كننده، فارسي‌زبان تك‌زبانه بودند. اين پيكره 94000 واژه‎اي مي‎تواند ابزاري براي مطالعه رشد زبان كودكان فارسي‌زبان باشد. پژوهشگران هوش مصنوعي نيز مي‎توانند از آن به عنوان منبع پردازش زبان طبيعي بهره ببرند. اين پيكره همچنين مي‎تواند با در اختيار قرار دادن فهرست واژگان پايه، هدف آموزشي نيز داشته باشد.

چكيده لاتين

The purpose of this study is to introduce the metadata of KUDAKE Allameh corpus “The speech and written corpus of child language” and its collecting method. For this corpus, four tests were used to collect the data; two spoken tests (creation and retelling story) and two written tests (creation and rewriting story). All 7 to 12-year-old children were Persian monolingual girls and boys. This 94,000-word corpus can be a tool for studying the language development pattern of Persian speaking children. Artificial intelligence researchers can also use it as a source of natural language processing. By providing basic vocabulary lists, this corpus can also serve educational purposes.

كشور

ايران

لينک به اين مدرک

https://search.isc.ac/dl/search/defaultta.aspx?DTC=36&DC=311441