شماره ركورد كنفرانس :
4817
عنوان مقاله :
معرفي پيكره «كودك علامه»: نخستين پيكره زبان گفتاري و نوشتاري كودكان فارسيزبان
عنوان به زبان ديگر :
Introducing KUDAKE Allameh Corpus: The First Speech and Writing Corpus of Persian Speaking Children
پديدآورندگان :
طاهري قلعهنو الهه elahetaheri96@yahoo.com دانشجوي دكتري زبانشناسي، دانشگاه علامه طباطبائي؛ , دبيرمقدم محمد mdabirmoghaddam@gmail.com عضوهيأت علمي دانشگاه علامه طباطبائي؛
كليدواژه :
پيكره زبان كودك , پيكره گفتاري , پيكره نوشتاري , كودك فارسيزبان , زبان فارسي
عنوان كنفرانس :
سومين همايش ملي زبان شناسي پيكره اي
چكيده فارسي :
هدف از نگارش اين مقاله معرفي پيكره «كودك علامه» پيكرۀ زبان گفتاري و نوشتاري كودكان فارسيزبان و شيوه گردآوري دادههاي آن است. براي جمعآوري دادههاي اين پيكره از 4 آزمون استفاده شد؛ دو آزمون گفتاري (خلق و بازگويي داستان) و دو آزمون نوشتاري (خلق و بازنويسي داستان). تمامي كودكان 7-12 ساله دختر و پسر شركتكننده، فارسيزبان تكزبانه بودند. اين پيكره 94000 واژهاي ميتواند ابزاري براي مطالعه رشد زبان كودكان فارسيزبان باشد. پژوهشگران هوش مصنوعي نيز ميتوانند از آن به عنوان منبع پردازش زبان طبيعي بهره ببرند. اين پيكره همچنين ميتواند با در اختيار قرار دادن فهرست واژگان پايه، هدف آموزشي نيز داشته باشد.
چكيده لاتين :
The purpose of this study is to introduce the metadata of KUDAKE Allameh corpus “The speech and written corpus of child language” and its collecting method. For this corpus, four tests were used to collect the data; two spoken tests (creation and retelling story) and two written tests (creation and rewriting story). All 7 to 12-year-old children were Persian monolingual girls and boys. This 94,000-word corpus can be a tool for studying the language development pattern of Persian speaking children. Artificial intelligence researchers can also use it as a source of natural language processing. By providing basic vocabulary lists, this corpus can also serve educational purposes.