عنوان مقاله :
استفاده از الگوريتمهاي يادگيري آماري ردهبندي در آمار رسمي
پديد آورندگان :
رضائي قهرودي ، زهرا دانشگاه تهران - دانشكده رياضي، آمار و علوم كامپيوتر , رنجي ، حسن مركز آمار ايران , رضايي ، عليرضا مركز آمار ايران
كليدواژه :
كدگذاري خودكار , متنكاوي , يادگيري آماري , آمار رسمي.
چكيده فارسي :
در اكثر آمارگيريها، پرسش مشاغل و فعاليتها از طريق پرسشهاي باز سوال ميشود و كدگذاري اين اطلاعات به هزاران رده به روش دستي صورت ميگيرد كه بسيار زمانبر و پرهزينه است. با توجه به ضروريات مدرنسازي نظام آماري كشورها، امروزه استفاده از روشهاي يادگيري آماري در آمار رسمي براي دادههاي اوليه و ثانويه ضروري است. همچنين، روشهاي ردهبندي يادگيري آماري در فرايند توليد آمار رسمي بسيار كاربرد دارد. هدف اين مقاله، كدگذاري برخي فرايندهاي آمارگيريها با روشهاي يادگيري آماري و آشنايي مديران در مورد امكان استفاده از روشهاي يادگيري آماري در توليد آمارهاي رسمي است. دو كاربرد از روشهاي يادگيري آماري ردهبندي شامل كدگذاري خودكار رشته فعاليتهاي اقتصادي و كدگذاري پرسشهاي باز پرسشنامههاي مراكز آماري با چهار روش تكرار، روش تركيبي ماشين بردار پشتيبان با تركيب مدلها در سطوح مختلف تجميع، تركيب روش تكرار و ماشين بردار پشتيبان و روش نزديكترين همسايه روي دادههاي آمارگيري از كارگاههاي صنعتي ايران انجام شده است.