كليدواژه :
پيشبيني , درختتصميمC5 , سودآوري , خوشهبندي
چكيده فارسي :
امروزه سرمايهگذاران با توجه به فضاي رقابتي حاكم بايد محتاطتر از قبل تصميم بگيرند. به اين منظور آنها ميتوانند از بانكهاي اطلاعاتي بورس اوراق بهادار استفادهكنند. اما اين اطلاعات به تنهايي مثمرثمر نيست، بنابراين لازم است با استفاده از فنون دادهكاوي تجزيه، تحليل و تفسيردادهها انجام شود تا اطلاعات قابل اتكاتر ي در اختيار استفادهكنندگان قرارگيرد. هدف اين پژوهش خوشهبندي و پيشبيني سودآوري شركتها و تعيين عوامل موثر بر سودآوري شركتهاي عضو بورس اوراق بهادار تهران است. جهت اين كار، 888 شركت-سال در محدوده زماني 1395-1387 انتخاب شدند. پساز پيشپردازش اوليه دادهها، با نرمافزارهاي متلب و Clementine و با استفاده از معيار SSE و روش K-Means شركتها به 3 خوشه تبديل شدند و نتايج اين خوشهبنديها بوسيله معيار سنجش كيفيت، مورد سنجش قرار گرفت. در ادامه با استفاده از درختتصميم C5 خوشهها تحليل و متغيرهاي تاثيرگذار بر سودآوري، شناسايي شد. از32 متغير تحليل شده تنها 8 متغير شامل: سودخالص به كل دارايي ، فروش به كل دارايي، سودخالص به حقوق صاحبان سهام، سود عملياتي به فروش خالص، سود و زيان انباشته به حقوق صاحبان سهام، سودخالص به فروش خالص، كل بدهيها بهكل داراييها و داراييهاي جاري به كل داراييها بر سودآوري شركتها تاثير ميگذارند. در نهايت با درنظرگرفتن اين متغيرها، پيشبيني سودآوري شركت ها طبق هرخوشه انجام شد كه دقت پيشبيني خوشهها به ترتيب 34/86 درصد، 15/88 درصد و 68/81 درصد است.
چكيده لاتين :
The intense competition prevailing in the world today and investors should be more cautious about their decision given the prevailing conditions. But this information alone is not useful, so it is necessary to use data mining techniques to analyze and interpret data so that more informative information will be available to users. Therefore, the purpose of this study is to cluster and forecast the profitability of companies. For this purpose, Tehran Stock Exchange companies were considered as the statistical population of the research and 888 companies in the period of 1387-1395 were selected as the research sample. So, in the beginning after the initial preprocessing of the data, with Matlab and Clementine software, using SSE criteria and K-Means method, the companies were converted to 3 clusters and the result of these clustering were measured by the standard quality measures. Finally, by using the C5 decision tree, cluster analysis and variables affecting profitability were identified; so that from the 32 considered variables only 8 includes: Gross profit to total assets, sales to total assets, profit to equity, operating profit to net sales, accrued profit and loss to equity, net profit to net sales, total liabilities to total assets and current assets to total assets affect the profitability of companies. At last, by taking these variables into account, prediction of each cluster was done, and the accuracy of the predictions sequence was 86,34%, 88,15% and 68.81%