عنوان مقاله :
تحليل متني خبرهاي بانك مركزي در پيشبيني بلندمدت شاخص بورس اوراق بهادار تهران
عنوان به زبان ديگر :
Textual analysis of central bank news in forecasting long-term trend of Tehran stock exchange index
پديد آورندگان :
هاشمي، ميثم دانشگاه اصفهان , رضايي، مهران دانشگاه اصفهان - دانشكده مهندسي كامپيوتر , كائدي، مرجان دانشگاه اصفهان - دانشكده مهندسي كامپيوتر
كليدواژه :
شاخص كل بورس تهران , پيش بيني بلندمدت , تحليل متني , اخبار مالي , وزن دهي DF
چكيده فارسي :
بازارهاي مالي همواره تحت تاثير انتشارات رسانههاي خبري بودهاند. به همين دليل تحليل اسناد خبري به عنوان يك رهيافت براي پيشبيني بورس اوراق بهادار به كار رفته است. در تحقيقات پيشين در اين زمينه، تحليل اسناد متني با استفاده از روشهاي رايج در بازيابي اطلاعات انجام گرفته است. مبناي آماري اين روشهاي رايج بر اين است كه كلماتي كه در مجموعه اسناد كمتكرار هستند ولي در يك سند پرتكرار هستند، نسبت به كلمات پرتكرار مجموعه و سند، وزن بالاتري بگيرند. ولي مشكل اين است كه برخلاف آنچه در تحقيقات قبلي در نظر گرفته شده است، در اسناد خبري، كلمات پرتكرار نشاندهنده خبرهاي مهم و تاثيرگذار هستند. در اين تحقيق براي رفع اين مشكل، يك روش جديد براي وزندهي كلمات اسناد خبري ارائه شده است. روش پيشنهادي روي دادههاي شاخص كل بورس اوراق بهادار تهران و اسناد خبري بانك مركزي ايران در بازه زماني 1384 تا 1399 ارزيابي شده است. نتايج حاكي از 64 درصد صعودي و 41 درصد نزولي دقت پيشبيني نوسانات شاخص كل و كاهش 10 درصد ميانگين درصد خطاي مطلق نسبت به بهترين روش رايج ميباشد. همچنين نتايج نشان ميدهد كه اگرچه تغييرات در نسبت بين تعداد كلمات مثبت و منفي شواهد پيش گويانه اي ارائه نميكند اما بين خبرهاي منتشرشده از سوي بانك مركزي و نوسانات شاخص كل بورس تهران ارتباط وجود دارد.
چكيده لاتين :
Financial markets have always been under influence of media news; therefore, text analysis of news is considered as an effective method of stock exchange forecasting. Research in this context has been conducted with the help of information retrieval techniques, in which high frequency words in a document that appeared sporadically in the whole corpus received higher weight than others. In contrast, the words which appeared in many news of a corpus, during a certain time, indicate the importance of an event. In our research, to address this contradiction, a new technique of assigning weight to influential words of news is presented. Financial news of Iran Central Bank (CBI) and actual data of Tehran Stock Exchange Index (TSEI) in the duration of 2005 to 2020 AD were utilized to evaluate the proposed method. The empirical results show 64% and 41% accuracy of trend prediction when TSEI moves upward and downward respectively and about 10% decreasing in Mean Absolute Error (MAE) to compare with prevalent techniques. While, the changes of the ratio between the number of positive and negative words in news does not offer predictive or analytical evidences, our results show that, there still exists a meaningful relationship between CBI news and TSEI fluctuations.
عنوان نشريه :
فناوري اطلاعات و ارتباطات ايران