شماره ركورد كنفرانس :
5412
عنوان مقاله :
طبقهبندي صفحههاي وب بر اساس كيفيت بهينهسازي موتور جستجو به كمك الگوريتم جنگل تصادفي
عنوان به زبان ديگر :
Classification of Web Pages based on Search Engine Optimization Quality using Random Forest Algorithm
پديدآورندگان :
شريعتيپور محمدحسين mhshariatipour@semnan.ac.ir دانشجوي كارشناسي ارشد، مهندسي كامپيوتر، دانشگاه سمنان، سمنان , رحمانيمنش محمد rahmanimanesh@semnan.ac.ir استاديار، مهندسي كامپيوتر، دانشگاه سمنان، سمنان , پارسه محمدجواد parseh@jahromu.ac.ir مربي، مهندسي كامپيوتر، دانشگاه جهرم ، جهرم
كليدواژه :
بهينهسازي موتور جستجو , يادگيري ماشين , يادگيريتركيبي , طبقهبندي صفحات وب , الگوريتم جنگلتصادفي
عنوان كنفرانس :
نهمين كنفرانس بين المللي وب پژوهي
چكيده فارسي :
در عصري كه رتبهبندي در صفحات نتايج موتور جستجو ارتباط مستقيمي با افزايش تعداد بازديدكنندگان و درنتيجه آن پيشرفت و توسعه يك كسبوكار دارد، بهينهسازي موتور جستجو يا سئو فرآيندي است كه به كسب رتبه بالاتر كمك ميكند. وبسايتها را ميتوان به كمك تكنيكهاي يادگيري ماشين بر اساس كيفيت تنظيم دستورالعملهاي سئو طبقهبندي كرد. الگوريتمهاي طبقهبندي باهدف افزايش دقت طبقهبندي با يكديگر تركيب ميشوند و بهعنوان يك مدل طبقهبندي تركيبي استفاده ميشوند. در اين مقاله يك مدل طبقهبندي تركيبي را به كمك الگوريتم جنگل تصادفي پيادهسازي ميكنيم كه صفحات وب را در يكي از طبقهبندهاي از پيش تعريفشده بر اساس كيفيت سئو قرار ميدهد. نتايج بهدستآمده نشان ميدهد كه دقت مدل ساختهشده بين 50/70% تا 13/73% است و نسبت به كارهاي قبلي كه در آنها از الگوريتمهاي طبقهبندي تركيبي استفادهنشده است دقت بالاتري دارد. مدل ساختهشده ميتواند به توسعهدهندگان نرمافزار براي ساخت نرمافزارهاي خودكار تشخيص كيفيت سئو صفحات وب كمك كند.
چكيده لاتين :
In the evening where ranking on the search engine result pages is directly related to increasing the number of visitors and the progress and development of a business, search engine optimization or SEO is a process that helps to gain a higher ranking. Websites can be classified with the help of machine learning techniques based on the quality of setting SEO guidelines. Classification algorithms are combined with each other with the aim of increasing classification accuracy and are used as an ensemble classification model. In this article, we implement an ensemble classification model with the help of a random forest algorithm, which places web pages in one of the predefined classes based on SEO quality. The obtained results show that the accuracy of the constructed model is between 70.50% and 73.17% and is more accurate than previous works in which ensemble classification algorithms were not used. The built model can help developers build automatic software for detecting the SEO quality of web pages.