عنوان مقاله :
دراسة تاثير وزن الصفات الفئوية ( البارامتر (γ) ) على عنقدة البيانات المختلطة في التنقيب عن البيانات
پديد آورندگان :
حنا, جبر مخائيل جامعة تشرين - كلية الهندسة الميكانيكية والكهربائية - قسم هندسة الحاسبات والتحكم الالي, اللاذقية, سوريا , الكردي, فاتن فجر جامعة تشرين - كلية الهندسة الميكانيكية والكهربائية - قسم هندسة الحاسبات والتحكم الالي, اللاذقية, سوريا
چكيده فارسي :
يعتبر التنقيب عن البيانات من الابحاث التي حازت على اهتمام عدد كبير من الباحثين في جميع انحاء العالم، ويعود السبب في ذلك الى استخدامها على نطاق واسع في شتى المجالات البحثية والعلمية والاقتصادية والعسكرية، جاءت الحاجة الى التنقيب عن البيانات بسبب كم البيانات الهائل الذي نتعامل معه اليوم بسبب التطور السريع والمتزايد لتكنولوجيا المعلومات ونظم الاتصالات والانترنت، وقدمت حلاً بديلاً عن الطرق التقليدية السابقة والتي تعتمد على تخزين هذا الكم الهائل من البيانات ضمن قاعدة بيانات ومن ثم القيام بعمليات الاستعلام التي تتطلب وقتاً وجهداً كبيرين من قبل المبرمجين والحواسيب التي تطبق عليها هذه العمليات، علاوة على ان هذه التقنية يمكن من خلالها الكشف عن معرفة مخباة لم يكن ليتسنى لنا الوصول اليها باستخدام الطرق التقليدية السابقة. تم في هذا البحث دراسة تاثير وزن الصفات الفئوية على عنقدة البيانات المختلطة، حيث طبقت خوارزمية العنقدة K-prototypes على مجموعة بيانات Adult Dataset والتي تتالف من ست صفات عددية وتسع صفات فئوية، وتتضمن معلومات حول اشخاص من جنسيات مختلفة ولديهم وظائف متنوعة ومستويات ثقافية متتالية بالاضافة الى المستوى المعيشي لهم. تم اختيار صفتين عدديتين وثلاث صفات فئوية ثم تطبيق خوارزمية العنقدة K-prototypes على هذه الصفات مع اختيار لقيم وزن الصفات الفئوية ( البارامتر (y)) (0.25 ، 0.5 ، 0.75 ، 1) على الترتيب، ثم تم تطبيق المعيار Rand Index لقياس جودة العنقدة .
كليدواژه :
العنقدة , التنقيب عن البيانات , الصفات العددية , الصفات الفئوية
عنوان نشريه :
مجلة جامعة تشرين: العلوم الهندسية