• شماره ركورد كنفرانس
    4319
  • عنوان مقاله

    كاربست الگوريتم تخصيص ديريكله پنهان با تنظيم بهينه پارامترها در استخراج كلمات خبر محور از ميكروبلاگ ها

  • پديدآورندگان

    بهرامي محمدرضا mrbahrami62@yahoo.com كارشناس ارشد مهندسي عمران-سازه , حاتمي شهاب‌الدين hatami@yu.ac.ir استاديار گروه مهندسي عمران , زارع عبدالرضا zare@mail.yu.ac.ir استاديار گروه مهندسي عمران

  • تعداد صفحه
    7
  • كليدواژه
    استخراج موضوع , تخصيص ديريكله پنهان , متن¬كاوي.
  • سال انتشار
    1394
  • عنوان كنفرانس
    دومين همايش ملي مهندسي كامپيوتر و فناوري اطلاعات دانشگاه پيام نور
  • زبان مدرك
    فارسي
  • چكيده فارسي
    ميكروبلاگ در مقايسه با اسناد خوش ساختار مانند صفحات وب، مقالات خبري و بلاگ¬ها يك نوع كاملا متفاوت از متن است كه كوتاه و نويزي بوده و اين خصوصيات, جمع آوري اطلاعات زمينه¬اي و آماري را براي شناسايي موضوعات مورد نظر سخت¬تر مي‌كند. اين پژوهش جنبه‌هاي زير را براي شناسايي اخبار از ميكروبلاگ¬ها پوشش مي‌دهد: ابتدا خصوصيات متفاوت مانند محتويات، زمينه و فعاليت‌هاي توييتر، از ميكروبلاگ بررسي شده و سپس يك مدل تشخيص موضوع با استفاده از تكنيك‌هاي كاوش داده و الگوريتم تخصيص دريكله پنهان ايجاد شده است. در اين پژوهش، مدل-سازي كاوش و استخراج متن هاي كوتاه و شناسايي موضوعات خبري در ميكروبلاگ ها بررسي و نحوه كاربست الگوريتم تخصيص ديريلكه پنهان و تنظيم پارامترهاي آن با پياده سازي مدل معرفي شد و در زبان R نشان داده شده است.
  • كشور
    ايران