شماره ركورد :
1045331
عنوان مقاله :
استخراج نشانه ها از اسناد مكاني در موتورهاي جستجو
عنوان به زبان ديگر :
Tags Extraction from Spatial Documents by Search Engines
پديد آورندگان :
برهاني نژاد، سعيد دانشگاه تهران - پرديس دانشكده هاي فني - دانشكده مهندسي نقشه برداري و اطلاعات مكاني , حكيم پور، فرشاد دانشگاه تهران - پرديس دانشكده هاي فني - دانشكده مهندسي نقشه برداري و اطلاعات مكاني , حمزه ئي، احسان دانشگاه تهران - پرديس دانشكده هاي فني - دانشكده مهندسي نقشه برداري و اطلاعات مكاني
تعداد صفحه :
16
از صفحه :
201
تا صفحه :
216
كليدواژه :
وب مكاني , موتورهاي جستجوي مكاني , اسناد مكاني , خزنده , جي ام ال , دسترسي انتخابي به اطلاعات
چكيده فارسي :
امروزه امكان دسترسي انتخابي به اطلاعات بر روي وب، از طريق موتورهاي جستجو فراهم مي­شود. اما در مواردي كه نياز ما در برگيرنده جستجو در اطلاعات مكاني نيز باشد وظيفه جستجو پيچيده ­تر مي­شود و احتياج به توانايي­ هاي خاصي در بخش جستجوگر است. هدف اصلي انجام اين پژوهش ايجاد بستري جهت استخراج اطلاعات مكاني نهفته در اسناد مكاني و پياده ­سازي و ارزيابي نگرش يكپارچه در بازيابي اين اطلاعات مي­باشد. نگرش كلي در بازيابي اطلاعات مكاني به نحوي است كه اين اطلاعات از طريق ارتباطي كه به اطلاعات غير مكاني دارند استخراج مي­شوند، در حالي كه در اسناد مكاني موجود اطلاعات مكاني و غيرمكاني به صورت يكپارچه ذخيره مي­گردند. در پژوهش‌هاي پيشين اسناد مكاني و اطلاعات موجود در آن­ها كمتر مورد توجه قرار گرفته است. منظور از نگرش يكپارچه در بازيابي اطلاعات مكاني، استخراج اطلاعات مكاني و توصيفي موجود در اسناد مكاني به صورت يكپارچه و همزمان مي­باشد. اجزاي تشكيل دهنده سيستم مبتني بر پژوهش حاضر شامل خزنده، پايگاه داده و واسط كاربري مي­باشد. در بخش خزنده، اسناد مكاني كشف شده و متن اين اسناد براي استخراج اطلاعات تجزيه مي‍شود. پايگاه داده در اين سيستم وظيفه ذخيره و شاخص­ گذاري اطلاعات استخراج شده توسط خزنده را برعهده دارد و در نهايت واسط كاربري تعامل بين سيستم و كاربر را فراهم مي­كند. اين سيستم به صورت آزمايشي برروي يك كارساز كاربري به عنوان يك شبيه سازي از فضاي وب پياده‌سازي شده است. پژوهش پيش رو با پياده ­سازي نگرش يكپارچه، اطلاعات مكاني را از اسناد مكاني بازيابي مي‌كند و به اين ترتيب گام مؤثري در بهبود كارايي موتورهاي جستجوي مكاني برمي‌دارد.
چكيده لاتين :
Nowadays the selective access to information on the Web is provided by search engines, but in the cases which the system includes spatial information the search task becomes more complex and requires special capabilities in the search engine system. The purpose of this study is to extract the information which lies in the GML documents also implementation and evaluation of this extracted information retrieval method in an integrated approach. Our proposed system consists of three components: crawler, database and user interface. 1- Crawler: The main innovation of this study is this component. Crawler is a piece of software that after receiving the initial feed enters into Web pages and open links on each page and enters into the pages of these links. The crawler repeats this for new pages until all pages are reviewed and there are no new pages. The typical spatial search engines crawlers analyze and process the HTML documents and extract spatial information contained in these documents. In our proposed system, the crawler processes GML documents text instead of HTML documents, and extracts the spatial information from these documents. Crawler in this system has two main tasks: - Detection of GML documents among the documents with different formats. - Parsing of GML documents and extracting the spatial information 2-Database: database has two major tasks in this system: - Storing data which collected by crawlers - Information indexing 3-User Interface: this section provides interaction between user and system and users send their queries to the system through this interface In general, this system's search process is done in two phases: online and offline. Offline phase includes the crawler's searching and storing the information into the database. and the online phase includes user interface and ranking operation. All in all, in this study the following objectives discussed: 1- Extraction of spatial information which is embedded in Web documents: Spatial documents include spatially explicit information such as the coordinates of the feature or the type of feature that extracting this information improves the response rate of spatial queries in search engines. 2- Implementation and evaluation of an integrated spatial information retrieval approach. We have implemented this system as a pilot system on an Application Server as a simulation of Web. Our system as a spatial search engine provided searching capability throughout the GML documents and thus an important step to improve the efficiency of search engines has been taken. Despite the fact that today's engineers and specialists in many fields need raw spatial data and looking for it on the World Wide Web, most of spatial search engines are based on map representation and less attention is paid to spatial data. There is a substantial volume of spatial documents and information on the Web, however, the extent of the Web has caused this huge volume of documents and information hard to find among other information.Our proposed system as a spatial search engine provides the possibility of searching throughout the GML documents and thus it improves the efficiency of spatial search engines. Since GML documents include explicit spatial information along with non-spatial information, the main advantage of this system compared to other spatial search engines is an integrated approach to spatial and non-spatial data.
سال انتشار :
1396
عنوان نشريه :
علوم و فنون نقشه برداري
فايل PDF :
7572534
عنوان نشريه :
علوم و فنون نقشه برداري
لينک به اين مدرک :
بازگشت