توضیحات:
ترجمه مقاله رشته کامپیوتر و IT- ترتیب بندی خیزش با استفاده از اثرگذاری بر جستجو با عنوان لاتین Crawl Ordering by Search Impact در 11 صفحه لاتین و 29 صفحه ترجه فارسی در قالب word و قابل ویرایش همراه با توضیحات کامل
چکیده فارسی:
در این مقاله چگونگی اولویت بندی واکشی صفحات جدید را به منظور به حداکثر رساندن کیفیت نتایج جستجو بررسی می کنیم. هدف ما، واکشی صفحات جدیدی است که بیشترین اثر را داشته، که اثرگذاری یک صفحه برابر با تعداد دفعاتی است که صفحه در K نتیجه ی برتر جستجو با مقدار ثابت K=10 ظاهر می شود. از آنجایی که اثرگذاری یک صفحه به ارتباط آن با موضوع جستجو و محتوای صفحه بستگی دارد که مشکل اصلی آن در رابطه با تخمین زدن اثر یک صفحه قبل از واکشی واقعی آن است. از این رو، میزان اثرگذاری باید براساس اطلاعات محدودی تخمین زده شود که قبل از واکشی محتوای صفحه، مثلاً رشته ی URL، تعداد لینک های داخلی و متن مرجع، در دسترس هستند.
ما این مسأله را مشخص کرده و میزان سختی آن را بررسی می کنیم. از صورت ظاهری خود برای طراحی روش جدید خیزشی اثرگذار استفاده کرده و اثربخشی آن را با استفاده از اطلاعات بدست آمده از دنیای واقعی اثبات می کنیم. این تکنیک تضمین می کند که خزنده به محتوای مربوط به "موضوعات پس آن" دست یافته که این موضوعات مشکوک هستند اما بعضی از کاربران به جای جمع آوری محتوای موضوعات معروف، به آنها علاقه دارند.
چکیده لاتین:
We study how to prioritize the fetching of new pages under the objective of maximizing the quality of search results. In particular, our objective is to fetch new pages that have the most impact, where the impact of a page is equal to the number of times the page appears in the top K search results for queries, for some constant K, e.g., K = 10. Since the impact of a page depends on its relevance score for queries, which in turn depends on the page content, the main difficulty lies in estimating the impact of the page before actually fetching it. Hence, impact must be estimated based on the limited information that is available prior to fetching page content, e.g., the URL string, number of in-links, referring anchortext. We formally characterize this problem and study its hardness. We leverage our formalism to design a new impactdriven crawling policy, and demonstrate its effectiveness using real world data. Our technique ensures that the crawler acquires content relevant to “tail topics” that are obscure but of interest to some users, rather than just redundantly accumulating content on popular topics.
** دانلود رایگان مقاله انگلیسی **