23 December 2006 20:15
Проблемы современных поисковых систем
С появлением сети Интернет возникло множество проблем, по сути так и не разрешенных по сей день. Одним из основных недостатков является протокол HTTP, который используется для передачи информации и по сути подходит лишь для навигации по сайтам, и в то же время не очень удобен для их поиска по ней. То же самое можно сказать и о протоколе передачи файлов FTP, который даже более примитивен, чем HTTP, и предназначен только для передачи данных.
Основная проблема современной Сети состоит в том, что эти протоколы не позволяют отслеживать изменение информации. Учитывая, что на сегодняшний день в Сети находятся миллиарды страниц, отыскать быстро или вообще найти нужную и актуальную информацию уже не представляется возможным. Нужно учитывать и тот факт, что информация, размещенная на этих страницах, подвергается постоянным изменениям и, хотя уже появился механизм получения данных по RSS, однако далеко не на всех сайтах он есть.
Классификация современных поисковых систем
Поисковые системы, как известно, предназначены для поиска информации в разнообразых массивах данных. Как правило, поисковые системы разделяют на несколько классов, причем каждый из этих классов предназначен для решения различных задач.
Поисковые каталоги
Для того, чтобы как-то упростить задачу навигации по существующим ресурсам, были созданы системы, названные поисковыми каталогами или просто каталогами. Яркими представителями поисковых каталогов на Западе являются Yahoo и Open Directory, в России Mavica.net, List.ru, в Украине - Topping, UaPortal и др.
В таких каталогах сайты регистрируются их создателями, после чего проходят проверку модераторами, имеющими право изменять описание и рубрику регистрируемого ресурса по собственному усмотрению так, чтобы максимально приблизить его к тематике самого сайта. Кроме того, часто модераторами также оценивается и полезность ресурса, в результате чего каждый ресурс получает экспертную оценку, которая помогает пользователям находить наиболее авторитетные сайты по интересующим их темам.
1
(2 marks)