вторник, 6 октября 2020 г.

Урок 6-7. Поиск информации в сети. Поисковые системы

Дата проведения занятия 7.10.20

Поисковая система

Поисковая система - комплекс программных и аппаратных средств для автоматического просмотра ресурсов интернет, индексации их содержания и предоставления услуг по поиску информации интернет пользователям.
Поисковые системы могут отличаться по
  • эффективности поиска
  • языку поиска
  • и другим возможностям.

Одни поисковые системы находят информацию в виде веб-страниц, другие могут рассматривать и группы новостей и файловые серверы.

По методам поиска и обслуживания разделяют четыре типа поисковых систем: 
  • системы, использующие поисковых роботов
  • системы, управляемые человеком, 
  • гибридные системы, 
  • мета-системы[⇨]

 В архитектуру поисковой системы обычно входят:
  • поисковый робот, собирающий информацию с сайтов сети Интернет или из других документов,
  • индексатор, обеспечивающий быстрый поиск по накопленной информации, и
  • поисковик — графический интерфейс для работы пользователя[⇨].
Поисковые системы могут быть :

  • универсальные
  • специализированные
Наиболее популярные системы объединяют в себе оба типа.

Универсальные системы

В универсальных системах обычный принцип поиска в неструктурированных документах - по заданной строке поиска.
Большинство поисковым систем предоставляют пользователям также услуги интернет-почты, возможность создания веб-страниц, новости, курс валют и т.д.


Специализированные системы поиска

Поиск на картах
Возможности:

  • поиск адресов на карте
  • карты в форматах 2D и 3D
  • виртуальные туры (с фотографиями и панорамами)
Каталог
- данные, структурированные по темам в виде иерархических структур
Онлайновые энциклопедии и  справочники
- электронные версии бумажных словарей, энциклопедий
Получение информации по QR-коду


нередко на различных объектах (товарах, у памятников, на книгах, на веб-страницах) можно увидеть такую пометку (квадрат или прямоугольник или овал с черно-белыми точками внутри).  Это так называемый QR-код, придуманный в 1994 году японской компанией “Denso Wave”.






Поисковые указатели (Поисковые роботы, поисковые машины): (spiders, crawlers) постоянно исследуют Сеть с целью пополнения своих баз данных документов. Обычно это не требует никаких усилий со стороны человека. Для поисковых систем довольно важна конструкция каждого документа. 
Поисковая машина производит поиск информации по ключевым словам, указанным при регистрации сайта, по заголовку и ключевым словам, указанным в тексте HTML, и по тексту страниц. 
Пользователь для поиска ресурсов указывает ключевые слова, используя определенные правила (язык запросов). Эти правила – являются общими для всех поисковых систем, но бывают отличия, поэтому нужно ознакомиться с ними. Поисковая система образует из ключевых слов логические выражения и организует поиск в своей базе данных.
Алгоритмы сбора данных и алгоритмы поиска ресурса у разных поисковых систем различны. Поэтому результаты поиска по одним и тем же ключевым словам в разных системах – различны. 
Посмотрите, каковы результаты сравнения  поисковых систем Рунета в 2014-2015гг
А вот как выглядит та же статистика в  2019 году ( данные Яндекс-радар)
или статистика в 2019 (данные DrMax)
В настоящее время популярны метапоисковые системы, основанные на семантическом анализе. Как работает  поиск в Google?.




Комментариев нет:

Отправить комментарий

Примечание. Отправлять комментарии могут только участники этого блога.