среда, 20 октября 2021 г.

Урок 8. Сравнение поисковых систем. Решение задач

Дата проведения занятия 21.10.21

Часть1. Сравнение поисковых систем


Для самостоятельного изучения.
В настоящее время популярны метапоисковые системы, основанные на семантическом анализе. Как работает  поиск в Google?.
В этой статье вы найдете ответ на вопрос, почему у разных поисковых систем разная поисковая выдача.
А в этой статье найдете ответ на вопрос, от  чего зависит доверие  поисковых систем к продвигаемому сайту.

Часть2. Решение задач

1. Вычисление количества запросов

Задачи, связанные с построением сложных запросов, удобно решать с помощью  Диаграмм Эйлера-Венна

В этой Презентации рассмотрены типовые задачи на построение запросов

2. Сетевые технологии. Адресация в сети 

Разберите URL. Укажите: протокол, адрес сайта, путь к файлу, имя файла
https://www.blogger.com/blog/post/edit/40140.htm
Смотри урок 4-5 
Сетевые протоколы и адресация компьютеров в Интернет

3. Количество информации. Передача данных по сети

Для решения этих задач необходимо повторить единицы измерения количества информации и их соотношения.
Информационный вес символа i (Количество информации i в сообщении об одном из N равновероятных событий) вычисляется так:
2i = N
Количество информации I в сообщении из k символов некоторого алфавита, в котором N различных знаков:
I = k*i, где i вычисляется из формулы 2i = N
Скорость передачи информации измеряется в битах в секунду и вычисляется по формуле:
V = I/t , где I  - количество информации,  t - время передачи информации  

Задача
1. Документ объёмом 80 Мбайт надо передать с одного компьютера на другой
Сколько времени это займет, если: средняя скорость передачи данных по каналу связи составляет 220 бит в секунду.
Решение
t =  / V, где I = 80 Мбайт, V = 220 бит в секунду

Данные надо привести к одинаковым единицам измерения, лучше сделать это в виде степеней с основанием 2: 2K
Ответ: 640 сек

4. Решите задачи на вычисление количества запросов 

Создайте копию документа и в документе к каждой задаче покажите решение. Ссылка на задачи

5. Решите задачи на передачу данных по сети с сайта К. Полякова

КИМ 7 (200, 201, 202, 203)

среда, 6 октября 2021 г.

Урок 6-7. Поиск информации в сети. Поисковые системы

Дата проведения занятия 7.10.21, 14.10.21

Поисковые системы

Поисковая система - комплекс программных и аппаратных средств для автоматического просмотра ресурсов интернет, индексации их содержания и предоставления услуг по поиску информации интернет пользователям.
Поисковые системы могут отличаться по
  • эффективности поиска
  • языку поиска
  • и другим возможностям.

Одни поисковые системы находят информацию в виде веб-страниц, другие могут рассматривать и группы новостей и файловые серверы.

Классификация поисковых систем по методам поиска и обслуживания: 
  • системы, использующие поисковых роботов
  • системы, управляемые человеком, 
  • гибридные системы, 
  • мета-системы. 

Работа поисковых систем — общие принципы

Подробнее читайте статью Принципы работы поисковых систем

 Каждая поисковая система имеет свой алгоритм поиска запрашиваемой пользователем информации. Алгоритмы эти сложные и чаще держатся в секрете. Однако общий принцип работы поисковых систем можно считать одинаковым. Любой поисковик:
  • Сначала собирает информацию, черпая её со страниц сайтов и вводя её в свою базы данных;
  • Индексирует сайты и их страницы, и переводит их из базы данных в базу поисковой выдачи;
  • Выдает результаты по поисковому запросу, беря их из базы проиндексированных страниц;
  • Ранжирует результаты (выстраивает результаты по значимости).


Всю работу поисковых систем выполняют специальные программы и комбинации этих программ.


Перечислим основные составляющие поисковых систем:

  • Spider (паук) – это браузероподобная программа, скачивающая веб-страницы. Заполняет базу данных поисковика.
  • Crawler (краулер, «путешествующий» паук) – это программа, проходящая автоматически по всем ссылкам, которые найдены на странице.
  • Indexer (индексатор) – это программа, анализирующая веб-страницы, скачанные пауками. Анализ страниц сайта для их индексации.
  • Database (база данных) – это хранилище страниц. Одна база данных это все страницы загруженные роботом. Вторая база данных это проиндексированные страницы.
  • Search engine results engine (система выдачи результатов) – это программа, которая занимается извлечением из базы данных проиндексированных страниц, согласно поисковому запросу.
  • Web server (веб-сервер) – веб-сервер, осуществляющий взаимодействие пользователя со всеми остальными компонентами системы поиска.
Поисковые системы могут быть :

  • универсальные
  • специализированные
Наиболее популярные системы объединяют в себе оба типа.

Универсальные системы

В универсальных системах обычный принцип поиска в неструктурированных документах - по заданной строке поиска.
Большинство поисковым систем предоставляют пользователям также услуги интернет-почты, возможность создания веб-страниц, новости, курс валют и т.д.

Специализированные системы поиска

Поиск на картах
Возможности:
  • поиск адресов на карте
  • карты в форматах 2D и 3D
  • виртуальные туры (с фотографиями и панорамами)
Каталог - данные, структурированные по темам в виде иерархических структур
Онлайновые энциклопедии и  справочники
- электронные версии бумажных словарей, энциклопедий
Получение информации по QR-коду


нередко на различных объектах (товарах, у памятников, на книгах, на веб-страницах) можно увидеть такую пометку (квадрат или прямоугольник или овал с черно-белыми точками внутри).  Это так называемый QR-код, придуманный в 1994 году японской компанией “Denso Wave”.







Прочитайте несколько интересных статей
Принципы работы поисковых систем