ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ТЕЛЕКОММУНИКАЦИЙ ИМ. ПРОФ. М.А. БОНЧ-БРУЕВИЧА»
(СПбГУТ)
Кафедра безопасности информационных систем
ОТЧЁТ
по практической работе №1 на тему: «Поиск информации в сети Интернет. Браузеры»
по дисциплине «Основы интернет-технологий»
Выполнил: студент группы ИСТ-011, Гладышев М.Д.
«22» сентября 2021 г. ___________/Гладышев М.Д./
Принял: Исупова Е. А.
« » 2021 г. ___________/Е.А. Исупова
СОДЕРЖАНИЕ
«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ТЕЛЕКОММУНИКАЦИЙ ИМ. ПРОФ. М.А. БОНЧ-БРУЕВИЧА» 1
(СПбГУТ) 1
Цель работы 3
1 Поисковые системы: назначение, принцип работы. 4
2 Поисковая выдача. Релевантность и её оценка. 5
3 Назначение файлов Cookie и Cache. 9
4 Назначение и основные функции web-браузеров. Оценка качества браузера. 10
ЗАКЛЮЧЕНИЕ 15
Цель работы
Ознакомиться с принципами работы поисковых систем, выявить основные закономерности их работы. Исследовать функциональные характеристики web-браузеров. Выполнить сравнительную оценку web-браузеров по предлагаемым критериям качества.
1 Поисковые системы: назначение, принцип работы.
Основным назначением поисковых систем, является предоставление наиболее релевантной (соответствующей вашему запросу) информации за минимально возможное время.
Это значит, что для поисковых систем в современных реалиях существует два основных требования:
релевантность выдачи;
скорость предоставления этой выдачи.
Выполнение этих двух требований заставляет пользователя возвращаться в одну и ту же поисковую систему.
Именно для повышения релевантности своей выдачи и ее скорости предоставления, поисковые движки вкладывают огромные суммы денег, времени и энергии. Производят огромное количество аналитической информации, изучают действия пользователя и реакцию на ту или иную выдачу, изучают выдачу других систем, исследуют перемещения глаз пользователя и многое другое.
Общий принцип работы любой поисковой системы условно можно разделить на следующие этапы:
Сбор информации. Специальная программа сканирует веб-пространство, открывает каждый доступный для неё сайт и анализирует его по заданным алгоритмам.
Все документы закачиваются на сервер поисковой системы и создается база данных, которая содержит информацию о сайте.
На основе полученных по сайту данных проводится построения индекса. То есть определяется, какие данные на нём содержатся, к какой группе запросов относятся данный контент их можно отнести и так далее.
Программа определяет релевантность страницы, в момент, когда она получает пользовательский поисковый запрос, на его основе предоставляет перечень сайтов, которые по результатам индексирования содержат запрашиваемую информацию.
Сервис проводит ранжирование результатов выдачи. То есть выстраивает порядок ссылок, которые будут показаны пользователю, отправившему запрос.
2 Поисковая выдача. Релевантность и её оценка.
Релевантность страницы запросу - это анализ поисковой системой на сколько точно соответствует поисковая фраза заголовкам, мета-тегам, а также основному содержимому - контенту (текстовые факторы ранжирования).
Существует несколько подходов к оценке релевантности. Содержательная релевантность — соответствие ответов информационному запросу, определяемое неформальным путём. Формальная релевантность — соответствие, определяемое путём сравнения образа поискового запроса с поисковым образом ответа по определённому алгоритму.
Проведём поиск информации по тестовому набору запросов в разных поисковых системах.
Вопрос 1: “как создать !тест?”
Google: было найдено примерно 312 млн. страниц за 0,52 сек., без оператора “!” выводит на 46 млн. страниц меньше, что говорит об отличии поиска с оператором. Выданные ссылки соответствуют запросам.
рис 1. Поисковой запрос в Google
рис 2. Поисковой запрос в Google
Яндекс: было найдено примерно 11 млн. результатов, что в разы меньше, чем у Google, в начале поисковик выводит краткий ответ по пунктам, без оператора вывод поисковика точно такой же, что и без него.
рис 3. Поисковой запрос в Yandex
Bing: было также найдено примерно 10,6 млн. сайтов, в начале, после рекламной ссылки, поисковик выводит краткий ответ, оператор не влияет на количество и вывод страниц.
рис 4. Поисковой запрос в Bing
Вопрос 2: “ как написать + отчёт "курсовой работы" -лабораторная?”
Google: было найдено примерно 307 тыс. страниц за 0,48 сек., без операторов + и «» выводит 7,25 млн. страниц.
рис 5. Поисковой запрос в Google
Яндекс: было выведено примерно 39 тыс. страниц. Исключая операторы + и «», получаем 13 млн. результатов.
рис 6. Поисковой запрос в Yandex
Bing: было выведено примерно 1,03 млн. сайтов, без операторов – 14,5 тыс. результатов, причём первые 4 ссылки – реклама.
рис 7. Поисковой запрос в Bing