Принципы работы поисковых систем
description
Transcript of Принципы работы поисковых систем
![Page 1: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/1.jpg)
Принципы работы поисковых систем
22 ноября 2012, Донецк
![Page 2: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/2.jpg)
Задача поисковой системы
![Page 3: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/3.jpg)
Задача поисковой системы
Показать страницы с запрошенным текстом
![Page 4: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/4.jpg)
Задача поисковой системы
Дать релевантный ответ на вопрос
Показать страницы с запрошенным текстом
![Page 5: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/5.jpg)
Задача поисковой системы
Дать релевантный ответ на вопрос
Показать страницы с запрошенным текстом
Порекомендовать качественные ресурсы, отвечающие на вопрос
![Page 6: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/6.jpg)
Задача поисковой системы
Дать релевантный ответ на вопрос
Показать страницы с запрошенным текстом
Порекомендовать качественные ресурсы, отвечающие на вопрос
Сделать пользователя счастливым...
![Page 7: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/7.jpg)
Составляющие работы ПС
![Page 8: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/8.jpg)
Составляющие работы ПС
1. Составление плана
2. Сбор данных3. Индексация
4. Вычисления5. Ранжирование
6. Оценка качества
![Page 9: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/9.jpg)
1. Составление плана
Цель ПС: Найти новые документы и расставить приоритеты их сканирования, составить расписание
Наша задача: Дать о себе знать
Данные: Ссылки и форма AddURL
![Page 10: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/10.jpg)
2. Сбор данных (Crawling)
Цель ПС: Быстро собрать данные со страниц сайта
Наша задача: Обеспечить оптимальное взаимодействие
• Индексируемый текст / HTML
• Отсутствие дублей
• Перелинковка
• Оптимизированная скорость загрузки
![Page 11: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/11.jpg)
Важно для бота-краулера
• HTTP-заголовки страниц
• Файл robots.txt
• Тег meta-robots
• Частота обновления сайта (модифицирует расписание)
![Page 12: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/12.jpg)
![Page 13: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/13.jpg)
3. Индексация
Цель ПС: Создать индекс для быстрого поиска
Наша задача: Предоставить разнообразный контент и оптимальные связи между документами
Тексты индексируются, связи преобразуются в графы
![Page 14: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/14.jpg)
4. Вычисления
Цель ПС: Расчитать метрики сайта по данным текстовых индексов, графов и др. свойств
Наша задача: Быть, а не казаться...
• Размер контента, кол-во ссылок, ...
• PageRank, TrustRank, SpamRank, ...
Множество алгоритмов построения ранков по разнообразным сигналам
![Page 15: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/15.jpg)
5. Ранжирование
Цель ПС: Рассортировать документы на базе расчитанных метрик в порядке ... (каком?) с учетом спектра интента
Что влияет на ранжирование помимо метрик сайта?
• Тип запроса
• Регион и язык поиска
• Персонализация
![Page 16: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/16.jpg)
![Page 17: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/17.jpg)
![Page 18: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/18.jpg)
6. Оценка качества
Цель ПС: Улучшить поисковую выдачу
Наша задача: Ответить страницей на вопрос, сделать сайт удобным, использовать микроразметку
• Количество кликов
• Кол-во и быстрота возвратов
• Кол-во переформулировок (дополнений)
• Кол-во просматриваемых страниц выдачи
![Page 19: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/19.jpg)
![Page 20: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/20.jpg)
Что дальше?
Для Яндекса и Google поиск закончился. А для вас?
• Продажи, подписки, скачивания...
• Конверсия, средний чек, ...
• Возвраты и доверие
С поисковиками нужно налаживать отношения, но они роботы, а сайт посещают реальные люди. Изучайте людей больше, чем поисковые системы и налаживайте отношения с ними в первую очередь!
![Page 21: Принципы работы поисковых систем](https://reader030.fdocument.pub/reader030/viewer/2022020206/5461ff66af7959d61d8b6674/html5/thumbnails/21.jpg)
Благодарю за внимание!
Web: http://devaka.ru
Google+ http://gplus.to/devaka
Twitter: @devakaru
E-mail: [email protected]
Телефон: +38 (097) 33-888-69
Кокшаров Сергей (Devaka) Специально для IT Donbass 2012