Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.


Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть 

Яндекс.Метрика

Презентация на тему Как работают Яндекс.Новости

Содержание

Задачи Яндекс.НовостейМиссия Яндекса – отвечать на заданные и незаданные вопросы пользователейЯндекс.Новости:На главной странице Яндекса удовлетворяют потребность пользователей в актуальной информацииНезаданный вопрос: «Что сейчас происходит?»В Поиске отвечают на явно сформулированные вопросы пользователейЗаданные вопросы: «синагога в Твери», «Хамовнический
Как работают Яндекс.Новости   Татьяна Исаева Задачи Яндекс.НовостейМиссия Яндекса – отвечать на заданные и незаданные вопросы пользователейЯндекс.Новости:На главной Модель сервиса Обеспечивают быструю трансляцию контента  (~40 тыс. сообщений в сутки) Принципы Яндекс.НовостейПолностью автоматический сервисПартнерский сервисЕдиные требования для всех партнеровЗеркало русскоязычной медиа-среды Цели: Релевантный новостной ответ Алгоритм, формирующий ответ на новостные запросы пользователей, ориентируется на Требования к сообщениюФормат (не подходят для трансляции реклама; не обработанные силами редакции Что такое *дубликат  Дубликаты – документы, в большой степени совпадающие с Статистика «копипейста»Доля дубликатов сообщений в российских интернет-СМИ - 20%Доля изданий, которые ни Сюжет в Яндекс.Новостях Создание поискового запроса из ключевых слов  документа, построение матрицы близости документов Выбор заголовка сюжетаСоответствие региону пользователяЛексическая и фактологическая «ядерность»Актуальность фактовИнформативность и читаемость Цель: Создание аннотации сюжета (дайджеста) Из всех сообщений сюжета автоматически выделяются наиболее значимые Аннотация сюжета. Информативность Заголовок сюжета.  «Ядерность» лексики Выбор основных заголовков сюжетаЦитирование  источника  в сюжетеДата публикацииВес источника Цель: Выбор заголовков для первой страницы. Цитируемость в сюжете Определение жанра сообщенияЛента – короткие новостные сообщенияНовость – более развёрнутое сообщениеИнтервью – Выбор главных новостных сюжетов Цель:  отобрать самые освещаемые в СМИ, общезначимые, Определение веса сюжета Время создания  Вес источника  Соответствие  тематики Вес источника Цитируемость учитывает, насколько часто ссылаются на источник другие новостные ресурсы Топ-10 самых цитируемых агентств  (в алфавитном порядке) «Ведомости» «Интерфакс» «ИТАР-ТАСС» «Коммерсант» Робот и человек в Яндекс.НовостяхЧеловекПринимает решение о сотрудничествеУдаляет ссылку на сообщение из Спасибо за внимание! Вопросы?   info@news.yandex.ru   Татьяна Исаева, руководитель
Слайды презентации

Слайд 2 Задачи Яндекс.Новостей
Миссия Яндекса – отвечать на заданные и

Задачи Яндекс.НовостейМиссия Яндекса – отвечать на заданные и незаданные вопросы пользователейЯндекс.Новости:На

незаданные вопросы пользователей
Яндекс.Новости:
На главной странице Яндекса удовлетворяют потребность пользователей

в актуальной информации
Незаданный вопрос: «Что сейчас происходит?»
В Поиске отвечают на явно сформулированные вопросы пользователей
Заданные вопросы: «синагога в Твери», «Хамовнический суд», «танцующий мост в Волгограде»

Слайд 3 Модель сервиса


Обеспечивают быструю трансляцию контента (~40 тыс.

Модель сервиса Обеспечивают быструю трансляцию контента (~40 тыс. сообщений в сутки)

сообщений в сутки)
Получают читателей (1,5 млн переходов в

сутки)

Узнают новости на Яндексе (15 млн человек в сутки)
Читают подробности у источников (1 млн человек в сутки)
Задают вопросы о новостях (500 тыс. запросов в сутки)

Читатели

Издания


Слайд 4 Принципы Яндекс.Новостей
Полностью автоматический сервис
Партнерский сервис
Единые требования для всех

Принципы Яндекс.НовостейПолностью автоматический сервисПартнерский сервисЕдиные требования для всех партнеровЗеркало русскоязычной медиа-среды

партнеров
Зеркало русскоязычной медиа-среды
Цели: отразить новостную картину дня и дать

ссылки на источники, содержащие наиболее полную информацию о событиях


Слайд 5 Релевантный новостной ответ
Алгоритм, формирующий ответ на новостные

Релевантный новостной ответ Алгоритм, формирующий ответ на новостные запросы пользователей, ориентируется

запросы пользователей, ориентируется на следующие свойства сообщений:
принадлежность первоисточнику
оперативность
цитируемость
информативность
Источники,

у которых доминируют такие сообщения, предлагаются пользователям в первую очередь.

Слайд 6 Требования к сообщению
Формат (не подходят для трансляции реклама;

Требования к сообщениюФормат (не подходят для трансляции реклама; не обработанные силами

не обработанные силами редакции пресс-релизы; новости сайта; аудио- и

видеоматериалы, не сопровождаемые связным печатным текстом; таблицы и списки, не сопровождаемые связным печатным текстом)
Технология (если текст сообщения на сайте был изменён, необходимо поместить его в экспортный файл в изменённом виде или прислать запрос на удаление неактуального сообщения)
Требования законодательства (аккуратное цитирование; нормы литературного русского языка)


Слайд 7 Что такое *дубликат
Дубликаты – документы, в

Что такое *дубликат Дубликаты – документы, в большой степени совпадающие с

большой степени совпадающие с оригинальным сообщением. Они автоматически определяются

до формирования сюжета, не представлены в сюжетах и не участвуют в поиске по сервису.
Из каждой группы дубликатов остается по одному сообщению («мастеру»), которое может быть представлено на страницах сюжета и в результатах поиска. «Мастер» определяется:
по времени публикации сообщения на сайте;
по сравнительному анализу текстов;
по цитированию источника (учитываются гиперссылки, текстовые упоминания).


Слайд 8 Статистика «копипейста»
Доля дубликатов сообщений в российских интернет-СМИ -

Статистика «копипейста»Доля дубликатов сообщений в российских интернет-СМИ - 20%Доля изданий, которые

20%
Доля изданий, которые ни разу не перепечатывали чужие материалы

«вчистую» - тоже 20%
Доля сообщений, содержащих ссылки на первоисточники (названия других СМИ или гиперссылки) – всего 8%
По данным аналитического отчета Яндекса «Медиасфера Рунета», зима 2009
http://download.yandex.ru/company/yandex_on_russian_internet_media_winter_2009.pdf

Слайд 9 Сюжет в Яндекс.Новостях






Сюжет в Яндекс.Новостях

Слайд 10






Создание поискового запроса из ключевых слов документа, построение

Создание поискового запроса из ключевых слов документа, построение матрицы близости документов

матрицы близости документов
Аннотирование сюжета: выбор заголовка и фрагментов

сообщений, содержащих основные факты сюжета


Выбор основных заголовков сюжета



Выбор статей и интервью


Схема создания сюжета


Слайд 11 Выбор заголовка сюжета
Соответствие региону пользователя
Лексическая и фактологическая «ядерность»
Актуальность

Выбор заголовка сюжетаСоответствие региону пользователяЛексическая и фактологическая «ядерность»Актуальность фактовИнформативность и читаемость

фактов
Информативность и читаемость
Цель: первый по времени заголовок, наиболее полно

отражающий актуальную фактическую сторону сюжета, не содержащий нехарактерных для сюжета слов и фактов.



Слайд 12 Создание аннотации сюжета (дайджеста)

Из всех сообщений сюжета

Создание аннотации сюжета (дайджеста) Из всех сообщений сюжета автоматически выделяются наиболее

автоматически выделяются наиболее значимые объекты, имена людей, названия организаций,

географические объекты, даты и числа. Они, наряду с ключевыми словами сюжета и новостными запросами, определяют выбор текстов для аннотации.

Цель: показать предложения из сообщений, содержащие основные факты события

Слайд 13 Аннотация сюжета. Информативность




























Аннотация сюжета. Информативность

Слайд 14
Заголовок сюжета. «Ядерность» лексики



Заголовок сюжета. «Ядерность» лексики

Слайд 15 Выбор основных заголовков сюжета


Цитирование источника в сюжете
Дата публикации
Вес

Выбор основных заголовков сюжетаЦитирование источника в сюжетеДата публикацииВес источника Цель: Должны

источника
Цель: Должны быть представлены первоисточник(и), наиболее цитируемые источники и заголовки,

отражающие актуальное состояние сюжета



Слайд 16 Выбор заголовков для первой страницы. Цитируемость в сюжете

Выбор заголовков для первой страницы. Цитируемость в сюжете





Слайд 17 Определение жанра сообщения
Лента – короткие новостные сообщения
Новость –

Определение жанра сообщенияЛента – короткие новостные сообщенияНовость – более развёрнутое сообщениеИнтервью

более развёрнутое сообщение
Интервью – диалог, оформленный по правилам пунктуации

русского языка
Статья – большой по объёму текст (от 500 слов), представляющий собой анализ события, ситуации etc, в котором представлены разные точки зрения

Слайд 18 Выбор главных новостных сюжетов
Цель: отобрать самые освещаемые

Выбор главных новостных сюжетов Цель: отобрать самые освещаемые в СМИ, общезначимые,

в СМИ, общезначимые, актуальные и вызывающие интерес пользователей события.


Слайд 19 Определение веса сюжета


Время создания
Вес источника
Соответствие

Определение веса сюжета Время создания Вес источника Соответствие тематики сюжета специализации

тематики сюжета специализации агентства
Вес отдельного сообщения
Плотность потока сообщений

Динамика кликабельности новости на главной странице
Время жизни в топе

Динамика сюжета

Количество новостных запросов к Яндексу
Записи в блогах
Место новости на сайтах партнёров

Интерес пользователей


Слайд 20 Вес источника

Цитируемость учитывает, насколько часто ссылаются на

Вес источника Цитируемость учитывает, насколько часто ссылаются на источник другие новостные

источник другие новостные ресурсы
Оперативность учитывает, насколько часто

источник быстро реагирует на события

Вес источников автоматически пересчитывается каждую неделю


Слайд 21 Топ-10 самых цитируемых агентств (в алфавитном порядке)
«Ведомости»

Топ-10 самых цитируемых агентств (в алфавитном порядке) «Ведомости» «Интерфакс» «ИТАР-ТАСС» «Коммерсант»

«Интерфакс»
«ИТАР-ТАСС»
«Коммерсант»
«Комсомольская правда»
Lenta.ru
«Первый канал»
РБК

РИА «Новости»
«Российская газета»

По данным еженедельно обновляемого отчёта, формируемого
роботом Яндекс.Новостей


Слайд 22 Робот и человек в Яндекс.Новостях
Человек
Принимает решение о сотрудничестве
Удаляет

Робот и человек в Яндекс.НовостяхЧеловекПринимает решение о сотрудничествеУдаляет ссылку на сообщение

ссылку на сообщение из базы данных Яндекс.Новостей в случае,

если текст сообщения изменён или отсутствует на сайте источника

Робот

Скачивает и индексирует новостные сообщения
Определяет и исключает из поиска по Яндекс.Новостям дубли
Определяет жанр сообщения
Выделяет ключевые слова и факты
Объединяет сообщения в сюжет
Определяет рубрику
Ранжирует сюжеты


  • Имя файла: kak-rabotayut-yandeksnovosti.pptx
  • Количество просмотров: 133
  • Количество скачиваний: 0