taki_net: (Default)
taki_net ([personal profile] taki_net) wrote2010-01-31 09:43 pm

Политическая забастовка роботов

Интересные вещи творятся с гуглеванием пресловутого письма визенталевского директора украинскому послу (я гуглевал на фразу who collaborated with the Nazis in the early stages of World War II, and whose followers were linked to the murders of thousands of Jews and others).

Если просить ТОЧНОЕ значение, выдается несколько (два-три) сайта, среди них НИА Новости и англоязычный ЖЖ. Визенталь не выдается.

Если просить режим по умолчанию (все слова, но в любом порядке), выдается много русских ЖЖ, а также американская (в Далласе) газета, которая, в свою очередь, ссылается на RIA Novosti.

Если указать "на сайте wiesenthal.com", находится несколько похожих документов, но не этот. Поиск на самом сайте Визенталя не находит этот документ вообще никак, хотя вот он - в разделе News за 29 число.

Интересно, почему как только политически острый вопрос - поисковые машины бастуют?

[identity profile] oude-rus.livejournal.com 2010-01-31 07:05 pm (UTC)(link)
такое, в принципе, случается, когда документ исходит в пятницу и его банально не успевают вбить в базу данных. надо подождать до понедельника.

[identity profile] taki-net.livejournal.com 2010-02-01 09:48 am (UTC)(link)
К чему Вы это? У меня ясно сказано, что я его на сайте нашел (глазами, без поисковой машины).

[identity profile] oude-rus.livejournal.com 2010-02-01 04:19 pm (UTC)(link)
a, теперь понял.

[identity profile] nickgrigoriev.livejournal.com 2010-01-31 07:42 pm (UTC)(link)
Если роботы Гугля будут обходить все сайты по нескольку раз в день - не поздоровится ни хостингам, ни провайдерам. Скорее всего, Визенталя обходят не каждый день - в отличие от сайтов новостных агентств и ЖЖ, контент которых Гугл получает в реалтайме через RSS и индексирует практически мгновенно. Давай подождем еще день-два: если на эту новость на wiesenthal.com будут ставить ссылки, она довольно быстро попадет в очередь на переобход и появится в выдаче.

P.S. У Яндекса в выдаче по твоему запросу wiesenthal.com уже есть - на этот раз наши роботы оказались пошустрее :-)

[identity profile] taki-net.livejournal.com 2010-01-31 07:54 pm (UTC)(link)
Ха. Мой собственный постинг с вхождением этих слов (не этот, а другой), провисевший в открытом доступе 30 секунд, убранный под глазик, а еще через 2 минуты удаленный - выдается (через 9 часов!), а двое суток назад выложенная на Визенталя новость - фиг.

[identity profile] nickgrigoriev.livejournal.com 2010-01-31 08:26 pm (UTC)(link)
Алик, я ж говорю - Гугл индексирует RSS-фид из ЖЖ. Как только ты создал постинг, ЖЖ сразу сообщает об этом подписчикам RSS-канала, в том числе Гуглу. Визенталь, как ты понимаешь, этого не делает, и тут уж Гуглу приходится изгаляться - как бы и свежесть обеспечить, и Визенталя не задолбать вусмерть.

[identity profile] taki-net.livejournal.com 2010-01-31 08:52 pm (UTC)(link)
ПОЛНЫЙ фид? Да, этого я не подумал.

[identity profile] groben.livejournal.com 2010-01-31 08:02 pm (UTC)(link)
Кто б сомневался в оных роботах. Уж больно новость-то удобная.

[identity profile] timofeikoryakin.livejournal.com 2010-02-01 01:09 am (UTC)(link)
У Гугля и предыдущая новость с wiesenthal.com ещё не проиндексирована, только за 26е...

[identity profile] original-ivan.livejournal.com 2010-01-31 08:08 pm (UTC)(link)
Cui prodest? Мотив то у кого?

[identity profile] taki-net.livejournal.com 2010-01-31 08:53 pm (UTC)(link)
Вроде никакого мотива, и вообще умысла, просто интересно оказывается вся эта интернет-машинерия устроена, в ряде мест неинтуитивно.

[identity profile] lz.livejournal.com 2010-01-31 09:56 pm (UTC)(link)
Все просто, поисковые роботы оценивают сайты на предмет необходимой частоты переиндексации по главной странице сайта. Поэтому любой специалист по созданию сайтов знает, что новости должны быть видны на главной странице, иначе переиндексация может происходить достаточно редко.