January 2019

M T W T F S S
 123456
78 910111213
14 151617181920
21222324252627
28293031   

За стиль благодарить

Развернуть метки

No cut tags
Sunday, January 31st, 2010 09:43 pm
Интересные вещи творятся с гуглеванием пресловутого письма визенталевского директора украинскому послу (я гуглевал на фразу who collaborated with the Nazis in the early stages of World War II, and whose followers were linked to the murders of thousands of Jews and others).

Если просить ТОЧНОЕ значение, выдается несколько (два-три) сайта, среди них НИА Новости и англоязычный ЖЖ. Визенталь не выдается.

Если просить режим по умолчанию (все слова, но в любом порядке), выдается много русских ЖЖ, а также американская (в Далласе) газета, которая, в свою очередь, ссылается на RIA Novosti.

Если указать "на сайте wiesenthal.com", находится несколько похожих документов, но не этот. Поиск на самом сайте Визенталя не находит этот документ вообще никак, хотя вот он - в разделе News за 29 число.

Интересно, почему как только политически острый вопрос - поисковые машины бастуют?
Sunday, January 31st, 2010 07:05 pm (UTC)
такое, в принципе, случается, когда документ исходит в пятницу и его банально не успевают вбить в базу данных. надо подождать до понедельника.
Sunday, January 31st, 2010 07:42 pm (UTC)
Если роботы Гугля будут обходить все сайты по нескольку раз в день - не поздоровится ни хостингам, ни провайдерам. Скорее всего, Визенталя обходят не каждый день - в отличие от сайтов новостных агентств и ЖЖ, контент которых Гугл получает в реалтайме через RSS и индексирует практически мгновенно. Давай подождем еще день-два: если на эту новость на wiesenthal.com будут ставить ссылки, она довольно быстро попадет в очередь на переобход и появится в выдаче.

P.S. У Яндекса в выдаче по твоему запросу wiesenthal.com уже есть - на этот раз наши роботы оказались пошустрее :-)
Sunday, January 31st, 2010 07:54 pm (UTC)
Ха. Мой собственный постинг с вхождением этих слов (не этот, а другой), провисевший в открытом доступе 30 секунд, убранный под глазик, а еще через 2 минуты удаленный - выдается (через 9 часов!), а двое суток назад выложенная на Визенталя новость - фиг.
Sunday, January 31st, 2010 08:26 pm (UTC)
Алик, я ж говорю - Гугл индексирует RSS-фид из ЖЖ. Как только ты создал постинг, ЖЖ сразу сообщает об этом подписчикам RSS-канала, в том числе Гуглу. Визенталь, как ты понимаешь, этого не делает, и тут уж Гуглу приходится изгаляться - как бы и свежесть обеспечить, и Визенталя не задолбать вусмерть.
Sunday, January 31st, 2010 08:52 pm (UTC)
ПОЛНЫЙ фид? Да, этого я не подумал.
Sunday, January 31st, 2010 08:02 pm (UTC)
Кто б сомневался в оных роботах. Уж больно новость-то удобная.
Monday, February 1st, 2010 01:09 am (UTC)
У Гугля и предыдущая новость с wiesenthal.com ещё не проиндексирована, только за 26е...
Sunday, January 31st, 2010 08:53 pm (UTC)
Вроде никакого мотива, и вообще умысла, просто интересно оказывается вся эта интернет-машинерия устроена, в ряде мест неинтуитивно.
Sunday, January 31st, 2010 09:56 pm (UTC)
Все просто, поисковые роботы оценивают сайты на предмет необходимой частоты переиндексации по главной странице сайта. Поэтому любой специалист по созданию сайтов знает, что новости должны быть видны на главной странице, иначе переиндексация может происходить достаточно редко.