On Wed, 9 Jan 2002, Dmitriy Kyrhlarov wrote:
> У меня какой-то косяк, но не пойму где рыть.
> www.lycos.ru на запрос "electromir.ru" выплевывает ссылку на сайт первой
> строкой, но почему-то в koi8-r.
> Т.к. остальные ссылки читаемы, то, получается, косяк у меня.
>
> Сам сайт, вроде как, отдается честно -- я проблем не наблюдал.
> Настройки кодировки:
>
> ServerName www.electromir.ru
> CharsetSourceEnc koi8-r
>
> И еще.
> weblog умеет выковыривать ключевые слова, по которым к нам пришли с
> поисковиков.
>
> Для electromir.ru все, вроде бы, нормально. Для другого сайта, с
> CharsetSourceEnc windows-1251
> отдает какую-то фигню. Там, минимум, два раза все перекодировалось.
>
> Тут можно посмотреть разницу:
> http://stat.electromir.ru/electromir/log.keys.html
> http://stat.electromir.ru/side-by-side/log.keys.html
>
> Методом тыка я это буду до конца жизни ловить -- поисковики ведь ходят
> сайты индексировать раз в неделю-две и потом еще надо догадаться
> проиндексил он после изменения настроек или до.
Такая гипотеза. Возможно, lycos.ru не воспринимает charset в Content-Type.
Нерусская вещь всё-таки. А ты, вероятно, по дефолту отдаёшь koi8-r.
Решения два:
1. Узнать User-Agent егойного спайдера и отдавать ему windows-1251.
2. Отдавать по дефолту windows-1251.
Игорь Сысоев
=============================================================================
= Apache-Rus@xxxxxxxxxxxxx mailing list =
Mail "unsubscribe apache-rus" to majordomo@xxxxxxxxxxxxx if you want to quit.
= Archive avaliable at http://www.lexa.ru/mail-archive =
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.