Hello Slawa,
Sunday, June 18, 2000, 10:07:48 PM, you wrote:
SO> On Sun, Jun 18, 2000 at 09:39:22PM +0400, Oleg Ilin wrote:
>> >> >> OI>>> А вы можете узнать какие странички запросил определенный ip в
>> >> >> OI>>> определенный день?
>> >> >> at> Ого. Вы представляете, какого размера должна быть база с такими
>> >> >> at> логами хотя бы за месяц? У меня за неделю с гиг набегает, это без
>> >> >> at> индексации, а если это в SQL засунуть, мне и подумать страшно сколько
>> >> >> at> выйдет.
>> >> >> Проблема не в объеме.
>> >> >> IP - 4 байта, дата - 4 байта, user-agent - 2-3 байта (+ "словарь"), URL - пусть
>> >> >> 4 байта (хотя покажите мне у кого оно не влезет в 3 байта :), referer - 4
>> >> >> байта. Итого - 20 байт на строчку лога, думаю можно и меньше.
>> >> SO> Про referer не понял, почему так мало?
>> >> А вам мало для индекса 16^8 индексов для рефереров?
>>
>> SO> А черт их разберет, с альтавистами этими.
>>
>> http://info.webcrawler.com/mak/projects/robots/active/html/index.html
>>
>> Для этих вполне зватит.
>> А вордсы действительно в отдельный индекс ;)
Ой, а кто спайдерит странички? Роботы -> Поисковые системы к которым
они привязаны: как говорится: "смотрите внимательнее":
http://info.webcrawler.com/mak/projects/robots/active/html/scooter.html
а?
Best regards,
Oleg mailto:ilin@xxxxxxxx
=============================================================================
= Apache-Talk@xxxxxxxxxxxxx mailing list =
Mail "unsubscribe apache-talk" to majordomo@xxxxxxxxxxxxx if you want to quit.
= Archive avaliable at http://www.lexa.ru/apache-talk =
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.