Hi!
> Позволю себе немножко вернуться в проблеме wget'а в частности
[...]
Как раз утром родилась идея на эту тему. Исходим из того, что wget не знает
что такое cookie. Имеем некое дерево документов, вне доступа www-сервера,
/path/to/docs/*.html. Все внутренние ссылки преобразовываем из
<a href="/document.html"> в <a href="/cgi-bin/get.cgi?/document.html">.
Этот самый get.cgi сначала проверяет cookie, в котором есть время последнего
доступа к дереву документов, ip-адрес и т.д. Потом этот самый cookie
перезаписывает. Никто не мешает скрипту вести базу вида [<time> <url>
<ip-addr>], причем при двух близких по времени запросах с одного адреса без
наличия подтверждающего cookie (что сделает wget), выдавать отлуп. А если
все нормально - подсовывать в stdout текст из файлика. Написать и отладить
такую приблуду можно за пару часов. Перелопатить все ссылки в дереве - за
минуту.
Конечно, работать оно станет не так быстро как раньше, но кому надо -
применит FastCGI или еще чего-нибудь.
Правда, я не знаю как это все будет жить с SSI и как будут материться
клиенты, отключившие accept cookies в своих бродилках.
Anton Vinokurov, ALV-RIPE
anton@xxxxxxxxxxxxxxxxx ICQ:29041781
=============================================================================
= Apache-Talk@xxxxxxxxxxxxx mailing list =
Mail "unsubscribe apache-talk" to majordomo@xxxxxxxxxxxxx if you want to quit.
= Archive avaliable at http://www.lexa.ru/apache-talk =
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.