Hi,
проблему решил и по endings оно теперь работает нормально.
Solution:
1) в htfuzzy/EndingsDB.cc убираем нафиг строчки
system(form("/bin/mv %s %s;/bin/mv %s %s",
TMP_ROOT2WORD, config["endings_root2word_db"],
TMP_WORD2ROOT, config["endings_word2root_db"]));
После чего оно перестает стирать временную базу из /tmp
2) режем словарь на кусочки. Я где-то читал про 100 строк, но
на 100-строчных кусках уже видно замедление в конце. Я порезал на
куски по 40
split -l 40 russian.dict
3) напускаем на это htfuzzy:
for i in x* y* z*
do
mv $i /opt/www/htdig/common/russian.dict
htfuzzy -v -v | tail -5 # чтобы видеть прогресс
done
4) копируем /tmp/*gdbm в /opt/www/htdig/common/нужныйфайл.db
Это все - для htdig-3.1.0b1.
Да
5) там явно проблема в линейном поиске. Пишем автору ht/Dig
"так программы не пишут" :)
Alex
p.s Лебедевский словарь проиндексировался примерно за час на Celeron-300A/450
=============================================================================
= Apache-Talk@xxxxxxxxxxxxx mailing list =
Mail "unsubscribe apache-talk" to majordomo@xxxxxxxxxxxxx if you want to quit.
= Archive avaliable at http://www.lexa.ru/apache-talk =
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.