> > транзакции - т.е. пока все изменения не произошли для собственно поисковика
> > индекс остается старым, либо же делать отдельную транзакцию для каждого
> > документа ?
>
> А смысл? Зачем делать документ транзакцией - понятно.
Был бы смысл - я бы не спрашивал :)
То-есть смысл преследуется простой - если документ изменился, то это
ведет к delete from index; insert into index (update в этом месте
неприменим) т.е. в некоторый момент документа в индексе просто нет,
а это плохо.
Вторая причина - если коммитить реже, то это быстрее работает.
> > с lexa.ru скоро будет удален, равно как и Yandex.Site с apache.lexa.ru :)
>
> А что - fts так крут? Я на него посмотрел, мне стало интересно,
> но не настолько чтобы делать его альтернативным по отношению к многосерчу
> движком.
FTS - понимаем (по меньшей мере мной т.к. я присутствовал при создании
первых версий) - и это достаточная причина.
Ну и по мелочи - хранится координатная информация (позиция слова в док-те)
- что позволяет, лучше сортировать результаты или сделать свой сортировщик,
используются R-деревья, которые на много порядков быстрее если в запросе
несколько слов.
Алексей Тутубалин
mailto: lexa@xxxxxxx
=============================================================================
= Apache-Talk@xxxxxxxxxxxxx mailing list =
Mail "unsubscribe apache-talk" to majordomo@xxxxxxxxxxxxx if you want to quit.
= Archive avaliable at http://www.lexa.ru/apache-talk =
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.