Re^4: Посоветовать хэш
От Yan Alexandrovsky (2:5020/400) к Alex Aka Parasite
В ответ на Заголовок предыдущего сообщения в треде (Имя Автора)
From: "Yan Alexandrovsky" <yan@me.ru>
Sun Aug 30 2009 01:28, Alex Aka Parasite wrote to Yan Alexandrovsky:
AAP> Там бинарь. Причем в виде готовых архивов, то есть жать там уже по
AAP> большому счету больше нечего.
Тогда в базе для идентификации хранить всё. Вообще ты говоришь не о настолько
большом суммарном объеме, что бы пугаться базы. Учитывая, что поиск может
вестись по короткому! хэшу, а не по всем объектам.
YA>> Кстати, положенный в базу контент, примененный к контенту 32битный хэш
YA>> и построенный индекс по хэшу даст тебе возможно самый быстрый вариант
YA>> для сравнения.
AAP> Рухнет база - рухнет ВСЁ......
Я не говорю о замене хранимой информации базой. Я говорю о том, что в базе для
поиска дубликатов нового объекта может быть короткий хэш и весь контент.
Поиск будет БЫСТРЕЕ, чем поиск по псевдо-хэшу, который получается сложением
нескольких хэшей...
И вообще, с чего база должна рухать? :)
Ян
--- ifmail v.2.15dev5.4
* Origin: FidoNet Online - http://www.fido-online.com (2:5020/400)
Ответы на это письмо:
From: Username
Заголовок следующего сообщения в треде может быть длинным и его придется перенести на новую строку
From: Username
Или коротким