на главнуюВсе эхи RU.CRYPT
войти ?

Re^2: Посоветовать алгоритм хэширования

От Alex Aka Parasite (2:5049/164.100) к Vladimir N. Oleynik

В ответ на Заголовок предыдущего сообщения в треде (Имя Автора)


Hello Vladimir!
24 Aug 09 12:55, Vladimir N. Oleynik -> Alex Aka:

AP>> 1. *Очень критично* отсутствие коллизий
VO> Hо почему? Один раз из 10**9 запросов дёрнуться к файлу,
Потому что желательно вообще HЕ дергаться к файлам. Желательно, повторюсь (не "запрещено"). Желательно разово обработать контент, скласть результаты в БД - и далее работать только с нею.

VO> совпадающим с одной из записью в БД есть с тем же самым контентом,
VO> никто не гарантирует.
Я знаю.

VO> 3. указателями двухсвязанного списка
VO> получим 16 байт на файл, для 100 миллионов - 1.6Гбайт, по современным
VO> меркам не такая и запредельная цифра, можно в памяти держать.
VO> Отсортировать по хэшу и вуаля - получим дубликаты и коллизии.
Так вот все к этому и идет. Сабж-то был не о том, как юзать ДБ - а о том, чтобы при хэшировании алгоритмом N получить самый наименее минимальный минимум коллизий (в идеале - исключить оные).
Вопрос - в этом алгоритме N.

bye, Alex.
... Супеp-акция компании "Кока-кола" для экстpемалов: "После каждой седьмой бутылоч

--- GoldED+/W32 1.1.5-041013
* Origin: Обьявление:Внедpю двоемыслие в Вашу голову.Бесплатн (2:5049/164.100)

Ответы на это письмо:

From: Username
Заголовок следующего сообщения в треде может быть длинным и его придется перенести на новую строку

From: Username
Или коротким

FGHI-url этого письма: area://RU.CRYPT?msgid=2:5049/164.100+4a93fc97