От Eugene Grosbein (2:5006/1) к Alex Aka Parasite
В ответ на Заголовок предыдущего сообщения в треде (Имя Автора)
AAP> Прошу разбирающихся посоветовать алгоритм хэширования под следующую
AAP> задачу:
AAP> 1. Сервер
AAP> 2. Hа нем - проект, писанный на перле + апач для междумордия с
AAP> пользователем.
AAP> 3. Там же - БД.
AAP> 4. Там же, на винте - хранилище контента под проект. Контент представляет
AAP> из
AAP> себя многие и многие *миллионы* мелких бинарных файлов, размером от
AAP> десятков
AAP> байт до десятков килобайт, и их число постоянно растет. Каждый файлик уже
AAP> упакован (.bz2).
AAP> Требуется: поиметь для каждого файлика хэш, кой и положить в БД в
AAP> соответствуюшие контенту ячейки.
AAP> 1. *Очень критично* отсутствие коллизий (одинакового хэша на разные по
AAP> составу
AAP> файлы). Учитывая количество единиц файлА - такое теоретически возможно...
AAP> Hа самый крайний случай возможна комбинация пары значений - например,
AAP> хэша+размера файла, но это не так изящно уже...
AAP> 2. Желательно юзать стандартный общеупотребимый алгоритм(-ы), чтобы не
AAP> изобретать велосипеда.
AAP> 3. Желательно посоветовать быстрые, "нетяжелые" алгоритмы - работа с
AAP> контентом
AAP> идет довольно плотная, в мультиюзер-моде, а перл сам по себе не самый
AAP> проворный.
AAP> Вот... У кого какие идеи? Всем откликнувшимся - заранее спасибо.
--- slrn/0.9.8.1 (FreeBSD)
* Origin: Svyaz Service JSC (2:5006/1@fidonet)
Ответы на это письмо: