на главнуюВсе эхи RU.CRYPT
войти ?

Re^2: Посоветовать алгоритм хэширования

От Alex Aka Parasite (2:5049/164.100) к Oleh Derevenko

В ответ на Заголовок предыдущего сообщения в треде (Имя Автора)


Hello Oleh!
18 Aug 09 13:52, Oleh Derevenko -> Alex Aka Parasite:

>> представляет из себя многие и многие *миллионы* мелких бинарных
>> файлов, размером от десятков байт до десятков килобайт, и их число
>> постоянно растет. Каждый файлик уже упакован (.bz2).
>>
>> Требуется: поиметь для каждого файлика хэш, кой и положить в БД в
>> соответствуюшие контенту ячейки.
OD> Как я понял, нужна просто идентификация файла в БД. А почему то же имя
OD> файла не подходит?
Потому что нужна *HЕ* идентификация файла в БД (для чего вполне подошло бы тупое инкрементное autorun-поле, и каждый файл был бы просто пронумерован по порядку и докинут путем по папкам до него - в соседнем поле), а именно однозначность *контента* внутри к.файла, и создание репортов о дубликатах (в том числе).

OD> Или ограничить максимальную глубину вложенности каталогов и слепить
OD> цепочку значений inode от корня добитую до заданной длины нолями.
Ограничивать длину каталогов мало того что нельзя - так и не получится, ибо они УЖЕ есть. Физически, на винте, с контентом. Потеря контента чревата весьма шикарными звиздюлями - без разбора погон и званий.

bye, Alex.
... В сети водятся кваксы, x84, баны и кики.

--- GoldED+/W32 1.1.5-041013
* Origin: Обьявление:Внедpю двоемыслие в Вашу голову.Бесплатн (2:5049/164.100)

Ответы на это письмо:

From: Username
Заголовок следующего сообщения в треде может быть длинным и его придется перенести на новую строку

From: Username
Или коротким

FGHI-url этого письма: area://RU.CRYPT?msgid=2:5049/164.100+4a8af734