на главнуюВсе эхи RU.NETWORKS
войти ?

Re: Посоветовать хэш

От Alex Mizrahi (2:5020/400) к Alex Aka Parasite

В ответ на Заголовок предыдущего сообщения в треде (Имя Автора)


From: "Alex Mizrahi" <udodenko@users.sourceforge.net>

AAP> нагрузки. Если оное обосновано и необходимо - то оно будет внедрено. Я
AAP> еще вначале предлагал использовать два хэша, но народ вроде как не
AAP> оценил и не поддержал.

Конкатенация двух или более хэшей -- это просто хэш большей длины.
128 бит, 256, 512 или 1024 -- принцип не меняется.

AM>> По формуле p(1 000 000; 2^64) = 2,7 * 10 ^ -6.
AM>> Т.е. три миллионные.
AAP> Вот. При кол-ве файлА в 100 миллионов - что получаем? 33 вероятных
AAP> коллизии? А в 350 миллионов...?
AAP> Да меня за мошонку подвесят на ближайшей витой паре за такое...:(

Я ж тебе не предлагаю 64-битные хэши.

AM>> Я не знаю какая вероятность будет для тебя желательно -- 10^-6, 10^-9,
AM>> 10^-25 или что-то ещё.
AM>> Обычно считают что 128 бит достаточно для почти всего.
AAP> Hу так обычно и не ворочают сотнями миллионов мелких файлов в пределах
AAP> одного проекта... :(

Почему не ворочают? Ворочают. Hапример, протол ed2k использует 128-битные
хэши для однозначной идентификации файлов, файлов в сети миллионы, про
коллизии
пока не слышно. Системы контроля версий используют хэши для однозначной
идентификации
изменений. Твоя задача не уникальна.

AM>> В смысле, генерировал случайный контент, хэшировал, и сравнивал с
AM>> известным хэшем?
AAP> В смысле - брал рандомный файл из кучи и начинал перебирать со всеми
AAP> остальными, игнорируя файлы с равной длиной и одинаковым хэшем.
AAP> Файл с HЕравной длиной и одинаковым хэшем таки нашелся.

Hо, конечно, привести ты его не можешь...

AM>> Имеет смысл взять что-то поновее, если есть такие опасения. Hапример,
AM>> как раз сейчас проходит конкурс на новый стандарт хэширования (SHA-3),
AM>> и доступны претенденты. Я уверен что авторы по крайней мере
AM>> тестировали хэши на очень серьёзных объёмов данных.
AAP> ТЫ уверен или они таки ТЕСТИРОВАЛИ? :)

Да, это серьёзные люди. Если найдётся какая-то тривиальная коллизия, рискуют
репутацией.


--- ifmail v.2.15dev5.4
* Origin: Demos online service (2:5020/400)

Ответы на это письмо:

From: Username
Заголовок следующего сообщения в треде может быть длинным и его придется перенести на новую строку

From: Username
Или коротким

FGHI-url этого письма: area://RU.NETWORKS?msgid=<1187352229@killer>+49ac25b7