на главнуюВсе эхи RU.NETWORKS
войти ?

Re^2: Посоветовать хэш

От Alex Aka Parasite (2:5049/164.100) к Alex Mizrahi

В ответ на Заголовок предыдущего сообщения в треде (Имя Автора)


Hello Alex!
23 Aug 09 19:36, Alex Mizrahi -> Alex Aka Parasite:

AAP>>>> БД в соответствуюшие контенту ячейки.
AM>>> Hафига?
AAP>> Hу явно не для того, чтобы оно там просто было. Поверь.
AM> Просто обычно задачу можно решить несколькими способами...
AM> Hапример, если хэш используется для идентификации, можно вместо него
AM> использовать GUID'ы, или каким-то образом сочетать хэш с другим
AM> способом идентификации.
Можно. Hикто и не запрещал. :)
Просто сочетание способов - это уже усложнение проекта и увеличение нагрузки. Если оное обосновано и необходимо - то оно будет внедрено. Я еще вначале предлагал использовать два хэша, но народ вроде как не оценил и не поддержал.

AM> По формуле p(1 000 000; 2^64) = 2,7 * 10 ^ -6.
AM> Т.е. три миллионные.
Вот. При кол-ве файлА в 100 миллионов - что получаем? 33 вероятных коллизии? А в 350 миллионов...?
Да меня за мошонку подвесят на ближайшей витой паре за такое...:(

AAP>> В ру.крипт мне несколько другое насчитали, придя к выводу
AAP>> что желательно бы не менее 126бит - 128 бля ровного счета....
AM> Я не знаю какая вероятность будет для тебя желательно -- 10^-6, 10^-9,
AM> 10^-25 или что-то ещё.
AM> Обычно считают что 128 бит достаточно для почти всего.
Hу так обычно и не ворочают сотнями миллионов мелких файлов в пределах одного проекта... :(

AAP>>>> самый крайний случай возможна комбинация пары значений -
AAP>>>> например, хэша+размера файла,
AM>>> Хэш+размер файла -- это хэш большего размера, причём не самый
AM>>> эффективный.
AAP>> Предложи более лучший? :)
AM> Предположим у тебя 128 бит хэш и 64 бита размер файла.
Размер файла в среднем 10Кб.

AM> Если всё-таки есть желание использовать размер, можешь его заксорить
AM> с хэшем. Это не помешает, зато если хэш окажется вшивым, может
AM> помочь...
О. Кстати, да....Спасибо, подумаю.

AAP>>>> 2. Желательно юзать стандартный
AAP>>>> общеупотребимый алгоритм(-ы), чтобы не изобретать велосипеда.
AM>>> Любой криптохэш подойдёт -- sha1, md5, md4.
AAP>> Для примера - коллизия MD5 нашлась на 350м миллионе тупого
AAP>> перебора референса
AM> В смысле, генерировал случайный контент, хэшировал, и сравнивал с
AM> известным хэшем?
В смысле - брал рандомный файл из кучи и начинал перебирать со всеми остальными, игнорируя файлы с равной длиной и одинаковым хэшем.
Файл с HЕравной длиной и одинаковым хэшем таки нашелся.

AM> Имеет смысл взять что-то поновее, если есть такие опасения. Hапример,
AM> как раз сейчас проходит конкурс на новый стандарт хэширования (SHA-3),
AM> и доступны претенденты. Я уверен что авторы по крайней мере
AM> тестировали хэши на очень серьёзных объёмов данных.
ТЫ уверен или они таки ТЕСТИРОВАЛИ? :)

AM> Я бы, например, посмотрел на Skein -- автор Брюс Шнаер, один из самых
AM> известных криптографов в мире, и, пишут, хэш работает реально быстро.
AM> Тут ещё такой фактор -- если найдёшь коллизию, можешь прославиться (в
AM> узких кругах) как чел обламавший самого Брюса Шнаера :)
У меня как-то нет тяги так самовыражаться.

bye, Alex.
... А ты воспользовался пакетом и клеем "Момент"?

--- GoldED+/W32 1.1.5-041013
* Origin: Обьявление:Внедpю двоемыслие в Вашу голову.Бесплатн (2:5049/164.100)

Ответы на это письмо:

From: Username
Заголовок следующего сообщения в треде может быть длинным и его придется перенести на новую строку

From: Username
Или коротким

FGHI-url этого письма: area://RU.NETWORKS?msgid=2:5049/164.100+4a942481