От Alex Mizrahi (2:5020/400) к Alexander Gusak
В ответ на Заголовок предыдущего сообщения в треде (Имя Автора)
AM>> Обосновать это очень сложно. Потому что оно выходит прямо из
AM>> определения. Ты читал вообще статью по ссылке которую привёл? A
AM>> perfect hash function _for a set S_ is a hash function that
AM>> maps distinct elements in S to distinct integers, with no collisions.
AM>> Хэш-функция ДЛЯ МHОЖЕСТВА S. Очевидно это подразумевает что множество
AM>> S известно.
AG> Вовсе неочевидно. Это подразумевает, что известны _некие
AG> характеристики_ множества S, достаточные для реализации.
AG> Ключевым элементом определения является другая его часть, "with no
AG> collisions".
AM>> Если оно не известно, то что это будет -- неизвестная хэш-функция для
AM>> какого-то неизвестного множества?
AG> Ты пропустил начало. А в начале я предложил заложиться на три порядка
AG> от ожидаемого количества файлов, с тем чтобы зафиксировать одну из
AG> характеристик множества.
AG> Так что оно уже не совсем неизвестно. Оно уже не просто счетное, оно
AG> конечное, причем с известными пределами.
AM>> Если хэш имеет конечное количество бит, то мощность множества S
AM>> ограничена -- например, для 128-битного хэша это будет 2^128
AG> Да, мощность должна быть ограничена.
AM>> Т.о. нужно каким-то образом наперёд выбрать из 2^81920 элементов 2^128
AM>> элементов которые могут потенциально встретиться. Для произвольного
AM>> контента это, очевидно, невозможно.
AG> Для совсем произвольного контента конечно. А для контента, о котором мы
AG> делаем эти предположения, достаточно взять хэш на 81921 бит, нет?
--- ifmail v.2.15dev5.4
* Origin: Demos online service (2:5020/400)
Ответы на это письмо: