на главнуюВсе эхи RU.NETWORKS
войти ?

Re: Посоветовать хэш

От Alex Mizrahi (2:5020/400) к Alexander Gusak

В ответ на Заголовок предыдущего сообщения в треде (Имя Автора)


From: "Alex Mizrahi" <udodenko@users.sourceforge.net>

AM>> Совершенно очевидно, что произвольные бинари пожатые bzip'ом (именно о
AM>> таком контенте говорит паразит) не могут иметь никаких
AM>> закономерностей.

AG> Однако известно (со слов автора), что файлы не совсем произвольные, а с
AG> размером в пределах 10К.

Аффтар говорит "до десятков килобайт".
(Кстати такая формулировка обычно обозначает что могут быть
файлы и больше, просто редко.)

AG> Это уже никак не произвольное, а конечное и определенное, хотя и
AG> достаточно большое множество.

Именно, это множество достаточно большое чтобы не заниматься х-нёй.

"Конечность" ровным счётом ничего не даёт. Если верить статье
"Ultimate physical limits to computation" (Nature 406, 1047-1054 (2000))
один килограм вещества может хранить не более 10^31 бит. Тогда
если всю массу солнечной системы использовать под хранение, получится
не более 2^205 бит. Т.о. мощность множество всех файлов которые могут
храниться
в пределах солнечной системы вполне конечна и ограничена числом 2^(2^205).
Hо толку от этого мало.

AG> Мы же в задаче имеем дело с его опять же конечным, хотя и тоже
AG> немалым, подмножеством.

Каким ещё подмножеством?

AG>>> Да, мощность должна быть ограничена.
AM>> Hу, положим, мощность всегда ограничена, но тут надо чтобы она была
AM>> ограничена какими-то вменяемыми пределами.

AG> Hу, мы же сейчас не можем сказать, вменяемые это пределы или нет. Это
AG> уже от ТЭО и доступных ресурсов зависит.

Ты меня извини, но если ты в качестве хэша берёшь сам контент, то это
нифига уже не хэш, с практической точки зрения (да и под определения не
попадает).
Для глазозамыливания, конечно, можно назвать это очень большим хэшем, но
это уже отдельный вопрос.

AG> Хэш в данном случае может быть более удобен по сравнению с самим
AG> содержимым файлов не только размером. Может быть, по этой функции
AG> окажется быстрее поиск,

Типа случайно окажется? Если надо быстрый поиск, это можно сделать
более гуманными методами -- не изобретать велосипед, а взять хороший
быстрый хэш заданного размера с известными характеристиками, и уже
на основании его строить алгоритм поиска.

AG> или просто даст возможность например на удаленном АРМ проверять
AG> возможность добавления файла в базу, не имея доступа к самим данным -
AG> по соображениям конфиденциальности скажем.

Криптографическую стойкость нужно доказать. Мне кажется отсутствие
коллизий подразумевает обратимую функцию, так что данные можно будет
запросто расшифровать. Hе нужно такие вещи выдумывать на коленке...

AG> Варианты есть, это уже дело хозяйское зачем оно именно так
AG> понадобилось.

То есть метод есть, а для чего он нужен ещё предстоит придумать :).
Отличный подход, если нужно создать видимость работы чтобы проесть
финансирование.

В общем, задача Паразита тривиально сводится к "Универсальному Архиватору"
и, математически, к принципу Дирихле. Она нерешаема. Пытаться её решать --
идиотизм,
который ни к чему кроме траты времени привести не может.
Это как изобретение вечного двигателя -- если изобретатель утверждает
что у него получился вечный двигатель, то его можно сразу гнать взашей, не
смотря даже на то, что он там изобрёл -- это однозначно чушь либо
надувательство.


--- ifmail v.2.15dev5.4
* Origin: Demos online service (2:5020/400)

Ответы на это письмо:

From: Username
Заголовок следующего сообщения в треде может быть длинным и его придется перенести на новую строку

From: Username
Или коротким

FGHI-url этого письма: area://RU.NETWORKS?msgid=<1187353338@killer>+3f4a137b