Re: Посоветовать хэш
От Alex Mizrahi (2:5020/400) к Alexander Gusak
В ответ на Заголовок предыдущего сообщения в треде (Имя Автора)
From: "Alex Mizrahi" <udodenko@users.sourceforge.net>
AM>> Совершенно очевидно, что произвольные бинари пожатые bzip'ом (именно о
AM>> таком контенте говорит паразит) не могут иметь никаких
AM>> закономерностей.
AG> Однако известно (со слов автора), что файлы не совсем произвольные, а с
AG> размером в пределах 10К.
Аффтар говорит "до десятков килобайт".
(Кстати такая формулировка обычно обозначает что могут быть
файлы и больше, просто редко.)
AG> Это уже никак не произвольное, а конечное и определенное, хотя и
AG> достаточно большое множество.
Именно, это множество достаточно большое чтобы не заниматься х-нёй.
"Конечность" ровным счётом ничего не даёт. Если верить статье
"Ultimate physical limits to computation" (Nature 406, 1047-1054 (2000))
один килограм вещества может хранить не более 10^31 бит. Тогда
если всю массу солнечной системы использовать под хранение, получится
не более 2^205 бит. Т.о. мощность множество всех файлов которые могут
храниться
в пределах солнечной системы вполне конечна и ограничена числом 2^(2^205).
Hо толку от этого мало.
AG> Мы же в задаче имеем дело с его опять же конечным, хотя и тоже
AG> немалым, подмножеством.
Каким ещё подмножеством?
AG>>> Да, мощность должна быть ограничена.
AM>> Hу, положим, мощность всегда ограничена, но тут надо чтобы она была
AM>> ограничена какими-то вменяемыми пределами.
AG> Hу, мы же сейчас не можем сказать, вменяемые это пределы или нет. Это
AG> уже от ТЭО и доступных ресурсов зависит.
Ты меня извини, но если ты в качестве хэша берёшь сам контент, то это
нифига уже не хэш, с практической точки зрения (да и под определения не
попадает).
Для глазозамыливания, конечно, можно назвать это очень большим хэшем, но
это уже отдельный вопрос.
AG> Хэш в данном случае может быть более удобен по сравнению с самим
AG> содержимым файлов не только размером. Может быть, по этой функции
AG> окажется быстрее поиск,
Типа случайно окажется? Если надо быстрый поиск, это можно сделать
более гуманными методами -- не изобретать велосипед, а взять хороший
быстрый хэш заданного размера с известными характеристиками, и уже
на основании его строить алгоритм поиска.
AG> или просто даст возможность например на удаленном АРМ проверять
AG> возможность добавления файла в базу, не имея доступа к самим данным -
AG> по соображениям конфиденциальности скажем.
Криптографическую стойкость нужно доказать. Мне кажется отсутствие
коллизий подразумевает обратимую функцию, так что данные можно будет
запросто расшифровать. Hе нужно такие вещи выдумывать на коленке...
AG> Варианты есть, это уже дело хозяйское зачем оно именно так
AG> понадобилось.
То есть метод есть, а для чего он нужен ещё предстоит придумать :).
Отличный подход, если нужно создать видимость работы чтобы проесть
финансирование.
В общем, задача Паразита тривиально сводится к "Универсальному Архиватору"
и, математически, к принципу Дирихле. Она нерешаема. Пытаться её решать --
идиотизм,
который ни к чему кроме траты времени привести не может.
Это как изобретение вечного двигателя -- если изобретатель утверждает
что у него получился вечный двигатель, то его можно сразу гнать взашей, не
смотря даже на то, что он там изобрёл -- это однозначно чушь либо
надувательство.
--- ifmail v.2.15dev5.4
* Origin: Demos online service (2:5020/400)
Ответы на это письмо:
From: Username
Заголовок следующего сообщения в треде может быть длинным и его придется перенести на новую строку
From: Username
Или коротким