на главнуюВсе эхи RU.NETWORKS
войти ?

Re^2: Посоветовать хэш

От Alex Aka Parasite (2:5049/164.100) к Eugene Grosbein

В ответ на Заголовок предыдущего сообщения в треде (Имя Автора)


Hello Eugene!
22 Aug 09 09:31, Eugene Grosbein -> Alex Aka Parasite:

AAP>>>> перепроверками и за свой счет, включая неустойки и срыв сроков
AAP>>>> и обязательств - вообще).
EG>>> Ты всё ещё не понимаешь, для чего вообще существуют хеши.
AAP>> Предлагаю не обсуждать меня - а просто обоснованно посоветовать
AAP>> алгоритм. Если бы я понимал сабж в его тонкостях и деталях -
AAP>> этого треда в эхе вообще не было бы.
EG> Это был намёк подучить теорию, если что. И не уподобляться тому
EG> чуваку, который ляпнул: "я программист, мне мануалы читать некогда".
Так мне их действительно некогда читать, да и сам я - не программер. Я тот, кто выиграл тендер на проект - а программеры сидят и ждут отмашки, чтобы приступить к непосредственной реализации. Один из предложенных вариантов (и пока что самый реальный кандидат на реализацию) мною указан в предыдущем посте.

EG>>> По значению хеш-функции определяется не один-единственный
EG>>> объект, а их небольшая группа, в которой нужный ищется
EG>>> _перебором_. По определению.
AAP>> Группа - 100М бинарных файлов разной длины и состава.
EG> Хеш-функция разбивает сто миллионов на _небольшие_ группы.
EG> Hо не идентифицирует уникально, так не бывает.
Значит меняем термин "хэш-функция" на термин "что-то, что обеспечит УHИКАЛЬHЫЙ штамп о контенте с наименьшими затратами и наибольшей эффективностью", и вопрос в силе. :)

AAP>> Hужно идентифицировать
AAP>> например дубликаты по контенту,
EG> Сортировка и затем поиск дубликатов. Быстрее никак.
Поиск дубликатов каким методом предлагается внедрять? Побайтовым сравнением каждого найденного с остальными найденными сотоварищами? А если их, например - миллион (кстати, вполне реальная ситуация) - обычных, действительно одинаковых, не коллизий - но их ВСЕ таки придется перебрать...?

bye, Alex.
... Я щас на пять сек отpублюсь на пять минут.

--- GoldED+/W32 1.1.5-041013
* Origin: Обьявление:Внедpю двоемыслие в Вашу голову.Бесплатн (2:5049/164.100)

Ответы на это письмо:

From: Username
Заголовок следующего сообщения в треде может быть длинным и его придется перенести на новую строку

From: Username
Или коротким

FGHI-url этого письма: area://RU.NETWORKS?msgid=2:5049/164.100+4a916af7