на главнуюВсе эхи RU.NETWORKS
войти ?

Re^4: Посоветовать хэш

От Alex Aka Parasite (2:5049/164.100) к Alexander Gusak

В ответ на Заголовок предыдущего сообщения в треде (Имя Автора)


Hello Alexander!
23 Aug 09 13:02, Alexander Gusak -> Alex Aka Parasite:

AG> Бессмыслица - искать решение, если оно и так есть. Речь идет о том,
AG> как поступать с задачей, которая решения не имеет. Это глубоко
AG> принципиальный вопрос, который, как я вижу, тебе, прикладнику,
AG> к сожалению, не доступен.
Я бы сказал много короче и немного брутальнее: "Товарищу прапорщику не надо, чтобы было КРАСИВО. Товарищу прапорщику надо, чтобы боец зае...ался" (с) :)

AG>>> Либо вероятность коллизии равна нулю, именно нулю.
AAP>> Это - предпочитаемый вариант. :)
AG>>> Hо тогда это не хэш, здесь нужно другое.
AAP>> Hапример? Учитывая размеры всего проекта как по кол-ву
AAP>> составляющих, так и по обьему на диске вообще.
AG> Любой _уникальный_ идентификатор. Хэш _по определению_ не обеспечивает
AG> уникальности, и используется для ускорения поиска и/или сравнения, а
AG> не для этой цели.
Приведи плиз примеры уникального идентификатора контента в файле для моего случая, как ты их видишь?
Примеры типа f(n)=n - неприемлемы, к сожалению.

AG> именно такое идиотское выполнение, с угрозой таких последствий, то у
AG> грамотного инженера варианта два - отказаться от задачи, провал в
AG> которой лишь вопрос времени, или сделать как надо, объясняя что ТЗ это
AG> _не противоречит_.
К сожалению, я не инженер, а "материально ответственное лицо" - и отвертеться так просто у меня не получится. :( Как ты там говорил? "Hас интересует, как надо решать нерешаемые задачи" в данном конкретном случае.

Кстати, слова "хэш" в проекте не было. Там были слова "исключить возможность коллизий". Хэш видится быть примененным в данной задаче лично мне. С интересом выслушаю другие варианты, сравнимые по трудоемкости\быстродействию\человекомашиночасам для введения оных в работу.

AG> Хэш использовать для проверки возможных совпадений при добавлении в
AG> базу. При обнаружении совпадающих хэшей - проверять содержимое. Если
AG> коллизия, добавлять с уникальным идентификатором, если повтор - не
AG> добавлять.
Желательно *разово* обработать уже имеющийся контент, результаты покласть в базу, и далее оперировать только с ней (это было в проекте, как и слово "желательно " а не "необходимо").

bye, Alex.
... Hе yлыбайтесь - с детства лошадей боюсь.

--- GoldED+/W32 1.1.5-041013
* Origin: Обьявление:Внедpю двоемыслие в Вашу голову.Бесплатн (2:5049/164.100)

Ответы на это письмо:

From: Username
Заголовок следующего сообщения в треде может быть длинным и его придется перенести на новую строку

From: Username
Или коротким

FGHI-url этого письма: area://RU.NETWORKS?msgid=2:5049/164.100+4a9410e8