на главнуюВсе эхи RU.NETWORKS
войти ?

Посоветовать хэш

От Andrew Doroshev (2:5061/6.100) к Alex Aka Parasite

В ответ на Заголовок предыдущего сообщения в треде (Имя Автора)


Hello, Alex!

AAP>>> Hужно идентифицировать
AAP>>> например дубликаты по контенту,
EG>> Сортировка и затем поиск дубликатов. Быстрее никак.
AAP> Поиск дубликатов каким методом предлагается внедрять? Побайтовым
AAP> сравнением каждого найденного с остальными найденными сотоварищами? А
AAP> если их, например - миллион (кстати, вполне реальная ситуация) -
AAP> обычных, действительно одинаковых, не коллизий - но их ВСЕ таки
AAP> придется перебрать...?

Зачем? они ведь все у нас уже обсчитаны, и ранее помечены как одинаковые.
помечены путём попадания в одну ячейку хеша и получения при разборе коллизии
хеша одинакового для всего миллиона номерочка.

With best wishes, Andrew.

--- GoldEd 1.1.4.3 E-mail: ICQ:
* Origin: *** *** (2:5061/6.100)

Ответы на это письмо:

From: Username
Заголовок следующего сообщения в треде может быть длинным и его придется перенести на новую строку

From: Username
Или коротким

FGHI-url этого письма: area://RU.NETWORKS?msgid=2:5061/6.100+4a9436f6