Re: Посоветовать хэш
От Valentin Davydov (2:5020/400) к Alex Aka Parasite
В ответ на Заголовок предыдущего сообщения в треде (Имя Автора)
From: Valentin Davydov <sp@m.davydov.spb.su>
> From: Alex Aka Parasite
> <Alex.Aka.Parasite@p100.f164.n5049.z2.fidonet.org>
> Date: Sun, 23 Aug 2009 22:02:34 +0400
>
>PPS: я бы и заюзал этот вариант, но это доп.нагрузка на камень и более высокие
>расходы по хранению более длинной строки. Вот жду, может кто-то посоветует
>более удачную реализацию.
Вот сейчас протестировал на небольшом наборе данных (несколько десятков
тысяч файлов размером от 0 до 3 мегабайт, в среднем около 10 килобайт)
использование в качестве ключа собственно содержимого файла. Результат:
размер базы составил 100% суммарного размера файлов на главную таблицу,
ещё столько же на индекс и 2.5% на оверхед собственно базы, итого 202.5%
суммарного размера файлов. То есть меньше, чем, например, у файловой
системы с размером кластера 32 килобайта. Скорость отслеживания коллизий
по сравнению с короткими записями снизилась незначительно (точно пока не
мерял, т.к. размер базы сравним с размером ОЗУ и поэтому могут влиять
эффекты кэширования и т.п.).
Вал. Дав.
--- ifmail v.2.15dev5.4
* Origin: Demos online service (2:5020/400)
Ответы на это письмо:
From: Username
Заголовок следующего сообщения в треде может быть длинным и его придется перенести на новую строку
From: Username
Или коротким