Массово сверить hash'и

Здесь разговариваем о Софте и работнике его Харде
yad0ff
Сообщения: 628
Зарегистрирован: 25 июн 2009, 12:34
Благодарил (а): 0
Поблагодарили: 0

Массово сверить hash'и

Сообщение yad0ff »

Есть задача собрать список хешей со списка файлов, затем просто брать по 1-2 файлу и прогонять их хеши на поиск дублей из списка. Есть на примете какие-нибудь готовые варианты? Или здесь такое не юзають? :drink:
Waasja
Сообщения: 58
Зарегистрирован: 01 июн 2009, 20:09
Благодарил (а): 0
Поблагодарили: 0
Контактная информация:

Re: Массово сверить hash'и

Сообщение Waasja »

Для составления списка из хешей файлов использую Directory Lister Pro 1.01.

Что касаетя поиска дубликатов, то есть много прог.
Обрати внимание на те, которые могут работать с файлом хешей.
Для простого поиска дубликатов можно использовать Total Commander (запустить там поиск файлов с установленными галочками "по размеру" и "по содержимому" на вкладке ''Дополнительно'').

Для моих задач толком ни одна прога не подошла и я придумал свой способ (см. ниже).

Что касается поиска дубликатов по хешам из списка, то я поступаю следующим образом:
- Список, составленный Directory Lister Pro 1.01 сохраняю в формате .csv
- Открываю .csv-файл экселем сортирую по колонке в которой содержаться хеши
- Становлюсь на верхнюю ячейку с хешем
- В ячейке справа от не вбиваю формулу для сравнения значений соседних ячеек с хешем (например, =F5<>F6)
- Копируем эту формулу вниз до последней ячейки с хешем
- Выделяем столбец с формулами и преобразуем значения формул в текст
- Сортируем по столбцу в котором теперь находятся текстовые значения формул
yad0ff
Сообщения: 628
Зарегистрирован: 25 июн 2009, 12:34
Благодарил (а): 0
Поблагодарили: 0

Re: Массово сверить hash'и

Сообщение yad0ff »

Спасибо за совет :) Скачаю, попробую :good:
Аватара пользователя
VictorPetrov
Сообщения: 4146
Зарегистрирован: 26 июн 2006, 15:37
Откуда: 8(904)365-8414
Благодарил (а): 0
Поблагодарили: 0
Контактная информация:

Re: Массово сверить hash'и

Сообщение VictorPetrov »

Может быть, поможет эта прога:
http://mpsoft.h1.ru/
Прога жутко древняя. Однако лично проверял, что работает от Win95 до Win7-64 включительно.
Отлично ищет дубликаты.
Аватара пользователя
Dms
Сообщения: 8380
Зарегистрирован: 15 ноя 2006, 23:43
Настоящее имя: Серёга
Откуда: Смоленск
Благодарил (а): 28 раз
Поблагодарили: 29 раз
Контактная информация:

Re: Массово сверить hash'и

Сообщение Dms »

Waasja, не совсем понял, что, как и с чем ты сравниваешь, но, кажется, функция ВПР в Excel облегчила бы работу :)
Американская фирма Transceptor Technology
Приступила к производству компьютеров "Персональный спутник"
Аватара пользователя
GreyCat
Сообщения: 16647
Зарегистрирован: 27 май 2007, 04:16
Благодарил (а): 0
Поблагодарили: 217 раз
Контактная информация:

Re: Массово сверить hash'и

Сообщение GreyCat »

yad0ff, прога называется Delete Duplicate Files. Достаточно гибкая и с Hash замечательно работает.
Матрешка, я счастлив в браке! Хватит за мной бегать. Отстань от меня, ебaнутая на всю голову ты баба!
Waasja
Сообщения: 58
Зарегистрирован: 01 июн 2009, 20:09
Благодарил (а): 0
Поблагодарили: 0
Контактная информация:

Re: Массово сверить hash'и

Сообщение Waasja »

to Dms:

Если стоит задача найти дубликаты в СПИСКЕ, находящемся в экселевском файле, то я сначала сортировал таблицу по колонке хешей.
В результате, если в таблице есть записи с одинаковым хешем, то они будут расположены последовательно (один над другим).
А чтобы визуализировать такие строки я сравнивал хеш в текущей ячейке с хешем в ячейке, расположенной под ней при помощи формулы (например, =F5<>F6), которая выдавала логическое значение (ЛОЖЬ или ИСТИНА).
А чтобы не пролистывать всю таблицу (у меня была таблица порядка нескольких десятков тысяч строк) вручную я собирал все дубликаты в начале таблицы при помощи сортировки по столбцу, содержащему вышеприведённую формулу, естественно предварительно преобразовав значения формул в текст.


Пример с Экселем в моём первом посте был небольшой частью решения следующей задачи:
На локальном ПК есть файлы .djvu, .pdf, .chm, .rar, .zip и некоторые другие.
На сайте электронной библиотеки Genesis Library есть .xls-файл с названиями и хешами электронных книг, присутствующих в этой библиотеке.

Задача:
Выкинуть из библиотечного .xls-файла книги, которые уже есть на локальном ПК, чтобы не отвлекаться на них при просмотре списка книг библиотеки.
Аватара пользователя
Dms
Сообщения: 8380
Зарегистрирован: 15 ноя 2006, 23:43
Настоящее имя: Серёга
Откуда: Смоленск
Благодарил (а): 28 раз
Поблагодарили: 29 раз
Контактная информация:

Re: Массово сверить hash'и

Сообщение Dms »

Waasja, примерно понятно, но нужно смотреть сами файлы :)
Американская фирма Transceptor Technology
Приступила к производству компьютеров "Персональный спутник"
yad0ff
Сообщения: 628
Зарегистрирован: 25 июн 2009, 12:34
Благодарил (а): 0
Поблагодарили: 0

Re: Массово сверить hash'и

Сообщение yad0ff »

спасибо всем, опробую все варианты :drink:
Ответить Пред. темаСлед. тема