Страница 1 из 1
Массово сверить hash'и
Добавлено: 20 дек 2011, 14:37
yad0ff
Есть задача собрать список хешей со списка файлов, затем просто брать по 1-2 файлу и прогонять их хеши на поиск дублей из списка. Есть на примете какие-нибудь готовые варианты? Или здесь такое не юзають? :drink:
Re: Массово сверить hash'и
Добавлено: 20 дек 2011, 18:58
Waasja
Для составления списка из хешей файлов использую Directory Lister Pro 1.01.
Что касаетя поиска дубликатов, то есть много прог.
Обрати внимание на те, которые могут работать с файлом хешей.
Для простого поиска дубликатов можно использовать Total Commander (запустить там поиск файлов с установленными галочками "по размеру" и "по содержимому" на вкладке ''Дополнительно'').
Для моих задач толком ни одна прога не подошла и я придумал свой способ (см. ниже).
Что касается поиска дубликатов по хешам из списка, то я поступаю следующим образом:
- Список, составленный Directory Lister Pro 1.01 сохраняю в формате .csv
- Открываю .csv-файл экселем сортирую по колонке в которой содержаться хеши
- Становлюсь на верхнюю ячейку с хешем
- В ячейке справа от не вбиваю формулу для сравнения значений соседних ячеек с хешем (например, =F5<>F6)
- Копируем эту формулу вниз до последней ячейки с хешем
- Выделяем столбец с формулами и преобразуем значения формул в текст
- Сортируем по столбцу в котором теперь находятся текстовые значения формул
Re: Массово сверить hash'и
Добавлено: 20 дек 2011, 19:42
yad0ff
Спасибо за совет :) Скачаю, попробую :good:
Re: Массово сверить hash'и
Добавлено: 20 дек 2011, 20:53
VictorPetrov
Может быть, поможет эта прога:
http://mpsoft.h1.ru/
Прога жутко древняя. Однако лично проверял, что работает от Win95 до Win7-64 включительно.
Отлично ищет дубликаты.
Re: Массово сверить hash'и
Добавлено: 20 дек 2011, 21:06
Dms
Waasja, не совсем понял, что, как и с чем ты сравниваешь, но, кажется, функция ВПР в Excel облегчила бы работу :)
Re: Массово сверить hash'и
Добавлено: 20 дек 2011, 21:09
GreyCat
yad0ff, прога называется Delete Duplicate Files. Достаточно гибкая и с Hash замечательно работает.
Re: Массово сверить hash'и
Добавлено: 20 дек 2011, 21:51
Waasja
to Dms:
Если стоит задача найти дубликаты в СПИСКЕ, находящемся в экселевском файле, то я сначала сортировал таблицу по колонке хешей.
В результате, если в таблице есть записи с одинаковым хешем, то они будут расположены последовательно (один над другим).
А чтобы визуализировать такие строки я сравнивал хеш в текущей ячейке с хешем в ячейке, расположенной под ней при помощи формулы (например, =F5<>F6), которая выдавала логическое значение (ЛОЖЬ или ИСТИНА).
А чтобы не пролистывать всю таблицу (у меня была таблица порядка нескольких десятков тысяч строк) вручную я собирал все дубликаты в начале таблицы при помощи сортировки по столбцу, содержащему вышеприведённую формулу, естественно предварительно преобразовав значения формул в текст.
Пример с Экселем в моём первом посте был небольшой частью решения следующей задачи:
На локальном ПК есть файлы .djvu, .pdf, .chm, .rar, .zip и некоторые другие.
На сайте электронной библиотеки Genesis Library есть .xls-файл с названиями и хешами электронных книг, присутствующих в этой библиотеке.
Задача:
Выкинуть из библиотечного .xls-файла книги, которые уже есть на локальном ПК, чтобы не отвлекаться на них при просмотре списка книг библиотеки.
Re: Массово сверить hash'и
Добавлено: 21 дек 2011, 09:18
Dms
Waasja, примерно понятно, но нужно смотреть сами файлы :)
Re: Массово сверить hash'и
Добавлено: 21 дек 2011, 14:10
yad0ff
спасибо всем, опробую все варианты :drink: