Re: [ssfr] Un grand classique : les doublons

[ Thread Index | Date Index | More debianworld.org/shellscript-fr Archives ]


On Thu, Nov 26, 2009 at 08:31:12AM +0100, steve wrote:
> J'ai 1.5 To de données à traiter.

<disclaimer>
Ça va prendre du temps :-)

> J'aimerai trouver tous les n-plons, déplacer les (n-1)-plons dans un
> nouveau répertoire 'duplicates' en gardant la même arborescence que
> l'original (important ça). J'aimerai donc avoir à la fin
> 
> - répertoire original nettoyé
> - répertoire duplicates contenant les (n-1)-plons
> 
> 
> Pour cela il va falloir :
> 
> ° une méthode pour trouver les n-plons (md5, date, taille, .. ?)
> ° une méthode pour choisir quels fichiers déplacer

Pour trouver, c'est facile:

find / ­type f -print0 | xargs -0 md5sum > all_files.md5
sort all_files.md5 | uniq -d > duplicates

Pour choisir, je vois pas de solution simple, il faut
commencer par décider ce que tu veux faire.

Y.



Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/