Re: [ssfr] Un grand classique : les doublons

[ Thread Index | Date Index | More debianworld.org/shellscript-fr Archives ]


* Yves Rutschle <ssfr@xxxxxxxxxxxx> [2009-11-26 14:30:39 +0100] wrote :

> On Thu, Nov 26, 2009 at 08:31:12AM +0100, steve wrote:
> > J'ai 1.5 To de données à traiter.
> 
> <disclaimer>
> Ça va prendre du temps :-)
> 
> > J'aimerai trouver tous les n-plons, déplacer les (n-1)-plons dans un
> > nouveau répertoire 'duplicates' en gardant la même arborescence que
> > l'original (important ça). J'aimerai donc avoir à la fin
> > 
> > - répertoire original nettoyé
> > - répertoire duplicates contenant les (n-1)-plons
> > 
> > 
> > Pour cela il va falloir :
> > 
> > ° une méthode pour trouver les n-plons (md5, date, taille, .. ?)
> > ° une méthode pour choisir quels fichiers déplacer
> 
> Pour trouver, c'est facile:
> 
> find / ­type f -print0 | xargs -0 md5sum > all_files.md5
> sort all_files.md5 | uniq -d > duplicates
> 
> Pour choisir, je vois pas de solution simple, il faut
> commencer par décider ce que tu veux faire.
> 
> Y.

Il y a un package fdupes qui te permet de détecter les doublons ;) 

mes 2¢ :)
-- 
 .''`.  Edi Stojicevic
: :'  : Debian GNU/Linux user, admin & developer - http://www.debian.org
`. `~'  French speaking Debian website founder   - http://www.debianworld..org
  `-    GPG Key Id : 0x1237B032



Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/