4 herramientas útiles para encontrar y eliminar archivos duplicados en Linux

4 herramientas útiles para encontrar y eliminar archivos duplicados en Linux

Organizar el directorio de su hogar o incluso el sistema puede ser particularmente difícil si tiene el hábito de descargar todo tipo de cosas de Internet.

A menudo puede encontrar que ha descargado los mismos MP3, PDF, EPUB (y todo tipo de extensiones de archivos) y lo copió a diferentes directorios. Esto puede hacer que sus directorios se desordenen con todo tipo de cosas inútiles duplicadas.

En este tutorial, aprenderá a encontrar y eliminar archivos duplicados en Linux usando rdfind y fdupes Herramientas de línea de comandos, así como el uso de herramientas GUI llamadas Dupeguru e fslint.

Una nota de precaución: siempre tenga cuidado con lo que elimina en su sistema, ya que esto puede conducir a una pérdida de datos no deseada. Si está utilizando una nueva herramienta, primero pruébela en un directorio de prueba donde la eliminación de archivos no será un problema.

1. Rdfind: encuentra archivos duplicados en Linux

Rdfind proviene de datos redundantes encontrar. Es una herramienta gratuita utilizada para encontrar archivos duplicados en múltiples directorios. Utiliza la suma de verificación y encuentra duplicados basados ​​en el archivo contiene no solo nombres.

Rdfind Utiliza un algoritmo para clasificar los archivos y detecta cuál de los duplicados es el archivo original y considera el resto como duplicados. Las reglas de clasificación son:

  • Si A se encontró mientras escaneaba un argumento de entrada antes que B, A es más alto de clasificación.
  • Si A fue encontrado a una profundidad inferior a B, A es más alto de clasificación.
  • Si A fue encontrado antes de B, A es más alto de clasificación.

La última regla se usa particularmente cuando se encuentran dos archivos en el mismo directorio.

Instalar rdfind En Linux, use el siguiente comando según su distribución de Linux.

$ sudo apt-get install rdfind [en Debian/Ubuntu] $ sudo yum instalación epel-release && $ sudo yum install rdfind [en CentOS/RHEL] $ sudo dnf install rdfind [en Fedora 22+] $ sudo pacman -s rdfind [en Arch Linux] 

Correr rdfind en un directorio simplemente escriba rdfind y el directorio de destino. Aquí hay un ejemplo:

$ rdfind /home /usuario 
Encontrar archivos duplicados en Linux

Como se puede ver rdfind Guardará los resultados en un archivo llamado resultados.TXT ubicado en el mismo directorio desde donde ejecutó el programa. El archivo contiene todos los archivos duplicados que RDFind ha encontrado. Puede revisar el archivo y eliminar los archivos duplicados manualmente si desea.

Otra cosa que puedes hacer es usar el -dryrun Una opción que proporcionará una lista de duplicados sin tomar ninguna acción:

$ rdfind -dryrun true /home /user 

Cuando encuentre los duplicados, puede elegir reemplazarlos con enlaces duros.

$ rdfind -MakeHardLinks True /Home /User 

Y si desea eliminar los duplicados, puede ejecutar.

$ RDFIND -DeletEduplica True /Home /User 

Para verificar otras opciones útiles de rdfind puedes usar el rdfind manual con.

$ man rdfind 

2. FDUPES: escanee los archivos duplicados en Linux

FDUPES es otro programa que le permite identificar archivos duplicados en su sistema. Es gratis y de código abierto y escrito en c. Utiliza los siguientes métodos para determinar archivos duplicados:

  • Comparación de firmas parciales MD5SUM
  • Comparación de firmas completas de md5sum
  • verificación de comparación de byte por byte

Al igual que rdfind Tiene opciones similares:

  • Búsqueda recursivamente
  • Excluir archivos vacíos
  • Muestra el tamaño de los archivos duplicados
  • Eliminar los duplicados inmediatamente
  • Excluir archivos con un propietario diferente

Instalar fdupes En Linux, use el siguiente comando según su distribución de Linux.

$ sudo apt-get install fdupes [en Debian/Ubuntu] $ sudo yum instalación epel-release && $ sudo yum install fdupes [en CentOS/RHEL] $ sudo dnf install fdupes [en Fedora 22+] $ sudo Pacman -S fdupes [en Arch Linux] 

Fdupes La sintaxis es similar a rdfind. Simplemente escriba el comando seguido del directorio que desea escanear.

$ fdupes  

Para buscar archivos recursivamente, deberá especificar el -riñonal una opción como esta.

$ fdupes -r  

También puede especificar múltiples directorios y especificar un prostituta para ser buscado recursivamente.

$ fdupes -r  

Para que los fdupes calculen el tamaño de los archivos duplicados, use el -S opción.

$ fdupes -s  

Para recopilar información resumida sobre los archivos encontrados, use el -metro opción.

$ fdupes -m  
Escanear archivos duplicados en Linux

Finalmente, si desea eliminar todos los duplicados, use el -d una opción como esta.

$ fdupes -d  

Fdupes preguntará cuál de los archivos encontrados eliminar. Deberá ingresar el número de archivo:

Eliminar archivos duplicados en Linux

Una solución que definitivamente no se recomienda usar el -norte opción que resultará en preservar el primer archivo solamente.

$ fdupes -dn  

Para obtener una lista de opciones disponibles para usar con fdupes Revise la página de ayuda ejecutando.

$ fdupes -Help 

3. Dupeguru: encuentre archivos duplicados en un Linux

dupeguru es una herramienta de fuente abierta y multiplataforma que se puede usar para encontrar archivos duplicados en un sistema Linux. La herramienta puede escanear nombres de archivo o contenido en una o más carpetas. También le permite encontrar el nombre de archivo que es similar a los archivos que está buscando.

Dupeguru viene en diferentes versiones para las plataformas de Windows, Mac y Linux. Su característica rápida de algoritmo de coincidencia difusa le ayuda a encontrar archivos duplicados en un minuto. Es personalizable, puede extraer los archivos duplicados exactos que desea, y eliminar archivos no deseados del sistema.

Instalar dupeguru En Linux, use el siguiente comando según su distribución de Linux.

--------------- En Debian/Ubuntu/Mint --------------- $ sudo add-apt-repository PPA: dupeguru/ppa $ sudo apt-get actualización $ sudo apt-get instalación dupeguru 
--------------- En Arch Linux --------------- $ sudo Pacman -S Dupeguru 
Dupeguru: encuentre archivos duplicados en Linux

4. Fslint - Finder de archivos duplicados para Linux

Fslint es una utilidad gratuita que se utiliza para encontrar y limpiar varias formas de pelusa en un sistema de archivos. También informa archivos duplicados, directorios vacíos, archivos temporales, nombres duplicados/conflictivos (binarios), malos enlaces simbólicos y muchos más. Tiene modos de línea de comandos y GUI.

Instalar Fslint En Linux, use el siguiente comando según su distribución de Linux.

$ sudo apt-get install fslint [en Debian/Ubuntu] $ sudo yum instalación Epel-Release && $ sudo yum install fslint [en CentOS/RHEL] $ sudo dnf install fslint [en Fedora 22+] $ sudo Pacman -S fslint [en Arch Linux] 
Fslint - Finder de archivos duplicados para -linux
Conclusión

Estas son las herramientas muy útiles para encontrar archivos duplicados en su sistema Linux, pero debe tener mucho cuidado al eliminar dichos archivos.

Si no está seguro si necesita un archivo o no, sería mejor crear una copia de seguridad de ese archivo y recordar su directorio antes de eliminarlo. Si tiene alguna pregunta o comentario, envíelos en la sección de comentarios a continuación.