欢迎登陆真网站,您的到来是我们的荣幸。 登陆 注册 忘记密码? ☆设为首页 △加入收藏
欢迎加入真幸福QQ群
电脑知识: 基础知识 网络技术 操作系统 办公软件 电脑维修 电脑安全 windows7 windows8 windows10 服务器教程 平板电脑 视频播放教程 网络应用 互联网 工具软件 浏览器教程 QQ技巧 输入法教程 影视制作 YY教程 wps教程 word教程 Excel教程 PowerPoint
云南西双版纳特产小花糯玉米真空包装


linux新建文件权限问题
保障Windows服务器部署安全的五大最佳方式
eMule影响下载速度的因素有哪些
eMule如何开启好友通道
LINUX关闭防火墙的方法
Linux下多窗口分屏式终端--Terminator
怎么用鲁大师给电脑量体温
WinRAR如何更改备份文件
Linux---Nagios监控出图
linux命令系列之man
linuxshell删除重复文件只保留一份
【 来源:网络 】【 点击:1 】 【 发布时间:2017_03_03 08:59:59 】

   #!/bin/bash

  #name:remove_one.sh

  #用途:查找并删除重复文件,每个文件只保留一个样本

  #将文件依据大小排序并输出

  ls -lS | awk 'BEGIN {

  #得到第一行total总数并丢弃,读取下一行

  getline;getline;

  name1=$9;size=$5;

  }

  {

  name2=$9;

  if(size==$5)

  #大小一样的可能是内容相同的文件

  {

  #用md5进行校验和

  ("md5sum "name1)|getline; csum1=$1;

  ("md5sum "name2)|getline; csum2=$1;

  #如果校验和相同则为内容相同的文集,输出名字

  if( csum1==csum2 )

  {

  {print name1;print name2}

  }

  };

  size=$5;name1=name2;

  }' | sort -u > duplicate_files

  #计算重复文件的md5sum,将重复文件中的一采样写入duplicate_sample中

  cat duplicate_files|xargs -I {} md5sum {}| sort | uniq -w 32 | awk '{print $2}' | sort -u > duplicate_sample

  echo Removing...

  #删除在duplicate_files中列出且未被duplicate_sample列出的全部文件

  comm duplicate_files duplicate_sample -2 -3|tee /dev/stderr|xargs rm

  echo Removed duplicates files successfully

  --------------------------------------------------------

  执行:

  [root@node1 tmp]# sh remove_one.sh

  过滤的是当前目录下的,不处理目录,不递归处理子目录

本网站由川南居提供技术支持,fkzxf版权所有 浙ICP备12031891号
淳安分站 淳安分站