四时宝库

程序员的知识宝库

原来批量重命名文件shell里有这么多讲究

根据您可用的非标准工具的不同,有许多不同的方法可以实现这一目标。即使只使用标准的 POSIX 工具,您仍然可以执行大多数简单的情况。我们先展示可移植工具的示例。

您可以使用循环和一些参数扩展来执行大多数非递归的批量重命名,示例如下:

# POSIX
# 将所有的*.foo重命名为*.bar
for f in *.foo; do mv -- "$f" "${f%.foo}.bar"; done

要在实际执行之前检查命令会做什么,可以在 mv 之前添加 echo。这适用于本页上几乎所有的示例,因此我们不再重复提及。

# POSIX
# 这将从所有文件中删除扩展名.zip。
for file in ./*.zip; do mv "$file" "${file%.zip}"; done

"--" 和 "./*" 用于防止以 "-" 开头的问题文件名。您只需要其中一个,不需要同时使用两个,选择您喜欢的即可。

以下是使用 Bash 特定的参数扩展的一些类似示例:

# Bash
# 将所有的空格替换为下划线
for f in *\ *; do mv -- "$f" "${f// /_}"; done

有关处理文件名中不方便字符的更多技巧,请参阅 FAQ#20。

# Bash
# 将 "foo" 替换为 "bar",即使它不是扩展名
for file in ./*foo*; do mv "$file" "${file//foo/bar}"; done

以上所有示例都为每个文件调用一次外部命令 mv(1),因此它们可能不像某些非标准实现那样高效。

递归重命名文件

如果您想要递归地重命名文件,这将变得更具挑战性。以下示例演示了如何将所有*.foo文件递归重命名为*.bar:

# Bash
# 还需要GNU或BSD的find(1)
# 递归地将所有*.foo文件更改为*.bar

find . -type f -name '*.foo' -print0 | while IFS= read -r -d '' f; do
  mv -- "$f" "${f%.foo}.bar"
done

此示例使用Bash 4的globstar?而不是GNU find:

# Bash 4
# 递归地将所有文件中的"foo"替换为"bar"。
# "foo"不能出现在目录名中!

shopt -s globstar
for file in /path/to/**/*foo*; do
    mv -- "$file" "${file//foo/bar}"
done

递归重命名最棘手的部分是确保您不会更改路径名的目录部分,因为像这样的操作注定会失败:

mv "./FOO/BAR/FILE.TXT" "./foo/bar/file.txt"

因此,任何递归重命名命令都应仅更改每个路径名的文件名部分,如下所示:

mv "./FOO/BAR/FILE.TXT" "./FOO/BAR/file.txt"

如果您还需要重命名目录,应该单独进行。此外,递归目录重命名应该以深度优先(仅在每个实例中更改目录名的最后组件)或多次进行。在一般情况下,深度优先效果更好。

以下是一个使用深度优先递归的示例脚本(将名称中的空格转换为下划线,但您只需要更改ren()?函数来执行您想要的任何操作),以重命名文件和目录。同样,可以轻松修改它,使其仅在文件或仅在目录上执行操作,或者仅在具有特定扩展名的文件上执行操作,以避免或强制覆盖文件等等:

# Bash
ren() {
  local newname
  newname=${1// /_}
  [[ $1 != "$newname" ]] && mv -- "$1" "$newname"
}

traverse() {
  local file
  cd -- "$1" || exit
  for file in *; do
    [[ -d $file ]] && traverse "$file"
    ren "$file"
  done
  cd .. || exit
}

# 主程序
shopt -s nullglob dotglob
traverse /path/to/startdir

另一种递归重命名所有包含空格的目录和文件的方法:

find . -depth -name "* *" -exec bash -c 'dir=${1%/*} base=${1##*/}; mv "$1" "$dir/${base// /_}"' _ {} \;

或者,如果您的find版本支持,以下方式更高效,因为它一次运行一个bash而不是每个文件运行一个bash:

find . -depth -name "* *" -exec bash -c 'for f; do dir=${f%/*} base=${f##*/}; mv "$f" "$dir/${base//空格转换为下划线}"; done' _ {} +

大写和小写

要使用标准工具将文件名转换为小写,您需要能够接受混合大小写的文件名作为输入,并将其转换为小写版本作为输出。在Bash 4及更高版本中,有一种参数展开的方法可以实现:

# Bash 4
for f in *[[:upper:]]*; do mv -- "$f" "${f,,}"; done

否则,tr(1)可能会有所帮助:

# tolower - 将文件名转换为小写
# POSIX
for file do
    [ -f "$file" ] || continue                # 忽略不存在的文件名
    newname=$(printf %s "$file" | tr '[:upper:]' '[:lower:]')     # 转换为小写
    [ "$file" = "$newname" ] && continue      # 无需操作
    [ -f "$newname" ] && continue             # 不要覆盖现有文件
    mv -- "$file" "$newname"
done

这个示例将无法处理以换行符结尾的文件名,因为CommandSubstitution会将其吞掉。解决这个问题的方法是在命令替换中附加一个字符,然后在之后将其删除。例如:

newname=$(printf %sx "$file" | tr '[:upper:]' '[:lower:]')
newname=${newname%x}

我们使用了高级范围表示法,因为在某些locales上,tr在使用A-Z范围时可能会表现得非常奇怪:

imadev:~$ echo Hello | tr A-Z a-z
héMMó

为了确保在使用范围时不会遇到意外情况,要么使用高级范围表示法,要么将区域设置为C。

imadev:~$ echo Hello | LC_ALL=C tr A-Z a-z
hello
imadev:~$ echo Hello | tr '[:upper:]' '[:lower:]'
hello
# 这两种方法都可以。

请注意,GNU tr不支持多字节字符(如非ASCII UTF-8字符)。因此,在GNU系统上,您可能更喜欢使用:

# GNU
sed 's/.*/\L&/g'
# POSIX
awk '{print tolower($0)}'

这种技术也可用于替换文件名中的所有不需要的字符,例如使用'_'(下划线)。脚本与上面的示例相同,只需更改"newname=..."这一行即可。

# renamefiles - 重命名文件名包含异常字符的文件
# POSIX
for file do
    [ -f "$file" ] || continue            # 忽略非常规文件等
    newname=$(printf '%s\n' "$file" | sed 's/[^[:alnum:]_.]/_/g' | paste -sd _ -)
    [ "$file" = "$newname" ] && continue  # 无需操作
    [ -f "$newname" ] && continue         # 不要覆盖现有文件
    mv -- "$file" "$newname"
done

方括号[]中的字符类包含我们要保留的所有字符(^后面的字符);根据需要进行修改。[:alnum:]范围表示当前区域设置的所有字母和数字。但请注意,它不会替换不构成有效字符的字节(如使用错误字符集编码的字符)。

以下是一个修改后的示例,使用参数展开代替sed:

# renamefiles(更高效、不太便携的版本)
# Bash/Ksh/Zsh
for file in "$@"; do
   [[ -f "$file" ]] || continue
   newname=${file//[![:alnum:]_.]/_}
   [[ "$file" = "$newname" ]] && continue
   [[ -e "$newname" ]] && continue
   [[ -L "$newname" ]] && continue
   mv -- "$file" "$newname"
done

需要注意的是,所有这些示例都涉及到竞态条件。如果在[ -e "$newname" ...?和mv "$file" ...?之间创建了一个现有文件,那么该文件可能会被覆盖。解决此问题超出了本页面的范围,但可以通过为mv命令添加-i?选项和(GNU特定的)-T?选项来减轻其影响。

最后,关于更改文件名大小写的说明:在使用GNU mv时,在许多文件系统上,尝试将文件重命名为其小写或大写等效名称可能会失败。(例如,在使用FAT或NTFS文件系统的DOS/Windows系统上的Cygwin,以及在使用HFS+处于不区分大小写模式的Mac OS X系统上的GNU mv。还有在挂载了Windows/Mac文件系统的Linux系统上,以及可能是其他许多设置。)GNU mv在尝试重命名之前会检查目标名称,并且由于文件系统的映射,它认为目标“已经存在”:

mv README Readme    # 在FAT文件系统等上使用GNU mv会失败

解决此问题的方法是将文件重命名两次:首先将其重命名为与原始名称完全不同的临时名称,然后再重命名为所需名称。

mv README tempfilename &&
mv tempfilename Readme

非标准工具

如果您的计算机上安装了mmv(1)实用程序,您可以使用以下命令将文件名转换为小写:

# 将所有文件名转换为小写
mmv "*" "#l1"

一些GNU/Linux发行版提供了rename(1)命令,但语法在不同的发行版之间有所差异。Debian使用perl rename脚本(以前包含在Perl中,现在不再包含),将其安装为prename(1)和rename(1)。Red Hat使用完全不同的rename(1)命令。

prename脚本非常灵活。例如,可以用它来将文件名转换为小写:

# 将所有文件名转换为小写
prename '$_=lc($_)' ./*

或者也可以使用:

# 将所有文件名转换为小写
prename 'y/A-Z/a-z/' ./*

如果要让prename在处理UTF-8编码的文件时使用Unicode而不是ASCII:

# 使用Unicode规则将所有文件名转换为小写
PERL_UNICODE=SA rename '$_=lc' ./*

要使用当前locale字符集对文件名进行操作:

rename 'BEGIN{use Encode::Locale qw(decode_argv);decode_argv} $_=lc'

(请注意,它仍然不会使用locale的大小写转换规则。例如,在土耳其语环境中,I将被转换为?,而不是i)。

或者递归地进行操作:

# 递归地将所有文件名转换为小写(假设find实现支持非标准的-execdir谓词)
#
# 注意:这不会更改目录名。这是因为-execdir在运行命令之前会将当前目录更改为父目录。这意味着尽管有+,但每个文件重命名都会执行一个prename命令。
find . -type f -name '*[[:upper:]]*' -execdir prename '$_=lc($_)' {} +

更高效和可移植的方法:

find . -type f -name '*[[:upper:]]*' -exec prename 's{[^/]*$}{lc()}e' {} +

或者将所有下划线替换为空格:

prename 's/_/ /g' ./*_*

使用$EDITOR(来自moreutils)以交互方式重命名文件:

vidir

或者递归地进行操作:

find . -type f | vidir -

(注意:vidir无法处理文件名中包含换行符的情况。)

更多

如果您觉得文章内容对你有一点帮助可以关注我,我在头条平台会持续分享更多实用的shell技巧和最佳实践,如果想系统的快速学习shell的各种高阶用法和生产环境避坑指南可以看看《shell脚本编程最佳实践》专栏,专栏里有更多的实用小技巧和脚本代码分享。

发表评论:

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言
    友情链接