DevOps基础(1)--Shell脚本编程

由于Docker容器以及Kubernetes容器编排服务的蓬勃发展, 服务器以及业务服务的运维不再是运维工程师的专属, 业务的开发工程师也必须加入到运维的领域之中, 与运维工程师合作, 形成一套完整、高效的自动化运维与部署的系统。 而在我看来, 传统的运维工程师将会逐渐被应用开发工程师所取代, 因为Kubernetes赋予了开发人员强大的负载均衡、自动横向拓展以及高效管理的相关功能。 而在这些宏大的系统建设之前, Shell编程是无论如何都离不开的话题。

1. Shell变量

作为一个后台开发人员, Shell脚本既陌生由熟悉, 毕竟Linux命令哪个后台开发不会接触呢? 将一个又一个的Linux命令收集起来, 并使用一些粘合剂进行组合, 最终就得到了Shell脚本。

Shell和Python语言一样, 是一个弱类型语言, 也就是说一个变量可以对其进行任意的类型赋值:

smart@Zero:~$ foo="bar"
smart@Zero:~$ echo $foo
bar
smart@Zero:~$ foo=10
smart@Zero:~$ echo $foo
10

在Terminal中, Shell命令就是一个天然的类似于Python的IPython环境, 如果我们想要对Python的某些语法进行测试的话, 需要进入Python或者IPython环境中, 而对于Shell而言, 打开Terminal就是自己工作的海洋。

在Shell中, 变量的赋值与其它语言没什么区别, 只不过获取变量的方式稍有不同而已。 我们可以认为foo变量是值"bar"的一个引用, 而要获取变量值, 需要借助引用名加上$符号, 非常类似C的指针。

在Shell编程的推荐使用方法中, 使用${foo}的方式获取变量内容, 多加一个大括号, 这样一来能够更加清楚的界定变量名称的范围, 不至于出现一些奇奇怪怪的问题。

除了我们自己定义的变量以外, 在Linux运行时, 还会预先定义一系列的环境变量。 环境变量说的简单一些就是定义在某一个文件中, 供整个Linux使用的变量, 可以认为是一种最高层的全局变量。

smart@Zero:~$ env
...
WORKON_HOME=/home/smart/.virtualenvs
HOME=/home/smart
PATH=/home/smart/.local/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin:/usr/local/go/bin/

获取当前系统的环境变量也简单, 敲env即可。 在上面的结果中, WORKON_HOME是virtualenvwrapper的工作目录, 是我定义在~/.bashrc中的, 而HOMEPATH变量, 则是Linux操作系统定义的。

获取系统的环境变量和获取自己定义的变量一样, $符+变量名:

smart@Zero:~$ echo $HOME
/home/smart

值得一提的就是PATH变量, 在安装一些软件时, 例如Java, Go时, 都需要将一些变量加入到PATH中, 为什么这么做? Linux系统会在PATH变量值的路径中寻找可执行的二进制文件, 而当我们把诸如GOPATH的变量值假如到PATH变量中以后, 在任何的目录下, 都可以使用Go的相关命令, 这就是PATH变量的作用。

2. 获取系统函数的返回值

诸如cat, du, date等命令, 实际上就是函数, 只不过是由C编写并通过某种方式暴露给用户而已。

date函数用以获取当前时区的时间:

smart@Zero:~$ date
2019年 05月 12日 星期日 10:43:48 CST

在编写Shell脚本时, 很多时候都需要将函数的运行结果保存在某一个变量中, 所以Shell提供了两种方式进行结果的赋值:

  1. 使用variable=&#96date&#96
  2. 使用variable=$(date)
smart@Zero:~$ foo=`date`
smart@Zero:~$ echo $foo
2019年 05月 12日 星期日 10:49:21 CST
smart@Zero:~$ echo $foo
2019年 05月 12日 星期日 10:49:21 CST

如果查看date的manual手册的话, 会发现它还支持日期的格式化:

smart@Zero:~$ foo=`date +%y%m%d%H%M%S`
smart@Zero:~$ echo $foo
190512105105

此外, Shell还提供了对上一个命令所执行结果的获取, 使用$?进行获取。 这是什么意思? 在Shell中, 一条命令如果正常执行的话, 返回值将会是0, 如果命令执行时出现了某些错误的话, 返回值将会大于0, 且小于255。

# 执行一条正常的命令
smart@Zero:~$ echo "Hello World"
Hello World
smart@Zero:~$ echo $?
0

# 执行一条会抛出错误的命令
smart@Zero:~$ ls -alh NotExistFile
ls: cannot access 'NotExistFile': No such file or directory
smart@Zero:~$ echo $?
2

由于NotExistFile是一个不存在的文件, 所以ls命令会产生一个标准错误并输出至屏幕中, 此时的退出状态码将会为2。 一些常见的退出状态码如下:

状态码 描述 状态码 描述
0 命令成功结束 126 命令不可执行
1 一般性未知错误 127 没找到命令
2 不合适的shell命令 130 通过Ctrl+C退出的命令

3. 流程控制

既然是一种语言, 又怎么能少的了流程控制。 在Shell脚本中, 使用最为广泛的恐怕就是if-then判断了。

3.1 if-then

条件语句的基本模板:

if command-1
then
  command-2
else
  command-3
fi

需要特别注意的是, 这里的条件判断是command-1这条命令的执行结果: 如果command-1执行的退出状态码为0的话, 执行then语句块的内容, 否则退出。

#!/bin/bash

if ls -alh NotExistFile
then
  echo "The ls command exec successed"
else
  echo "Some error happened when exec ls"
fi

由于ls -alh NotExistFile的退出状态码为2, 所以将会输出”Some error happened when exec ls”。 如果我们想要true/false的条件语句, 使用[[ ]]。 例如, 如果变量foo的值为”bar”的话, 打印一条语句, 否则什么都不做:

#!/bin/bash

bar="foo"
if [[ ${bar} = "foo" ]]
then
  echo "Right"
fi

与传统的语言都不同的是, 判断两个变量是否相等使用的是单个=号, 而不是==, 需要注意。

Shell也提供了一些参数来帮助我们进行条件判断, 例如-n str表示检查str的长度是否大于0, -z str表示检查str的长度是否为0, -d file用以检测file是否存在并且是一个目录, -e file判断file是否存在…

if [[ -n ${bar} ]]
then
  echo "The length of the bar is not zero"
fi

if [[ -d "/home/smart" ]]
then
  echo "/home/smart exist, and it's a directory"
fi
3.2 case语句

有时候变量的值会有多种, 如果一个一个的写if的话太麻烦了, 所以就有了case语句, 基本模板:

case variable in
A | B) command-1 ;;
C) command-2 ;;
D) command-3 ;;
*) default-command ;;
esac

注意一下语法格式就好, 没有什么特别复杂的地方。

3.3 while语句

while语句的基本模板:

while condition
do
  command
done

condition的种类与if-then语法相同, 既可以判断命令的退出状态码, 也可以使用[[ ]]的形式来进行true/false判断:

# 一个无限循环
while [[ -n ${bar} ]]; do
    echo "The length of bar is not zero"
done
3.4 for循环

for循环的语法格式更贴近于Python, 其模板为:

for var in list
do
  command
done

例如使用通配符来生成文件列表, 然后遍历, 当遍历的文件是一个目录时, 打印它:

for file in /home/smart/*
do
  if [[ -d ${file} ]]
  then
    echo "${file} is a directory"
  fi
done

也可以使用C语言风格的循环语句:

for (( i = 0; i < 10; i++ )); do
    echo "${i}"
done

4. 处理用户输入与重定向

向脚本传递用户的参数是一个shell脚本最基本的操作, 脚本获取参数的方式也与其它语言不同。 诸如Java, 参数是以字符数组的方式传递给main函数的。

在shell中, 使用$1来获取第一个参数, $2获取第二个参数, …, $n获取第n个参数。 而$0比较特殊, 代表了执行该脚本的路径名称。

#!/bin/bash
# test.sh
echo ${0}, ${1}, ${2}, ${3}

在赋予了普通用户对该脚本的执行权限后, 执行该脚本: ./test.sh A B C, 将会得到输出:

./test.sh, A, B, C

对于$0, 如果只想要获取脚本名称的话, 可以使用$(basename ${0})。 获取参数个数使用$#, 获取所有参数使用$*或者是$@, 前者如果使用"$*"进行引用的话, 将会作为一个字符整体对待, 而$@不管在何种情况下, 都是参数所组成的列表, 所以$@更多的用于参数的迭代。

提到参数处理, 就不得不提及shift关键字。在使用shift命令时,默认情况下它会将每个参数变量向左移动一个位置。所以,变量$3的值会移到$2中,变量$2的值会移到$1中,而变量$1的值则会被删除。

shift的测试也很简单, 非常清楚的就能够知道它到底做了什么:

#!/bin/bash

echo "All param: $@"
shift
echo "The first shift: $@"
shift
echo "The second shift: $@"
shift
echo "The third shift: $@"

这次多传递一些参数进入该脚本, 得到的输出:

smart@Zero:~$ ./test.sh A B C D E F
All param: A B C D E F
The first shift: B C D E F
The second shift: C D E F
The third shift: D E F

每执行一次shift, 参数列表的首个参数都会被弹出, 如果执行shift 2的话, 将会弹出2个参数。

Ansible的ad-hoc模式中, 通常我们会这样执行命令:

# 将ansible所管理的所有主机进行文件拷贝, 并发数为10
ansible all -m copy -a "src=/home/smart/monitor/ dest=/home/monitor" -f 5

在有了shift之后, 就可以很轻松的编写出对应的shell脚本了:

#!/bin/sh
# simulate_ansible.sh
# 运行: ./simulate_ansible.sh all -m copy -a "src=/home/smart/monitor/ dest=/home/monitor" -f 5

echo "Get params: $@"
while [[ $# -gt 0 ]]; do
  case $1 in
  all)
    echo "The process host group: ${1}"
    shift ;;
  -m)
    echo "Get module name: ${2}"
    shift 2 ;;
  -a)
    echo "Get parameter: ${2}"
    shift 2 ;;
  -f)
    echo "The fork number is: ${2}"
    shift 2 ;;
  *)
    echo "Bad params"
    exit 2
  esac
done

在Linux I/O中, 标准输入使用0表示, 标准输出使用1表示, 标准错误使用2表示。 什么是标准输出/错误? 使用ls命令得到的结果就是标准输出, 使用ls NotExistFile命令得到的结果就是标准错误。

Shell脚本在执行时, 许多时候都是边缘触发或者是定时执行的, 其标准输出与错误我们是看不到的, 所以就需要有日志进行记录。 一个记录标准输出, 一个记录标准错误:

ls -alh NotExistFile 1>~/monitor/stdout.log 2>~/monitor/stderror.log

有时候想偷个懒, 不管是输出还是错误, 都重定向到同一个文件:

ls -alh &>~/homo/monitor/ls.log

5. 函数

shell中的函数并没有很强大的功能, 更像是一个小型的shell脚本。

# 定义
funcname() {...}
# 调用与参数传递
funcname "foo" "bar"

6. 常见的shell脚本头设置

有时会看到在某些shell脚本中有这样的语句:

set -e
set -x
exec &> test.log

set以及exec主要是对当前脚本的一些全局设置, 所以会放到脚本开始的地方。

set -e表示如果当前的脚本在执行某一条命令时的退出状态码不为0时, 则整个脚本退出。 有些类似于异常的抛出与进程终止。

#!/bin/bash
set -e
ls -alh
ls -alh NotExistFile
echo "Done"  # 永远不会执行到该行命令

set -x则主要用于进行DEBUG, 在脚本执行时将会打印出每一行命令执行的详细信息。

exec &> test.log则表示将当前脚本执行时所产生的所有标准输出与错误均重定向至test.log文件。

7. 子shell

假如我们编写了这样的一个shell脚本:

#!/bin/bash
cd /home/smart/monitor

然后执行该脚本, 会发现当前的目录并没有发生改变, 为什么? 这是因为不管是使用bash script.sh执行还是使用./script.sh来执行脚本, 脚本的执行都在一个名为子shell的shell环境中执行。 子shell中执行cd命令, 并不会影响到当前的shell状态。

8. 小结

从我的工作经验上来看, 如果是开发来兼职做运维工作的话, 以上的内容完全能够解决日常中需要的运维场景。 Shell脚本语言本身比较简单, 其核心仍然是一个又一个的Linux系统命令, Shell语言只是作为粘合剂将这些命令组合起来形成一个整体而已。

PS: 留一张思维导图作为自己的复习参考

smartkeyerror

日拱一卒,功不唐捐