当前位置:   article > 正文

7、k8s 运行一次性任务、Job 失败了怎么办、并行执行 Job、定时执行 Job_kubectl get jobs无法查看到任务

kubectl get jobs无法查看到任务

k8s 运行一次性任务

容器按照持续运行的时间可分为两类:服务类容器和工作类容器。
服务类容器通常持续提供服务,需要一直运行,比如 http server,daemon 等。工作类容器则是一次性任务,比如批处理程序,完成后容器就退出。
Kubernetes 的 Deployment、ReplicaSet 和 DaemonSet 都用于管理服务类容器;对于工作类容器,我们用 Job。

简单的 Job 配置文件 myjob.yml:

  1. [root@master ~]# vim myjob.yml
  2. apiVersion: batch/v1
  3. kind: Job
  4. metadata:
  5. name: myjob
  6. spec:
  7. template:
  8. metadata:
  9. name: myjob
  10. spec:
  11. containers:
  12. - name: hello
  13. image: busybox
  14. command: ["echo","hello k8s job!"]
  15. restartPolicy: Never

① batch/v1 是当前 Job 的 apiVersion。
② kind: Job指明当前资源的类型为 Job。
③ restartPolicy 指定什么情况下需要重启容器。对于 Job,只能设置为 Never 或者 OnFailure。对于其他 controller(比如 Deployment)可以设置为 Always 。
通过 kubectl apply -f myjob.yml 启动 Job。

  1. [root@master ~]# kubectl apply -f myjob.yml
  2. job.batch/myjob created
  3. [root@master ~]# kubectl get job
  4. NAME COMPLETIONS DURATION AGE
  5. myjob 0/1 15s 15s

kubectl get job 查看 Job 的状态:

  1. [root@master ~]# kubectl get job
  2. NAME COMPLETIONS DURATION AGE
  3. myjob 1/1 18s 19s

DESIRED 和 SUCCESSFUL 都为 1,表示按照预期启动了一个 Pod,并且已经成功执行。kubectl get pod 查看 Pod 的状态:

  1. [root@master ~]# kubectl get pod
  2. NAME READY STATUS RESTARTS AGE
  3. myjob-q2fln 0/1 Completed 0 17s

kubectl logs 可以查看 Pod 的标准输出:

  1. [root@master ~]# kubectl logs myjob-q2fln
  2. hello k8s job!

Job 失败了怎么办

如果失败了会怎么样呢?

修改 myjob.yml,故意引入一个错误:

  1. apiVersion: batch/v1
  2. kind: Job
  3. metadata:
  4. name: myjob
  5. spec:
  6. template:
  7. metadata:
  8. name: myjob
  9. spec:
  10. containers:
  11. - name: hello
  12. image: busybox
  13. command: ["invalid_command","hello k8s job!"]
  14. restartPolicy: Never

先删除之前的 Job:

  1. [root@master ~]# kubectl delete -f myjob.yml
  2. job.batch "myjob" deleted

如果将 restartPolicy 设置为 OnFailure 会怎么样?下面我们实践一下,修改 myjob.yml 后重新启动。

运行新的 Job 并查看状态:

  1. [root@master ~]# vi myjob.yml
  2. [root@master ~]# kubectl apply -f myjob.yml
  3. job.batch/myjob created
  4. [root@master ~]# kubectl get job
  5. NAME COMPLETIONS DURATION AGE
  6. myjob 0/1 12s 12s

当前COMPLETIONS 的 Pod 数量为 0/1,查看 Pod 的状态:

  1. [root@master ~]# kubectl get pod
  2. NAME READY STATUS RESTARTS AGE
  3. myjob-7qfd5 0/1 ContainerCannotRun 0 32s
  4. myjob-kpp2t 0/1 ContainerCannotRun 0 12s
  5. myjob-mvcql 0/1 ContainerCannotRun 0 42s
  6. myjob-pkwbg 0/1 ContainerCannotRun 0 46s

可以看到有多个 Pod,状态均不正常。kubectl describe pod 查看某个 Pod 的启动日志:

日志显示没有可执行程序

为什么 kubectl get pod 会看到这么多个失败的 Pod?

原因是:当第一个 Pod 启动时,容器失败退出,根据 restartPolicy: Never,此失败容器不会被重启,但 Job DESIRED 的 Pod 是 1,目前 COMPLETIONS 为 0/1,不满足,所以 Job controller 会启动新的 Pod,直到 COMPLETIONS为 1/1。对于我们这个例子,COMPLETIONS 永远也到不了 1/1,所以 Job controller 会一直创建新的 Pod。为了终止这个行为,只能删除 Job。

  1. [root@master ~]# kubectl delete -f myjob.yml
  2. job.batch "myjob" deleted

如果将 restartPolicy 设置为 OnFailure 会怎么样?下面我们实践一下,修改 myjob.yml 后重新启动。

  1. [root@master ~]# vim myjob.yml
  2. apiVersion: batch/v1
  3. kind: Job
  4. metadata:
  5. name: myjob
  6. spec:
  7. template:
  8. metadata:
  9. name: myjob
  10. spec:
  11. containers:
  12. - name: hello
  13. image: busybox
  14. command: ["invalid_command","hello k8s job!"]
  15. restartPolicy: OnFailure
  1. [root@master ~]# kubectl apply -f myjob1.yml
  2. job.batch/myjob created
  3. [root@master ~]# kubectl get job
  4. NAME COMPLETIONS DURATION AGE
  5. myjob 0/1 33s 33s

Job 的 COMPLETIONS Pod 数量还是为 0/1,看看 Pod 的情况:

  1. [root@master ~]# kubectl get pod
  2. NAME READY STATUS RESTARTS AGE
  3. myjob-8lmmp 0/1 RunContainerError 3 69s

这里只有一个 Pod,不过 RESTARTS 为 3,而且不断增加,说明 OnFailure 生效,容器失败后会自动重启。

并行执行 Job

同时运行多个 Pod,提高 Job 的执行效率。这个可以通过 parallelism 设置。

  1. [root@master ~]# vim myjob.yml
  2. apiVersion: batch/v1
  3. kind: Job
  4. metadata:
  5. name: myjob
  6. spec:
  7. parallelism: 2
  8. template:
  9. metadata:
  10. name: myjob
  11. spec:
  12. containers:
  13. - name: hello
  14. image: busybox
  15. command: ["echo","hello k8s job!"]
  16. restartPolicy: Never

这里我们将并行的 Pod 数量设置为 2,实践一下:

  1. [root@master ~]# kubectl apply -f myjob.yml
  2. job.batch/myjob created
  3. [root@master ~]# kubectl get pod
  4. NAME READY STATUS RESTARTS AGE
  5. myjob-lc5kl 0/1 Completed 0 16s
  6. myjob-mdrdr 0/1 Completed 0 16s
  7. [root@master ~]# kubectl get job
  8. NAME COMPLETIONS DURATION AGE
  9. myjob 2/1 of 2 5s 31s
  10. [root@master ~]# kubectl get pod
  11. NAME READY STATUS RESTARTS AGE
  12. myjob-lc5kl 0/1 Completed 0 33s
  13. myjob-mdrdr 0/1 Completed 0 33s

Job 一共启动了两个 Pod,而且 AGE 相同,可见是并行运行的。

 

我们还可以通过 completions 设置 Job 成功完成 Pod 的总数:

  1. [root@master ~]# vim myjob.yml
  2. apiVersion: batch/v1
  3. kind: Job
  4. metadata:
  5. name: myjob
  6. spec:
  7. completions: 6
  8. parallelism: 2
  9. template:
  10. metadata:
  11. name: myjob
  12. spec:
  13. containers:
  14. - name: hello
  15. image: busybox
  16. command: ["echo","hello k8s job!"]
  17. restartPolicy: Never

上面配置的含义是:每次运行两个 Pod,直到总共有 6 个 Pod 成功完成

  1. [root@master ~]# kubectl apply -f myjob.yml
  2. job.batch/myjob created
  3. [root@master ~]# kubectl get job
  4. NAME COMPLETIONS DURATION AGE
  5. myjob 3/6 8s 8s
  6. [root@master ~]# kubectl get pod
  7. NAME READY STATUS RESTARTS AGE
  8. myjob-4zclr 0/1 Completed 0 14s
  9. myjob-66dqx 0/1 Completed 0 14s
  10. myjob-cqt9d 0/1 Completed 0 10s
  11. myjob-j92f8 0/1 Completed 0 10s
  12. myjob-v6f68 0/1 Completed 0 6s
  13. myjob-zjz6p 0/1 Completed 0 6s

DESIRED 和 SUCCESSFUL 均为 6,符合预期。如果不指定 completions 和 parallelism,默认值均为 1

上面的例子只是为了演示 Job 的并行特性,实际用途不大。不过现实中确实存在很多需要并行处理的场景。比如批处理程序,每个副本(Pod)都会从任务池中读取任务并执行,副本越多,执行时间就越短,效率就越高。这种类似的场景都可以用 Job 来实现。

定时执行 Job

Linux 中有 cron 程序定时执行任务,Kubernetes 的 CronJob 提供了类似的功能,可以定时执行 Job。CronJob 配置文件示例如下:

  1. [root@master ~]# vim cronjob.yml
  2. apiVersion: batch/v2alpha1
  3. kind: CronJob
  4. metadata:
  5. name: hello
  6. spec:
  7. schedule: "* /1 * * * *"
  8. jobTemplate:
  9. spec:
  10. template:
  11. spec:
  12. containers:
  13. - name: hello
  14. image: busybox
  15. command: ["echo","hello k8s job!"]
  16. restartPolicy: OnFailure

① apiVersion: batch/v2alpha1  是当前 CronJob 的 apiVersion。
② kind: CronJob 指明当前资源的类型为 CronJob。
③  schedule: "* /1 * * * *"指定什么时候运行 Job,其格式与 Linux cron 一致。这里 */1 * * * * 的含义是每一分钟启动一次。
④ jobTemplate 定义 Job 的模板,格式与前面 Job 一致。
 执行后报如下错误:

  1. [root@master ~]# kubectl apply -f cronjob.yml
  2. error: unable to recognize "cronjob.yml": no matches for kind "CronJob" in version "batch/v2alpha1"

失败了。这是因为 Kubernetes 默认没有 enable CronJob 功能,需要在 kube-apiserver 中加入这个功能。方法很简单,修改 kube-apiserver 的配置文件 /etc/kubernetes/manifests/kube-apiserver.yaml: 添加:

kube-apiserver 本身也是个 Pod,在启动参数中加上 - --runtime-config=batch/v2alpha1=true 即可。

然后重启 kubelet 服务:

systemctl restart kubelet.service

kubelet 会重启 kube-apiserver Pod。通过 kubectl api-versions 确认 kube-apiserver 现在已经支持 batch/v2alpha1:

  1. [root@master ~]# kubectl api-versions
  2. admissionregistration.k8s.io/v1
  3. admissionregistration.k8s.io/v1beta1
  4. apiextensions.k8s.io/v1
  5. apiextensions.k8s.io/v1beta1
  6. apiregistration.k8s.io/v1
  7. apiregistration.k8s.io/v1beta1
  8. apps/v1
  9. authentication.k8s.io/v1
  10. authentication.k8s.io/v1beta1
  11. authorization.k8s.io/v1
  12. authorization.k8s.io/v1beta1
  13. autoscaling/v1
  14. autoscaling/v2beta1
  15. autoscaling/v2beta2
  16. batch/v1
  17. batch/v1beta1
  18. batch/v2alpha1
  19. certificates.k8s.io/v1
  20. certificates.k8s.io/v1beta1
  21. coordination.k8s.io/v1
  22. coordination.k8s.io/v1beta1
  23. discovery.k8s.io/v1beta1
  24. events.k8s.io/v1
  25. events.k8s.io/v1beta1
  26. extensions/v1beta1
  27. flowcontrol.apiserver.k8s.io/v1beta1
  28. networking.k8s.io/v1
  29. networking.k8s.io/v1beta1
  30. node.k8s.io/v1
  31. node.k8s.io/v1beta1
  32. policy/v1beta1
  33. rbac.authorization.k8s.io/v1
  34. rbac.authorization.k8s.io/v1beta1
  35. scheduling.k8s.io/v1
  36. scheduling.k8s.io/v1beta1
  37. storage.k8s.io/v1
  38. storage.k8s.io/v1beta1
  39. v1

再次创建CronJob:

  1. [root@master ~]# kubectl apply -f cronjob.yml
  2. cronjob.batch/hello created

通过 kubectl get cronjob 查看 CronJob 的状态:

  1. [root@master ~]# kubectl get cronjob
  2. NAME SCHEDULE SUSPEND ACTIVE LAST SCHEDULE AGE
  3. hello */1 * * * * False 0 <none> 17s

等待几分钟,然后通过 kubectl get jobs 查看 Job 的执行情况:

  1. [root@master ~]# kubectl get jobs
  2. NAME COMPLETIONS DURATION AGE
  3. hello-1608188820 1/1 6s 2m25s
  4. hello-1608188880 1/1 6s 85s
  5. hello-1608188940 1/1 5s 25s

可以看到每隔一分钟就会启动一个 Job。执行 kubectl logs 可查看某个 Job 的运行日志:

  1. [root@master ~]# kubectl get pod
  2. NAME READY STATUS RESTARTS AGE
  3. hello-1608188880-hqm7t 0/1 Completed 0 2m34s
  4. hello-1608188940-2md8k 0/1 Completed 0 94s
  5. hello-1608189000-4khvt 0/1 Completed 0 33s
  6. [root@master ~]# kubectl logs hello-1608188880-hqm7t
  7. hello k8s job!

运行容器化应用是 Kubernetes 最重要的核心功能。为满足不同的业务需要,Kubernetes 提供了多种 Controller,包括 Deployment、DaemonSet、Job、CronJob 

 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/563781
推荐阅读
  

闽ICP备14008679号