当前位置:   article > 正文

AI实战:AI模型部署系列之docker_docker单独管理多路ai视频分析

docker单独管理多路ai视频分析

AI模型部署系列之docker

前言

AI实战:AI模型部署系列之docker
AI实战:AI模型部署系列之多进程

本文分享使用docker部署AI模型的经验。

Docker五大优势:持续集成、版本控制、可移植性、隔离性和安全性。

下面就介绍一下docker的安装、创建cpu的tensorflow的docker。

同时以 上海垃圾分类系列之快速搭建垃圾分类模型 作为整个过程的搭建的例子。

环境

  • Ubuntu 16.04

安装docker

  • 详细步骤
    mkdir docker_example
    cd docker_example/
    
    
    1、卸载旧版本docker(未安装过的,可不执行)
    
        sudo apt-get remove docker docker-engine docker.io
    
    2、更新
    
        sudo apt-get update
    
    3、安装依赖包
    
        sudo apt-get install \
            apt-transport-https \
            ca-certificates \
            curl \
            software-properties-common
    
    4、添加官方密钥
    
        curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
    
        出现 OK 表示添加成功
        
    5、添加仓库
    
        sudo add-apt-repository \
           "deb [arch=amd64] https://download.docker.com/linux/ubuntu \
           $(lsb_release -cs) \
           stable"
    
    6、再次更新
    
        sudo apt-get update
    
    7、安装docker(默认安装最新版)
        
        sudo apt-get install docker-ce
        
        若想指定版本:
            sudo apt-get install docker-ce=<VERSION>
    
    
    8、查看docker版本
    
        docker -v
    
        当前最新版本:Docker version 18.09.7, build 2d0083d
        
    9、启动docker 后台服务
    
        sudo service docker start
        
        
    10、测试运行hello-world
    
        sudo docker run hello-world
        
        
        出现下面详细就表明安装顺利、测试ok:
        
            Hello from Docker!
            This message shows that your installation appears to be working correctly.
            ....
            ....
    
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57
    • 58
    • 59
    • 60
    • 61
    • 62
    • 63
    • 64
    • 65
    • 66
    • 67
    • 68
    • 69

创建cpu版的Tensorflow

1、下载镜像

    sudo docker pull tensorflow/tensorflow:1.4.0-py3
        
        (1.4.0 是指版本, py3 是指python3.x)

    显示下面信息表示下载完毕:
        Status: Downloaded newer image for tensorflow/tensorflow:1.4.0-py3
    
    需要下载其他版本的tensorflow,把1.4.0改为对应的版本号即可。
    
    若是需要下载gpu的tensorflow,命令如下:
        sudo docker pull tensorflow/tensorflow:1.4.0-gpu-py3
        
        
    查看tensorflow的镜像(TensorFlow Docker Images):
        https://hub.docker.com/r/tensorflow/tensorflow
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

2、创建Tensorflow容器

    sudo docker run --name refuse_classify-tensorflow-1.4.0-py3 -d \
        -p 8888:8888 \
        -p 9006:6006 \
        -p 9007:6007 \
        -p 9008:6008 \
        -v ~/data/tmp/docker_example:/data \
        tensorflow/tensorflow:1.4.0-py3
    
    
    --name:创建的容器名,即 refuse_classify-tensorflow-1.4.0-py3  (python3下tensorflow 1.4.0 的垃圾分类docker)
    -d:后台运行容器 
    -p 8888:8888:端口映射,前者是宿主机的端口,后者是docker中的端口
    -p 9006:6006: tensorboard 端口映射
    -p 9007:6007: 预留端口
    -p 9008:6008: 预留端口
    -v ~/data/tmp/docker_example:/data:将宿主机的 ~/data/tmp/docker_example 挂载到容器内的 /data 下
    tensorflow/tensorflow:1.4.0-py3 :是上一步下载的镜像


    注:1、若是多次创建会出现下面的错误提示:
        
        docker: Error response from daemon: Conflict. The container name "/refuse_classify-tensorflow-1.4.0-py3" is already in use by container "b942ba9baec0674617c031c454457caf5abe8620bcdd6e9a628756e83743c89e". You have to remove (or rename) that container to be able to reuse that name.
        
        解决方法:
            sudo docker rm b942ba9b
                
                (b942ba9b  是docker id 的前面几个字符)
        
        2、若是gpu版本,需要加上 ‘ --runtime=nvidia ’,及安装对应的CUDA,请自行查阅相关资料
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29

3、运行docker

    sudo docker exec -it refuse_classify-tensorflow-1.4.0-py3  env LANG=C.UTF-8 /bin/bash

    
    出现下面的信息表示已进入docker:
        root@5b6a3a37e730:/notebooks#
        
            
            注:‘5b6a3a37e730’ 是 docker id
            
    
    查看相关信息:
        python
        
        输出信息:
            Python 3.5.2 (default, Sep 14 2017, 22:51:06) 
            [GCC 5.4.0 20160609] on linux
            Type "help", "copyright", "credits" or "license" for more information.
    
    
        import tensorflow as tf
        print(tf.__version__)
        
        输出:
            1.4.0
            
            说明一切安装顺利。
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26

4、docker 常用指令

  • 停止docker

       sudo docker stop 5b6a3a37e730
       
       或
       
       sudo docker stop refuse_classify-tensorflow-1.4.0-py3
    
    • 1
    • 2
    • 3
    • 4
    • 5
  • 开启docker

      sudo docker start 5b6a3a37e730
    
    • 1
  • 重启docker

     sudo docker restart 5b6a3a37e730
    
    • 1
  • 查看本地镜像

      sudo docker images
    
    • 1
  • 删除本地镜像

      sudo docker rmi docker_id/name
    
    • 1
  • 查看运行中的docker

      sudo docker ps
    
    • 1

部署AI模型

这里使用 上海垃圾分类系列之快速搭建垃圾分类模型 来作为例子。
模型下载:垃圾分类识别模型 (注:字母有拼写错误,rafuse改为refuse即可和下面的步骤一致)

  • 步骤

      1、复制完整代码到 ‘~/data/tmp/docker_example’
      
      2、进入docker
          
          sudo docker exec -it refuse_classify-tensorflow-1.4.0-py3  env LANG=C.UTF-8 /bin/bash
          
          cd /data/
          
          ls
          
              输出信息:
                  refuse_recognize
          
          cd refuse_recognize
          
      3、 安装环境
          
          pip install jieba
          pip install Cython
          pip install word2vec
          
      
      4、模型修改
          
          1)下载imagenet2012的inception-v3模型
              
              python classify_image.py
              
              输出下来信息表示成功:
                  2019-07-15 11:54:25.060237: I tensorflow/core/platform/cpu_feature_guard.cc:137] Your CPU supports instructions that this TensorFlow binary was not compiled to use: SSE4.1 SSE4.2 AVX AVX2 FMA
                  2019-07-15 11:54:25.433662: W tensorflow/core/framework/op_def_util.cc:334] Op BatchNormWithGlobalNormalization is deprecated. It will cease to work in GraphDef version 9. Use tf.nn.batch_normalization().
                  大熊猫,熊猫,熊猫,浣熊,大熊猫(Ailuropoda melanoleuca) (score = 0.89107)
                  光面狐猴;大狐猴 (score = 0.00779)
                  小熊猫,小熊猫,熊猫,熊猫,猫熊,小熊猫 (score = 0.00296)
                  番荔枝 (score = 0.00147)
                  地星 (score = 0.00117)
                  
          
          2)垃圾分类映射模型修改
              
              vi runs/checkpoints/checkpoint
              
              修改
                  /home/zzh/data/DL/refuse_recognize/
              为
                  /data/refuse_recognize
    
          
          
          3)测试
              python refuse.py ./img/2.png
                  
              输出下面信息表示一切ok:    
                  
                  classify:
                  手机移动电话  =>  可回收垃圾
                  iPod  =>  湿垃圾
                  笔记本电脑笔记本  =>  可回收垃圾
                  调制解调器  =>  湿垃圾
                  手持电脑手持微电脑  =>  可回收垃圾
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57
    • 58
    • 59
    • 60

保存该模型的docker环境

1)退出docker

   exit
  • 1

2)查看运行中的docker

   sudo docker ps
  • 1

3)保存dicker

   sudo docker commit -a 'zack' -m 'refuse classify model, tf1.4.0-py3-cpu' 65e3ec576b7f  refuse_classify:v1
    
    
    参数说明:

        -a : 提交的镜像作者
        -m : 提交时的说明文字
        65e3ec576b7f: 容器id
        refuse_classify: 名称
        v1: tag
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

4)查看保存的docker镜像

    sudo docker images
    
    输入信息如下:
    REPOSITORY              TAG                 IMAGE ID            CREATED             SIZE
    refuse_classify         v1                  52ec4a357116        40 seconds ago      1.57GB
  • 1
  • 2
  • 3
  • 4
  • 5

参考

https://www.runoob.com/docker/ubuntu-docker-install.html
https://www.jb51.net/article/135441.htm

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/453474
推荐阅读
相关标签
  

闽ICP备14008679号