当前位置:   article > 正文

Gradio详细文档——快速部署可视化人工智能应用

gradio

前言

        Gradio是一个开源的Python库,用于快速构建机器学习和数据科学演示的应用。它可以帮助你快速创建一个简单漂亮的用户界面,以便向客户、合作者、用户或学生展示你的机器学习模型。此外,还可以通过自动共享链接快速部署模型,并获得对模型性能的反馈。在开发过程中,你可以使用内置的操作和解释工具来交互式地调试模型。Gradio适用于多种情况,包括为客户/合作者/用户/学生演示机器学习模型、快速部署模型并获得性能反馈、以及在开发过程中使用内置的操作和解释工具交互式地调试模型。

        Gradio的优势在于易用性,代码结构简单,只需简单定义输入和输出接口即可快速构建简单的交互页面,更轻松部署模型。但Gradio适合场景相对简单,更容易快速部署应用的开发者。此外,Gradio还提供便利的分享功能,在启动应用时设置share=True参数创建外部分享链接,还可以直接在微信等平台上分享给用户使用。

一、安装

1.安装Gradio

Gradio要求的的python版本要求3.7及以上,安装指令如下:

  1. pip install gradio
  2. #可以使用清华镜像源来更快的安装
  3. pip install -i https://pypi.tuna.tsinghua.edu.cn/simple gradio

2.Gradio的第一个demo

Gradio的使用很简单,就是定义处理函数,输入参数与输出参数,然后使用Interface进行处理。

  1. import gradio as gr
  2. def greet(text):
  3. return "你输入的是:" + text + "!"
  4. #输入接口组件,label:显示框的标签
  5. input = gr.Text(label = "输入文字")
  6. #输出接口组件,label:显示框的标签
  7. output = gr.Text(label = "输出内容")
  8. #fn设置处理函数
  9. demo = gr.Interface(fn=greet, inputs=input, outputs=output)
  10. demo.launch()

运行代码之后,输出框会提示要打开的接口地址:

  1. (vrh) C:\code\python\tool>python gradio_demo.py
  2. Running on local URL: http://127.0.0.1:7860
  3. To create a public link, set `share=True` in `launch()`.

使用浏览器打开 http://localhost:7860 即可看到网页效果。左边是文本输入框,右边是结果展示框。“清除”按钮用于重置网页状态,“提交”按钮用于执行处理程序,“标记”按钮用于保存结果到本地。

二、基本接口参数

1. Interface类以及基础模块 

Gradio为了用户快速建立界面,包装了很多简洁易用的接口。在上面的demo中可以看到了一个简单易用易理解文本处理界面用了一个Interface函数来构建。但这个函数可以处理很多不同类型的输入和输出。 Interface一般使用三个参数进行初始化:

  • fn:包装要处理的函数
  • inputs:输入组件类型,例如:“text”、“image”、“video”等。
  • outputs:输出组件类型,例如:“text”、“image”、“video”等。

通过定义这三个参数,就可以快速创建一个接口并发布应用。

Gradio最常用的基础模块构成:

  • 应用界面:gr.Interface(搭建简易场景),gr.Blocks(制作定制化场景)。
  • 输入输出:gr.Image(图像),gr.Text(文本框),gr.Video(视频框), gr.DataFrame(数据框),gr.Dropdown(下拉选项),gr.Number(数字),gr.Markdown,gr.Files。
  • 控制组件:gr.Button(按钮)。
  • 布局组件:gr.Tab(标签页),gr.Row(行布局),gr.Column(列布局)等。

2.Inputs和Outpust的参数

Inputs和Outpust控件里面可以添加指定参数,像上面的demo一样,可以在gr.Text()里面定义label = "输入文字",还可以指定行数,提示词等,每个控制可以定义的参数都有差异。

  1. import gradio as gr
  2. def greet(text):
  3. return "你输入的是:" + text + "!"
  4. #输入接口组件
  5. input = gr.Text(label = "输入文字",lines=5, placeholder="请在这里输入...")
  6. #输出接口组件,label:显示框的标签
  7. output = gr.Text(label = "输出内容")
  8. #fn设置处理函数
  9. demo = gr.Interface(fn=greet, inputs=input, outputs=output)
  10. demo.launch()

 关于控件的所有参数可以参考官方给的文档,这里就不一一列举了,官方的给的文档有详细的说明:

3.Interface.launch()方法

Interface.launch()方法有三个返回值,如果不是付费用户,公共只能使用一天。

  • app,为 Gradio 演示提供支持的 FastAPI 应用程序
  • local_url,本地地址
  • share_url,公共地址,当share=True时生成
  1. import gradio as gr
  2. def greet(text):
  3. return "你输入的是:" + text + "!"
  4. #输入接口组件,label:显示框的标签
  5. input = gr.Text(label = "输入文字",lines=5, placeholder="请在这里输入...")
  6. #输出接口组件,label:显示框的标签
  7. output = gr.Text(label = "输出内容")
  8. #fn设置处理函数
  9. demo = gr.Interface(fn=greet, inputs=input, outputs=output)
  10. if __name__ == "__main__":
  11. app, local_url, share_url =demo.launch(share=True)

4.多输入与多输出

在处理复杂逻辑时,输入与输出有的参数并不是单一的,Gradio可以定义参数列表的形式,列表中的每个元素都会对应于函数的参数,输出列表中的每个元素则按照函数返回值的顺序排列。

  1. import gradio as gr
  2. import time
  3. #该函数有2个输入参数和2个输出参数
  4. def get_time(name,is_RPC):
  5. if is_RPC:
  6. d = time.strftime("%Y-%m-%d %H:%M:%S",time.localtime())
  7. else:
  8. d = time.strftime("%a %b %d %H:%M:%S %Y",time.localtime())
  9. t = time.time()
  10. str = "你好" + name + ",今天是:"+ d
  11. return str,t
  12. input_name = gr.Text(label = "请输入姓名")
  13. input_checkbox = gr.Checkbox()
  14. output_str = gr.Text()
  15. output_number = gr.Number()
  16. demo = gr.Interface(
  17. fn=get_time,
  18. #按照处理程序设置输入组件
  19. inputs=[input_name, input_checkbox],
  20. #按照处理程序设置输出组件
  21. outputs=[output_str, output_number],
  22. )
  23. demo.launch()

5. 动态界面接口

在Interface里面添加live=True参数,来实现动态输入输出的效果,只要输入发生变化,结果马上发生改变。当设置live=True,界面不再有提交按钮。

下面使用该参数实现简易的计算机:

  1. import gradio as gr
  2. def calculator(num1,num2, operation):
  3. if operation == "加":
  4. return num1 + num2
  5. elif operation == "减":
  6. return num1 - num2
  7. elif operation == "乘":
  8. return num1 * num2
  9. elif operation == "除":
  10. return num1 / num2
  11. num1 = gr.Number(label = "数字",placeholder="请在这里输入数字...")
  12. num2 = gr.Number(label = "数字",placeholder="请在这里输入数字...")
  13. iface = gr.Interface(
  14. calculator,
  15. [num1,num2, gr.inputs.Radio(["加", "减", "乘", "除"],label="请选择运算方式:")],
  16. "number",
  17. live=True,
  18. )
  19. iface.launch()

 

在很多情况下,需要输入是实时视频或音频流,这意味着数据不断发送到后端。为了处理这些数据,也可以采用live=True参数来定义流式处理模式。

  1. import gradio as gr
  2. import cv2
  3. import numpy as np
  4. def gray(img):
  5. gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
  6. return gray
  7. demo = gr.Interface(
  8. gray,
  9. gr.Image(source="webcam", streaming=True),
  10. "image",
  11. live=True
  12. )
  13. demo.launch()

6.接口全局变量 

全局变量的用处在于它可以在函数之间共享数据,而不必每次调用函数时都重新加载模型。这特别适用于机器学习中的大型模型,通过全局变量从外部加载模型,并在函数内部使用它,可以大大提高程序的执行效率。此外,全局变量还可以方便地在不同的函数之间共享数据,并使数据在不同的函数之间易于访问。

下面程序对用户几次输入的数据进行排序:

  1. import gradio as gr
  2. scores = []
  3. def track_score(score):
  4. scores.append(score)
  5. top_scores = sorted(scores, reverse=True)[:5]
  6. return top_scores
  7. demo = gr.Interface(
  8. track_score,
  9. gr.Number(label="Score"),
  10. gr.JSON(label="Top Scores")
  11. )
  12. demo.launch()

7.会话状态窗口

Gradio支持持久性是会话状态(类似聊天类窗口),使得数据可以在一个页面会话中的多次提交中持久存在。然而,值得注意的是,数据并不会在不同用户之间共享。会话状态的典型例子是聊天机器人,在这种情况下,可能希望访问用户之前提交的信息,但不能将聊天记录存储在一个全局变量中,因为这样会导致聊天记录在不同用户之间混淆。需要注意的是,该状态仅在每个页面内的提交中持续存在,如果您在另一个标签页中加载该演示(或刷新页面),该演示将无法共享聊天历史记录。

  • 在函数中传入一个额外的参数,它代表当前界面的状态。
  • 在函数的最后,将状态的更新值作为一个额外的返回值返回。
  • 在添加输入和输出时添加state组件。
  1. import gradio as gr
  2. def answer(message, history):
  3. history = history or []
  4. message = message.lower()
  5. if message=="你好":
  6. response = "你好,有什么可以帮到你吗?"
  7. elif message=="你是谁":
  8. response = "我是虚拟数字人幻静,你可以叫我小静或者静静。"
  9. elif message=="你能做什么":
  10. response = "我可以陪你聊天,回答你的问题,我还可以做很多很多事情!"
  11. else:
  12. response = "你的这个问题超出了我的理解范围,等我学习后再来回答你。或者你可以问我其他问题,能回答的我尽量回答你!"
  13. history.append((message, response))
  14. return history,history
  15. chatbot = gr.Chatbot().style(color_map=("green", "pink"))
  16. input_text = gr.Text(label = "输入信息")
  17. demo = gr.Interface(
  18. answer,
  19. # 添加state组件
  20. [input_text, "state"],
  21. [chatbot, "state"],
  22. allow_flagging="never",
  23. )
  24. demo.launch()

8.控件样式

不同控件都有不同style(如image.style),可以获取该组件的样式参数设置样例。也可以定义控件默认的输入。

  1. import numpy as np
  2. import gradio as gr
  3. import cv2
  4. def gray(input_img):
  5. grayImage = cv2.cvtColor(input_img,cv2.COLOR_BGR2GRAY)
  6. return grayImage
  7. img = gr.Image("icon.png",shape=(200, 200)).style(height='24', rounded=False)
  8. output = gr.Image()
  9. demo = gr.Interface(fn=gray, inputs=img, outputs = output)
  10. demo.launch()

三、Blocks自定制组件

相比Interface,Blocks提供了一个更低级别的API,用于设计具有更灵活布局和数据流的网络应用。Blocks允许用户精确地控制组件在页面上的位置,处理复杂的数据流(例如,使输出成为其他函数的输入),并根据用户交互来更新组件的属性可见性。此外,可以定制更多的组件以进行多个版本的改写,这样可以避免代码的重复。

1.Blocks演示

使用Blocks方式添加组件时,需要使用with语句。如果不设置布局方式,组件将按照创建的顺序垂直出现在应用程序中。

  1. import gradio as gr
  2. def greet(name):
  3. return "您好," + name + "!"
  4. with gr.Blocks() as demo:
  5. #设置输入组件
  6. name = gr.Textbox(label="姓名:",placeholder="请在这里输入您的名字...")
  7. # 设置输出组件
  8. output = gr.Textbox(label="输出信息:")
  9. #设置按钮
  10. greet_btn = gr.Button("提交")
  11. #设置按钮点击事件
  12. greet_btn.click(fn=greet, inputs=name, outputs=output)
  13. demo.launch()

2.多个模块应用

可以实现多个模块合并,下面的示例实现了两个Tab控件,图像处理与机器人聊天窗口。

  1. import numpy as np
  2. import gradio as gr
  3. import cv2
  4. def answer(message, history):
  5. history = history or []
  6. message = message.lower()
  7. if message=="你好":
  8. response = "你好,有什么可以帮到你吗?"
  9. elif message=="你是谁":
  10. response = "我是虚拟数字人幻静,你可以叫我小静或者静静。"
  11. elif message=="你能做什么":
  12. response = "我可以陪你聊天,回答你的问题,我还可以做很多很多事情!"
  13. else:
  14. response = "你的这个问题超出了我的理解范围,等我学习后再来回答你。或者你可以问我其他问题,能回答的我尽量回答你!"
  15. history.append((message, response))
  16. return history,history
  17. def gray_image(image):
  18. gray = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
  19. return gray
  20. with gr.Blocks() as demo:
  21. # 设置tab选项卡
  22. with gr.Tab("图像灰度处理"):
  23. #Blocks特有组件,设置所有子组件按垂直排列
  24. #垂直排列是默认情况,不加也没关系
  25. with gr.Column():
  26. img_input = gr.Image()
  27. img_output = gr.Image()
  28. img_button = gr.Button("灰度化")
  29. with gr.Tab("对话框"):
  30. #Blocks特有组件,设置所有子组件按水平排列
  31. with gr.Row():
  32. state = gr.State([])
  33. chatbot = gr.Chatbot(label = "消息记录").style(color_map=("green", "pink"))
  34. txt = gr.Textbox(show_label=False, placeholder="请输入你的问题").style(container=False)
  35. #设置折叠内容
  36. img_button.click(gray_image, inputs=img_input, outputs=img_output)
  37. txt.submit(fn = answer, inputs = [txt, state], outputs = [chatbot, state])
  38. demo.launch()

3.输入队列

如果函数计算时间过长,比如深度学习推理相关,或者应用程序面临过大的流量处理,那么使用队列方法来进行排队是必要的处理流程。队列方法通过websockets实现,能够有效防止网络超时问题。

  1. import numpy as np
  2. import gradio as gr
  3. import cv2
  4. import time
  5. def gray(input_img):
  6. time.sleep(5)
  7. grayImage = cv2.cvtColor(input_img,cv2.COLOR_BGR2GRAY)
  8. return grayImage
  9. with gr.Blocks() as demo:
  10. #设置输入组件
  11. img_input = gr.Image(label="请打开图像...")
  12. # 设置输出组件
  13. img_output = gr.Image()
  14. #设置按钮
  15. greet_btn = gr.Button("灰度图像")
  16. #设置按钮点击事件
  17. greet_btn.click(fn=gray, inputs=img_input, outputs=img_output)
  18. demo.queue()
  19. demo.launch()

4.可编辑输出

默认输出组件是不允许编辑的。若要改变输出组件的不可编辑状态,使其内容可编辑,只需设置interactive属性为True,这样输出控件就可以编辑了。

  1. import gradio as gr
  2. def answer(name):
  3. response = "你好"+ name +",你的这个问题超出了我的理解范围,等我学习后再来回答你。或者你可以问我其他问题,能回答的我尽量回答你!"
  4. return response
  5. with gr.Blocks() as demo:
  6. name = gr.Textbox(label="Name")
  7. # 不可交互
  8. # output = gr.Textbox(label="Output Box")
  9. # 可交互
  10. output = gr.Textbox(label="Output",interactive=True)
  11. greet_btn = gr.Button("提交")
  12. greet_btn.click(fn=answer, inputs=name, outputs=output)
  13. demo.launch()

四、常用接口

1.输入图像

输入图像,输出图像

  1. import numpy as np
  2. import gradio as gr
  3. import cv2
  4. def gray(input_img):
  5. grayImage = cv2.cvtColor(input_img,cv2.COLOR_BGR2GRAY)
  6. return grayImage
  7. input = gr.Image(shape=(512, 512))
  8. output = gr.Image()
  9. demo = gr.Interface(fn=gray, inputs=input, outputs = output)
  10. demo.launch()

 

 2.打开摄像头

打开网络摄像头,可以执行拍照和录像功能,网络摄像头以地址的方式打开:xxx\xxx\xxx\sample_flip.webm

  1. import gradio as gr
  2. import cv2
  3. def dispose(image, video):
  4. grayImage = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
  5. print(video)
  6. return [grayImage, video]
  7. input_img = gr.Image(source="webcam", tool=None)
  8. input_vid = gr.Video(source="webcam")
  9. out_img = gr.Image()
  10. out_vid = gr.Video()
  11. demo = gr.Interface(dispose,[input_img,input_vid],[out_img,out_vid])
  12. if __name__ == "__main__":
  13. demo.launch()

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/575978
推荐阅读
相关标签
  

闽ICP备14008679号