赞
踩
大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容
从0起步,扬帆起航。
Didy是一个开源的 LLM 应用开发平台。
本文以文字识别
、文字整合
、表格填入
三步功能组合的铭牌信息提取功能为例,介绍Dify框架在多模态大模型开发的基本流程。
多模态大模型实现这一功能,相比于传统的OCR系统,其 通用性更强、开发更快、模型对抽取结果的后处理能力更优秀
。
本案例实现路径:
首先在设定界面接入智谱AI的API,当然此处不限大模型厂家,只要具备多模态能力的大模型均可,离线模型如OmniLMM等亦可。
上图中glm-4v即具备视觉能力的多模态大模型。
该服务是为了服务于excel表格生成后,为用户提供的下载功能。
即大模型返回一个链接,通过该链接用户可下载大模型所生成的excel文件。
只需要在服务器启动服务,语句如下:
python -m http.server 9707
注,9707为端口,注意该服务不要和其他服务端口冲突。
from fastapi import FastAPI, HTTPException, Depends from typing import List, Optional import re import json import datetime import pandas as pd from pydantic import BaseModel app = FastAPI() def post_processing(input_data): # 使用正则表达式匹配{}之间的内容 pattern = r'{(.*?)}' match = re.search(pattern, input_data, re.DOTALL) # 匹配后做数据后处理 if match: match = '{' + match.group(1) + '}' json_str = match.replace('\n', '')
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。