当前位置:   article > 正文

大模型 | 此“模型”非彼“模型”:5分钟实现一个数字化审计分析助手_审计大模型

审计大模型

千人千面的模型

在风控领域、内部审计领域、人工智能领域,人人谈模型。

但对于什么是模型?众说纷纭,业界也没有一个统一的定义。

百度百科中对模型有两个定义:

定义(1-1):模型就是通过主观意识借助实体或者虚拟表现,构成客观阐述形态结构的一种表达目的的物件。

定义(1-2):从广义上讲,如果一个事物能随着另一个事物的改变而改变,那么此事物就是另一个事物的模型。

综合而言:

模型泛指一种包含统计计算、应用理论、判断假设的计算方法或系统。

龚才春认为:

模型是在特定的历史条件下,为表示客观事物、简化客观事物而建立的,是对客观事物的简化表示。

一个好模型的标准有两个:第一,它可以简化客观事物;第二,简化客观事物后它还能表示客观事物。

此“模型”非彼“模型”

谈到大模型,由于有“模型”两个字,很容易映射到风控模型上去,等价于常规的风险控制模型。

同时,由于大模型又是大语言模型(LLMs)的简称,也很容易觉得就是NLP的升级版,除了写诗、做文案、画画,也就这样了。

在“什么是模型”都没有达成一致认识的情况下,在这个百“模”争流的时代,这些观点一方面是由于ChatGPT的出圈带火了大模型,容易将大模型等同于AIGC。

另一方面也是由于大模型一直在不断进化,已经跨越了基于文字信息的学习和训练,拓展到图片、视频等广义数据(信息)的学习和训练,潜力和能力已经远远超出我们在第一时间通过媒体对它了解形成的认识。

个人感觉,大模型时代的“模型”和我们过去在学习、工作、生活中形成的模型认识,无论是内涵和外延都发生了翻天覆地的变化,用“世界模型”的视角来理解大模型之“模型”更合适。

世界模型(World Model)是一种由计算机或人工智能系统构建的对现实世界的模拟与表达。它旨在全面、综合地描述和预测环境,通过处理感知信息和数据建模,实现对物体、场景、动作等要素的准确抽象和模拟[1]。世界模型不仅限于人类对世界的体验和认知的抽象概念集合,也扩展到机器智能领域,涵盖了认识世界的抽象概念和感受的集合。

随着 Sora、Gemini、V-JEPA 等大模型的横空出世,大模型不仅仅是学习了信息表面的统计信息,还获取了关于空间和时间这类基本维度的结构化知识,越发“能够以人类的理解方式看世界”,逐步具有了世界模型的特质,构建出对世界的抽象表示。

此“模型”非彼“模型”!它不只是一个解决具体问题的实体,而是一个新世界。

我们需要做的既不是焦虑地睡不着,也不是简单扫一眼觉得不过尔尔而忽略。

面对百“模”争流,面对似乎无所不能的大模型,我们需要做的就是理解它、掌握它、应用它、反馈它,一起成长。

大模型门槛低了

在ChatGPT刚出来时就有个感觉,审计人员面临的转型压力一早就在,只是 ChatGPT 的出现让这一进程大大加快,这个转型的核心是能力分化基础上的去能力化。

欣喜的是,到现在,大模型的能力进步、生态形成、开源发展等日新月异,无论是软硬件资源还是技术要求都在更加通用化,不再需要复杂的Linux环境安装、Docker搭建、网络访问技巧等一看就容易劝退的技术基础。

普通人接触、学习、应用甚至部署一个本地离线版大模型的门槛会越来越低。

应用方面,除了大家都知道的ChatGPT,阿里通义千问、讯飞星火、百度文心一言等都开放了免费使用的App或者网页版本:

  • 通义千问 (阿里巴巴):https://tongyi.aliyun.com/qianwen/

  • 智谱清言

  • 文心一言 (百度):

  • 讯飞星火:

  • Moonshot Kimi (月之暗面)

  • 抖音豆包:

  • 海螺问问 (Minmax)

  • 百川大模型

从测评情况看,和GPT有差距但再奋起直追,尤其是在中文应用环境。

(图源:网络 侵删)

模型方面,各家头部公司、创业公司开源了大量高质量的模型,比如Llama、Gemma、Mistral,阿里的Qwen、智谱ChatGLM、百川Baichuan等。

这些模型甚至可以使用LangChain、LMStudio、Ollama等部署为本地模型。

Qwen-0.5B的模型甚至可以不用显存,在只有CPU、8G内存的机器上也能跑起来,随时随地进行大模型应用探索。(如下图,相关探索过程整理中)

还可以通过RAG技术,搭建私有的知识问答系统,克服了内部资料外泄的风险。

提示语Prompt

在应用层面,毫无疑问,“提示语(Prompt)”是使用大模型知识与能力的接口。

提示语(Prompt)是指在使用各种生成式AI模型时,为了引导它给出理想的回答而给出的引导性表述,其用途是“调整和优化文章中前m个元素的值,这些元素通常包括任务描述、上下文信息等,使大语言模型能在给定任务的场景下生成概率更高、更符合预期的结果。”

提示语Prompt的核心思想是将问题表述为一种容易被模型理解和解答的形式,通过重述问题、给出示例或者采用渐进式提问等,引导大模型更加精确地理解任务需求,激发大模型潜力,提高准确性和任务胜任能力。(陈铮,2021)

使用大模型,为什么需要提示语(Prompt)?

阿禅 Jason Ng打了一个形象的比喻:

ChatGPT 就像一个非常正经的、学习能力很强的、刚刚 985 大学毕业的实习生。一方面,作为实习生,它的可塑性很强,只要你愿意花时间引导它,它能学会你希望它学会的东西,从而帮你完成你指定的工作。另一方面,你不能对一个实习生期望过高,因为对某件你需要做的事,最熟悉的人是你,而不是他。在当前的语境下,容易高估它的能力,但低估它的未来潜力。

大模型作为一个“实习生”,虽然学习能力很强,但作为刚到公司的新人,对业务是不熟悉的。需要一步一步告知它工作应该如何做,只要你教导的步骤是正确的,它几乎总能做出正确的答案。

对大模型提需求的时候,需要将它当作一个有丰富的知识积累和学习能力的实习生来看待,通过提示语(Prompt)将需求相关的东西,全部用文字表达出来,避免“知识诅咒”(你以为它知道你知道的)。

提示语(Prompt)有很多框架,比如CRISPE、ICDO、BROKE,总体上都是围绕如下要素:

  • 角色(Role)

  • 背景(Context、Background)

  • 要求(Requirements)

  • 任务(Task)

  • 期望(Expectations)

  • 行动(Action)

  • 示例(Example)

  • 格式(Format)

一个数字化审计分析助手

结合前述关于提示语(Prompt)介绍,基于阿里的通义千问,使用角色扮演的方式,只需要5分钟就可以实现一个数字化审计分析助手。

1.角色Prompt

打开通义千问,新建一个对话,输入如下的提示语(Prompt)。(使用Shift+回车换行)

角色:你是一个熟悉商业银行业务的数字化审计人员,日常工作是基于数据分析,发现业务异常,进行审计监督。

背景:数据存储和分析使用的是DB2数据库引擎,支持高阶的窗口函数。

任务:理解给定的数据,根据要求生成疑点分析的SQL语句。

要求:完成任务分为两步:第一步理解数据,从我给你的数据说明文本中提炼出字段名称、字段类型,并用markdown格式的表格输出。第二步基于第一步的数据理解,根据我的分析要求文本生成输出数据分析SQL语句。请在每一步完成输出后,告诉我可以进入下一步了。

你理解上述信息后回复明白,我发送数据说明和分析要求给你。

通义千问的回复:

明白,您将提供数据说明文本和分析要求文本,我将首先提炼出字段名称和字段类型并以Markdown格式的表格输出,然后根据分析要求生成SQL语句。请先发送数据说明文本。

2.助手上岗

3.完成任务

第一步:理解数据

第二步:生成SQL语句

看不懂还可以问:

一些思考

高质量的大模型应用需要高质量的思维链,审计人员的专业框架、判断力和交流能力越发重要。

大模型能自动根据指令生成代码,但我们仍需要了解一些技术知识,便于准确地和大模型沟通,验证大模型的输出是否存在“幻觉”,但对于技术实现的技巧、编码能力的要求大为降低。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

123?spm=1001.2014.3001.5501)这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/901333?site
推荐阅读
相关标签
  

闽ICP备14008679号