赞
踩
目录
6. 使用TableAgent 对各个区域二手房房源数量分析
9. 使用TableAgent 对各区域二手房总价箱线图分析
10. 使用TableAgent 对各区域二手房单价箱线图分析
数据分析就是利用数学、统计学理论相结合科学统计分析方法对数据库中的数据、Excel数据、收集的大量数据、网页抓取的数据进行分析,从中提取有价值的信息形成结论并进行展示的过程。
数据分析的目的在于将隐藏在一大堆看似杂乱无章的数据背后,将有用的信息提取出来,总结出数据的内在规律,以帮助在实际工作中的管理者做出决策和判断。
对于一名数据分析师来说,进行数据分析无疑是复杂的, 学习成本也是较高的
TableAgent数据分析智能体是在九章云极 DataCanvas 自主研发的 DataCanvasAlaya 九章元识大模型基础上开发的能够实现私有化部署的企业级数据分析的智能体,有非常强大的意图理解能力、分析建模能力和洞察力。TableAgent 在充分的理解用户意图后,自主的利用统计科学、机器学习、因果推断等高级建模技术从数据中挖掘价值,进而提供分析观点和指导行动的深刻见解。
接下来我们是使用 TableAgent 来了解目前市面上二手房各项基本特征及房源分布情况
九章云极DataCanvas公司主任架构师杨健介绍称,TableAgent在Alaya元识基础上进化而来,是从0到1的交互式结构化数据分析的突破,是企业数据分析的全新方式,让“人人都是数据分析师”得以从梦想照进现实。
TableAgent是能够实现私有化部署 的企业级数据分析智能体,有非常强大的意图理解能力、分析建模能力和洞察力。在充分的理解用户意图后,TableAgent能够自主地利用统计科学、机器学习、因果推断等高级建模技术从数据中挖掘价值,进而提供分析观点和指导行动的深刻见解。这种启发式和引导式分析 能力,能够从深度和广度上不断挖掘数据中的信息和价值,帮助用户完成高质量的分析工作。
银行客户流失预警
的样例数据集如下图所示, 将样例数据集导入之后, 在主体内容中会有相关的数据分析提示, 接下来我们根据已给的提示进行提问
问题
: 帮我统计流失客户主要集中在哪些年龄段
回复
:
TableAgent
给出的柱状数据图如下
接下来我们看下 TableAgent
给出的文字分析
问题
: 根据客户的职业,统计不同领域客户的信用卡消费总金额和平均支出金额。
回复
:
柱状图如下:
文字分析如下
这些数据表明,不同领域的客户的信用卡消费总金额和平均支出金额是有差异的。这可能与客户的收入水平、消费习惯等因素有关。
从图中可以看出,初级教育水平的客户的信用卡消费总金额和平均支出金额最小,这可能是因为他们收入水平较低,消费能力较弱。而高级教育水平的客户的信用卡消费总金额和平均支出金额最大,这可能是因为他们收入水平较高,消费能力较强。
这些数据为我们提供了关于客户信用卡消费行为的有价值的信息,可以帮助我们更好地理解和服务我们的客户。
总结
通过对TableAgent
的提问 及回复我们发现对于样例数据集的分析还是相对准确的,
同时在 TableAgent
回复之后依旧会给一些接下来提问的角度,为用户提供了思考方向
首先通过网络爬虫采集链家网上所有南京二手房的房源数据,并对采集到的数据进行清洗;然后,使用TableAgent
对清洗后的数据进行可视化分析
链家网二手房信息界面如下:
我们需要采集的目标数据就在该页面,包括基本信息、房屋属性和交易属性三大类。
各类信息包括的数据项如下:
对于爬虫程序爬下来的数据并不能直接进行数据分析,需要先去掉一些“脏”数据,修正一些错误数据
数据清洗前 | 数据清洗后 |
数据集点击下载 https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/650737
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。