当前位置:   article > 正文

使用TableAgent数据分析智能体对南京二手房进行多维度的数据分析_南京二手房数据集

南京二手房数据集

目录

前言

什么是数据分析?

当数据分析师与AI 发生了碰撞

一、TableAgent介绍

二、 TableAgent体验

三、样例数据集体验

1. 如下图所示我们选择 银行客户流失预警的样例数据集

2. 数据集导入

3. 数据分析

4. 深度提问

5. 总结

四、南京二手房数据采集与可视化分析

1. 网站结构分析

2. 目标数据

3. 数据清洗

4. 导入数据到 TableAgent 中

5. 数据可视化分析基本步骤

6. 使用TableAgent 对各个区域二手房房源数量分析

7. 使用TableAgent 对二手房房屋用途分析

8. 使用TableAgent 对各区域二手房平均单价分析

9. 使用TableAgent 对各区域二手房总价箱线图分析

10. 使用TableAgent 对各区域二手房单价箱线图分析

11. 其他问题分析方向

五、总结


前言

什么是数据分析?

数据分析就是利用数学、统计学理论相结合科学统计分析方法对数据库中的数据、Excel数据、收集的大量数据、网页抓取的数据进行分析,从中提取有价值的信息形成结论并进行展示的过程。

数据分析的目的在于将隐藏在一大堆看似杂乱无章的数据背后,将有用的信息提取出来,总结出数据的内在规律,以帮助在实际工作中的管理者做出决策和判断。

对于一名数据分析师来说,进行数据分析无疑是复杂的, 学习成本也是较高的

当数据分析师与AI 发生了碰撞

TableAgent数据分析智能体是在九章云极 DataCanvas 自主研发的 DataCanvasAlaya 九章元识大模型基础上开发的能够实现私有化部署的企业级数据分析的智能体,有非常强大的意图理解能力、分析建模能力和洞察力。TableAgent 在充分的理解用户意图后,自主的利用统计科学、机器学习、因果推断等高级建模技术从数据中挖掘价值,进而提供分析观点和指导行动的深刻见解。

接下来我们是使用 TableAgent 来了解目前市面上二手房各项基本特征及房源分布情况

一、TableAgent介绍

九章云极DataCanvas公司主任架构师杨健介绍称,TableAgent在Alaya元识基础上进化而来,是从0到1的交互式结构化数据分析的突破,是企业数据分析的全新方式,让“人人都是数据分析师”得以从梦想照进现实。

TableAgent是能够实现私有化部署 的企业级数据分析智能体,有非常强大的意图理解能力、分析建模能力和洞察力。在充分的理解用户意图后,TableAgent能够自主地利用统计科学、机器学习、因果推断等高级建模技术从数据中挖掘价值,进而提供分析观点和指导行动的深刻见解。这种启发式和引导式分析 能力,能够从深度和广度上不断挖掘数据中的信息和价值,帮助用户完成高质量的分析工作。

二、 TableAgent体验

  1. 点击链接 进入TableAgent 公测地址

  1. 点击立刻体验, 输入手机号,验证码开启体验之旅

  1. TableAgent 界面

三、样例数据集体验

1. 如下图所示我们选择 银行客户流失预警的样例数据集

2. 数据集导入

如下图所示, 将样例数据集导入之后, 在主体内容中会有相关的数据分析提示, 接下来我们根据已给的提示进行提问

3. 数据分析

问题: 帮我统计流失客户主要集中在哪些年龄段

回复:

TableAgent给出的柱状数据图如下

接下来我们看下 TableAgent 给出的文字分析

4. 深度提问

问题: 根据客户的职业,统计不同领域客户的信用卡消费总金额和平均支出金额。

回复:

柱状图如下:

文字分析如下

  1. 对于初级教育水平的客户,他们的信用卡消费总金额为13184500,平均支出金额为100110。
  2. 对于中级教育水平的客户,他们的信用卡消费总金额为48802100,平均支出金额为99657.2。
  3. 对于高级教育水平的客户,他们的信用卡消费总金额为33627400,平均支出金额为100500。
  4. 对于未知教育水平的客户,他们的信用卡消费总金额为447622,平均支出金额为101732。

这些数据表明,不同领域的客户的信用卡消费总金额和平均支出金额是有差异的。这可能与客户的收入水平、消费习惯等因素有关。

从图中可以看出,初级教育水平的客户的信用卡消费总金额和平均支出金额最小,这可能是因为他们收入水平较低,消费能力较弱。而高级教育水平的客户的信用卡消费总金额和平均支出金额最大,这可能是因为他们收入水平较高,消费能力较强。

这些数据为我们提供了关于客户信用卡消费行为的有价值的信息,可以帮助我们更好地理解和服务我们的客户。

5. 总结

通过对TableAgent 的提问 及回复我们发现对于样例数据集的分析还是相对准确的,

同时在 TableAgent 回复之后依旧会给一些接下来提问的角度,为用户提供了思考方向

四、南京二手房数据采集与可视化分析

首先通过网络爬虫采集链家网上所有南京二手房的房源数据,并对采集到的数据进行清洗;然后,使用TableAgent对清洗后的数据进行可视化分析

1. 网站结构分析

链家网二手房信息界面如下:

2. 目标数据

我们需要采集的目标数据就在该页面,包括基本信息、房屋属性和交易属性三大类。

各类信息包括的数据项如下:

  • 基本信息:小区名称、所在区域、总价、单价。
  • 房屋属性:房屋户型、所在楼层、建筑面积、户型结构、套内面积、 建筑类型、房屋朝向、建筑结构、装修情况、梯户比例、配备电梯、产权年限。
  • 交易属性:挂牌时间、交易权属、上次交易、房屋用途、房屋年限、产权所属、抵押信息、房本备件。

3. 数据清洗

对于爬虫程序爬下来的数据并不能直接进行数据分析,需要先去掉一些“脏”数据,修正一些错误数据

数据清洗前

数据清洗后

数据集点击下载 https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/650737

推荐阅读
相关标签
  

闽ICP备14008679号