使用Pandas进行数据提取
本文转载自:蓝鲸的网站分析笔记
原文链接:使用python进行数据提取
目录
数据提取是分析师日常工作中经常遇到的需求。如某个用户的贷款金额,某个月或季度的利息总收入,某个特定时间段的贷款金额和笔数,大于5000元的贷款数量等等。本篇文章介绍如何通过python按特定的维度或条件对数据进行提取,完成数据提取需求。
准备工作
首先是准备工作,导入需要使用的库,读取并创建数据表取名为loandata。
1
2
3
|
import numpy as np
import pandas as pd
loandata = pd.DataFrame(pd.read_excel( 'loan_data.xlsx' ))
|
设置索引字段
在开始提取数据前,先将member_id列设置为索引字段。然后开始提取数据。
1
|
Loandata = loandata.set_index( 'member_id' )
|
按行提取信息
第一步是按行提取数据,例如提取某个用户的信息。下面使用ix函数对member_id为1303503的用户信息进行了提取。
1
|
loandata.ix[ 1303503 ]
|