赞
踩
如何使用gzip压缩后的parquet文件
今天我们来学习使用python读取parquet文件
有一个parquet文件,而且还用gzip压缩了。
安装
pandas和pyarrow
- # 安装 pandas and pyarrow:
- pip3 install pandas pyarrow
- # 使用 read_parquet 加载parquet文件
- import pandas as pd
- from pandas import read_parquet
- data = read_parquet("myFile.parquet.gzip")
- print(data.count())
- data.head()
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。