当前位置:   article > 正文

蓝易云 - Python读取txt、csv、xlsx、doc、json、parquet等各种数据文件类型方法总结.

蓝易云 - Python读取txt、csv、xlsx、doc、json、parquet等各种数据文件类型方法总结.

Python是一杯魔法的鸡尾酒,她包含了文本、表格、网页等各色各样的原材料。但这杯鸡尾酒的精髓在于如何将这些原材料有机整合起来。今天,就让我们走进Python的魔法世界,探索如何读取各种数据文件吧。

 

文本之舞:TXT读取

TXT文件如同舞蹈中的基础步伐,简单但至关重要。使用Python的内置函数 open()就可以轻松掌握这个舞步:

  1. with open("example.txt", "r") as file:
  2. content = file.read()
  3. print(content)

这小段代码流畅而优雅,像是一支华尔兹。我们轻轻地打开文件,赏读其中的内容,然后静静地关闭它。

表格之歌:CSV和XLSX读取

CSV和XLSX文件就像音乐中的节拍,它们用有序且结构化的方式传达信息。Python里表格数据的大师是 pandas库,音乐会现在开始:

  1. import pandas as pd
  2. # For csv, it's like a simple folk song.
  3. df_csv = pd.read_csv('file.csv')
  4. # For xlsx, it's like a symphony with multiple parts(sheets).
  5. xls = pd.ExcelFile('file.xlsx')
  6. df_sheet1 = pd.read_excel(xls, 'Sheet1')
  7. df_sheet2 = pd.read_excel(xls, 'Sheet2')

文档之戏:DOC读取

DOC文件是一个戏剧,构想丰富,多变复杂。我们需要借助 python-docx库的魔力来揭开它的神秘面纱:

  1. from docx import Document
  2. doc = Document('example.docx')
  3. for para in doc.paragraphs:
  4. print(para.text)

这些代码如同戏剧的折叠舞台,用高超技艺呈现出层次丰富的场景。

数据雕塑:JSON读取

JSON文件是数据的雕塑,有丰富的结构和细腻的表情。Python的 json库就是我们的雕刻工具:

  1. import json
  2. # Open the sculpture gallery
  3. with open('example.json', 'r') as f:
  4. data = json.load(f)
  5. print(data)

就像雕刻家一笔一划地揭示形体的美,这些代码精确地展示了数据的结构。

大数据之筑:PARQUET读取

PARQUET文件是大数据的城堡,高大且深峻。Python的 pyarrow.parquet库就是我们建筑大数据城堡的石材和工具:

  1. import pyarrow.parquet as pq
  2. # Unveil the grand castle
  3. data_parquet = pq.read_table('example.parquet').to_pandas()
  4. print(data_parquet)

如此,即使面对巨大的数据城堡,我们也可以轻松走进。

Python的魔法力量无穷无尽,无论你面对什么样的数据文件,都有相应的方法。只要在Python的魔法书中,你总可以找到解决问题的钥匙。继续探索,你会发现更多未知的世界,让Python的魔法带领你走向数据的魔法世界吧。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/666048
推荐阅读
相关标签
  

闽ICP备14008679号