赞
踩
Python是一杯魔法的鸡尾酒,她包含了文本、表格、网页等各色各样的原材料。但这杯鸡尾酒的精髓在于如何将这些原材料有机整合起来。今天,就让我们走进Python的魔法世界,探索如何读取各种数据文件吧。
TXT文件如同舞蹈中的基础步伐,简单但至关重要。使用Python的内置函数 open()
就可以轻松掌握这个舞步:
- with open("example.txt", "r") as file:
- content = file.read()
- print(content)
这小段代码流畅而优雅,像是一支华尔兹。我们轻轻地打开文件,赏读其中的内容,然后静静地关闭它。
CSV和XLSX文件就像音乐中的节拍,它们用有序且结构化的方式传达信息。Python里表格数据的大师是 pandas
库,音乐会现在开始:
- import pandas as pd
-
- # For csv, it's like a simple folk song.
- df_csv = pd.read_csv('file.csv')
- # For xlsx, it's like a symphony with multiple parts(sheets).
- xls = pd.ExcelFile('file.xlsx')
- df_sheet1 = pd.read_excel(xls, 'Sheet1')
- df_sheet2 = pd.read_excel(xls, 'Sheet2')
DOC文件是一个戏剧,构想丰富,多变复杂。我们需要借助 python-docx
库的魔力来揭开它的神秘面纱:
- from docx import Document
-
- doc = Document('example.docx')
- for para in doc.paragraphs:
- print(para.text)
这些代码如同戏剧的折叠舞台,用高超技艺呈现出层次丰富的场景。
JSON文件是数据的雕塑,有丰富的结构和细腻的表情。Python的 json
库就是我们的雕刻工具:
- import json
-
- # Open the sculpture gallery
- with open('example.json', 'r') as f:
- data = json.load(f)
-
- print(data)
就像雕刻家一笔一划地揭示形体的美,这些代码精确地展示了数据的结构。
PARQUET文件是大数据的城堡,高大且深峻。Python的 pyarrow.parquet
库就是我们建筑大数据城堡的石材和工具:
- import pyarrow.parquet as pq
-
- # Unveil the grand castle
- data_parquet = pq.read_table('example.parquet').to_pandas()
-
- print(data_parquet)
如此,即使面对巨大的数据城堡,我们也可以轻松走进。
Python的魔法力量无穷无尽,无论你面对什么样的数据文件,都有相应的方法。只要在Python的魔法书中,你总可以找到解决问题的钥匙。继续探索,你会发现更多未知的世界,让Python的魔法带领你走向数据的魔法世界吧。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。