当前位置:   article > 正文

python学习-结构化的文本文件_中文文本结构化实例python

中文文本结构化实例python

结构化的文本文件

结构化的文本有很多格式,区别它们的方法如下: 分隔符, 比如tab(‘\t’)、逗号(‘,’)或竖线(‘|’)。 如:逗号分隔值(csv) ‘<’和’>’标签, 如XML 和 HTML 标点符号, 如 JavaScript Object Notation (JSON)。 缩进 如:YAML (即:YAML Ain’t Markup Language的缩写) 混合的,例如各种配置文件

CSV

带分隔符的文件一般用作数据交换格式或数据库。

  1. >>> import csv
  2. >>> villains = [
  3. ['Doctor','No'],
  4. ['Rosa','klebb'],
  5. ['Mister','Big'],
  6. ['Auric','Goldfinger'],
  7. ['Ernst','Blofeld'],]
  8. >>> with open('villains','wt') as fout: # 一个上下文管理器
  9. csvout = csv.writer(fout)
  10. csvout.writerows(villains)
  11. >>> villains
  12. [['Doctor', 'No'], ['Rosa', 'klebb'], ['Mister', 'Big'], ['Auric', 'Goldfinger'], ['Ernst', 'Blofeld']]

XML

带分隔符的文件仅有两维的数据:行和列,XML是最突出的处理这种转换的标记(markup)格式,它使用标签(tag)分隔数据。

XML通常用于数据传送和消息,它存在一些格式如:RSS和Atom,工业界有许多定制化的XML格式,例如:金融领域(http://www.service-architecture.com/articles/xml/finance_xml.html)

示例文件:menu.xml

本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/450137
推荐阅读
相关标签
  

闽ICP备14008679号