当前位置:   article > 正文

费了九牛二虎之力搞到的python精选库,不看会后悔_diesel– python

diesel– python

【此文章转自乐字节】

现在Python为啥这么火,这么多人学,就是因为简单好学,功能强大,整个社区非常活跃,资料很多。而且这语言涉及了方方面面,比如自动化测试,运维,爬虫,数据分析,机器学习,金融领域,后端开发,云计算,游戏开发都有涉及。
在这里插入图片描述

前端时间闲的无聊, 对Python兴趣徒增。学习这事儿吧,光看没用,还是要是实战,顺手搜了一些写的不错的开源库,也看了些博客。总结一些,分享给大家。

学Python,想必大家都是从爬虫开始的吧。毕竟网上类似的资源很丰富,开源项目也非常多。

简单来说这段过程发生了以下四个步骤:

  • 查找域名对应的IP地址。

  • 向IP对应的服务器发送请求。

  • 服务器响应请求,发回网页内容。

  • 浏览器解析网页内容。

    有兴趣的朋友可以去网上搜索更详细的内容。

那么学习爬虫需要掌握哪些库呢?

通用:

  1. urllib -网络库(stdlib)。
  2. requests -网络库。
  3. grab – 网络库(基于pycurl)。
  4. pycurl – 网络库(绑定libcurl)。
  5. urllib3 – Python HTTP库,安全连接池、支持文件post、可用性高。
  6. httplib2 – 网络库。
  7. RoboBrowser – 一个简单的、极具Python风格的Python库,无需独立的浏览器即可浏览网页。
  8. MechanicalSoup -一个与网站自动交互Python库。
  9. mechanize -有状态、可编程的Web浏览库。
  10. socket – 底层网络接口(stdlib)。
  11. Unirest for Python – Unirest是一套可用于多种语言的轻量级的HTTP库。
  12. hyper – Python的HTTP/2客户端。
  13. PySocks – SocksiPy更新并积极维护的版本,包括错误修复和一些其他的特征。作为socket模块的直接替换。

文本处理

用于解析和操作简单文本的库。

  • difflib – (Python标准库)帮助进行差异化比较。
  • Levenshtein – 快速计算Levenshtein距离和字符串相似度。
  • fuzzywuzzy – 模糊字符串匹配。
  • esmre – 正则表达式加速器。
  • ftfy – 自动整理Unicode文本,减少碎片化。

自然语言处理

处理人类语言问题的库。

  • NLTK -编写Python程序来处理人类语言数据的最好平台。
  • Pattern – Python的网络挖掘模块。他有自然语言处理工具,机器学习以及其它。
  • TextBlob – 为深入自然语言处理任务提供了一致的API。是基于NLTK以及Pattern的巨人之肩上发展的。
  • jieba – 中文分词工具。
  • SnowNLP – 中文文本处理库。
  • loso – 另一个中文分词库。

异步

异步网络编程库

  • asyncio – (在Python 3.4 +版本以上的 Python标准库)异步I/O,时间循环,协同程序和任务。
  • Twisted – 基于事件驱动的网络引擎框架。
  • Tornado – 一个网络框架和异步网络库。
  • pulsar – Python事件驱动的并发框架。
  • diesel – Python的基于绿色事件的I/O框架。
  • gevent – 一个使用greenlet 的基于协程的Python网络库。
  • eventlet – 有WSGI支持的异步框架。
  • Tomorrow – 异步代码的奇妙的修饰语法。

队列

  • celery – 基于分布式消息传递的异步任务队列/作业队列。
  • huey – 小型多线程任务队列。
  • mrq – Mr. Queue – 使用redis & Gevent 的Python分布式工作任务队列。
  • RQ – 基于Redis的轻量级任务队列管理器。
  • simpleq – 一个简单的,可无限扩展,基于Amazon SQS的队列。
  • python-gearman – Gearman的Python API。

电子邮件

用来发送和解析电子邮件的库。

  • django-celery-ses:带有 AWS SES 和 Celery 的 Django email 后端。
  • envelopes:供人类使用的电子邮件库。
  • flanker:一个 email 地址和 Mime 解析库。
  • imbox:Python IMAP 库。
  • inbox.py:Python SMTP 服务器。
  • inbox:一个开源电子邮件工具箱。
  • lamson:Python 风格的 SMTP 应用服务器。
  • mailjet:Mailjet API 实现,用来提供批量发送邮件,统计等功能。
  • marrow.mailer:高性能可扩展邮件分发框架。
  • modoboa:一个邮件托管和管理平台,具有现代的、简约的 Web UI。
  • pyzmail:创建,发送和解析电子邮件。
  • Talon:Mailgun 库,用来抽取信息和签名。
  • yagmail:yagmail是一个GMAIL / SMTP客户端,旨在使其尽可能简单地发送电子邮件。

URL 处理

解析 URLs 的库

  • furl:一个让处理 URL 更简单小型 Python 库。
  • purl:一个简单的,不可变的 URL 类,具有简洁的 API 来进行询问和处理。
  • pyshorteners:一个纯 Python URL 缩短库。
  • shorturl:生成短小 URL 和类似 bit.ly 短链的 Python 实现。
  • webargs:一个解析 HTTP 请求参数的库,内置对流行 web 框架的支持,包括 Flask, Django, Bottle, Tornado 和 Pyramid。

不看不知道,一看真的是吓一跳,Python的库真的太多太多了,有感兴趣的小伙伴可以去网上搜索更详细的内容。

Python有很多Web开发框架,大而全的开发框架非Django莫属,用得也最广泛.有很多公司有使用Django框架,如某狐,某讯等。以简洁著称的web.py,flask都非常易于上手,以异步高性能著称的tornado,源代码写得美如画,知乎,Quora都在用。

web开发的一些框架

1、Django

2、Flask

3、Web2py

4、Tornado

5、CherryPy

最后
祝大家学的愉快,学的神速。
有帮助的话,各位小伙伴可以点个赞收藏支持下啦!❤️
也欢迎关煮lili,一个在变秃,但能带你变强的程序员~
今天先说这么多,我是乐字节哩哩,一个有趣的灵魂!下期见!

最后给大家推荐三个b站超详细的Java和python自学课:

从java零基础到项目实战哦【b站BV: BV1CB4y1A7sk】

十大企业级项目自学课-B站:BV14K411F7HJ

python小白入门到精通完整版b站:BV1Sp4y1W77E

将bv号,复制去b站即可

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/秋刀鱼在做梦/article/detail/958542
推荐阅读
相关标签
  

闽ICP备14008679号