赞
踩
机器学习
// 5.Scikit-Learn 库
官网:
https://scikit-learn.org.cn/
特点:
Scikit-learn(以前称为scikits.learn,也称为sklearn)是针对 Python 编程语言的免费软件机器学习库。它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度提升,k均值和DBSCAN,并且旨在与 Python 数值科学库 NumPy 和 SciPy 联合使用。
// 6.XGBoost 库
官网:
https://xgboost.ai/
特点:
XGBoost是一个优化的分布式梯度增强库,旨在实现高效,灵活和便携。它在 Boosting框架下实现机器学习算法。XGBoost提供并行树提升(也称为GBDT,GBM),可以快速准确地解决许多数据科学问题。相同的代码在主要的分布式环境(Hadoop,SGE,MPI)上运行,并且可以解决数十亿个示例之外的问题。
// 7.LightGBM 库
官网:
https://lightgbm.readthedocs.io
特点:
LightGBM(Light Gradient Boosting Machine) 是微软开源的一个实现 GBDT 算法的框架,支持高效率的并行训练。LightGBM 提出的主要原因是为了解决 GBDT 在海量数据遇到的问题,让 GBDT 可以更好更快地用于工业实践。其具有以下优点:更快的训练速度、更低的内存消耗、更好的准确率、分布式支持,可以快速处理海量数据。
// 8.CatBoost 库
官网:
https://catboost.ai/
特点:
CatBoost 是由 Yandex 的研究人员和工程师开发的基于梯度提升决策树的机器学习方法,现已开源。CatBoost 在 Yandex 公司内广泛使用,用于排列任务、预测和提出建议。CatBoost 是通用的,可应用于广泛的领域和各种各样的问题。
// 9.Eli5 库
官网:
https://eli5.readthedocs.io
特点:
ELI5 是一个 Python 库,允许使用统一API可视化地调试各种机器学习模型。它内置了对多个ML框架的支持,并提供了一种解释黑盒模型的方法。它有助于调试机器学习分类器并解释它们的预测。
// 10.Theano 库
官网:
https://pypi.org/project/Theano/
特点:
Theano 是一个 Python 库,专门用于定义、优化、求值数学表达式,效率高,适用于多维数组。特别适合做机器学习。一般来说,使用时需要安装 Python 和 Numpy 。
//11.PyBrain库
官网:
https://github.com/pybrain/pybrain/
特点:
PyBrain的概念是将一系列的数据处理的算法封装到被称之为Module的模块中。一个最小的Module通常包含基于机器学习算法的可调整的参数集合。
//12.Shogun库
官网:
https://github.com/shogun-toolbox/shogun
特点:
Shogun是一个开源机器学习库,它提供广泛的高效和统一的机器学习方法,如多种数据表示、算法类和通用工具的组合,用于快速原型设计数据管道。
Python
深度学习
//13.Chainer库
官网:
https://www.cnpython.com/pypi/chainerrl
特点:
ChainerCV是一个基于Chainer用于训练和运行计算机视觉任务的神经网络工具。它涵盖了计算机视觉模型的高质量实现,以及开展计算机视觉研究的必备工具集。
// 14. PyLearn2库
官网:
http://github.com/lisa-lab/pylearn2
特点:
Pylearn2是一个基于Theano的机器学习库,它的大部分功能是基于Theano顶层实现的。这意味着用户可以用数学表达式去编写Pylearn2插件(新模型、算法等)。
// 15.Hebel库
官网:
https://www.oschina.net/p/hebel/
特点:
Hebel 是一个通过 PyCUDA 库使用 GPU CUDA 来加速建立神经网络的深度学习库。它实现了几类最重要的神经网络模型,提供各种激活函数和训练模型。
// 16.Neurolab库
官网:
https://pythonhosted.org/neurolab/
特点:
neurolab是一个简单而强大的Python神经网络库。包含基于神经网络、训练算法和灵活的框架来创建和探索其他神经网络类型。
// 17.TensorFlow 库
官网:
https://www.tensorflow.org/
特点:
TensorFlow 是一个基于数据流编程(dataflow programming)的符号数学系统,被广泛应用于各类机器学习(machine learning)算法的编程实现,其前身是谷歌的神经网络算法库 DistBelief 。Tensorflow 拥有多层级结构,可部署于各类服务器、PC终端和网页并支持GPU和TPU高性能数值计算,被广泛应用于谷歌内部的产品开发和各领域的科学研究。
// 18.PyTorch 库
官网:
https://pytorch.org/
特点:
PyTorch 是一个开源的 Python 机器学习库,基于 Torch,用于自然语言处理等应用程序。PyTorch 的前身是 Torch ,其底层和 Torch 框架一样,但是使用 Python 重新写了很多内容,不仅更加灵活,支持动态图,而且提供了 Python接口。它是由 Torch7 团队开发,是一个以 Python 优先的深度学习框架,不仅能够实现强大的GPU加速,同时还支持动态神经网络。PyTorch 既可以看作加入了GPU支持的 Numpy,同时也可以看成一个拥有自动求导功能的强大的深度神经网络。除了 Facebook 外,它已经被Twitter、CMU 和 Salesforce 等机构采用。
// 19.Keras 库
官网:
https://keras.io/zh/
特点:
Keras 是一个由 Python 编写的开源人工神经网络库,可以作为 Tensorflow、 Microsoft-CNTK 和 Theano 的高阶应用程序接口,进行深度学习模型的设计、调试、评估、应用和可视化。Keras 在代码结构上由面向对象方法编写,完全模块化并具有可扩展性。Keras 支持现代人工智能领域的主流算法,包括前馈结构和递归结构的神经网络,也可以通过封装参与构建统计学习模型。在硬件和开发环境方面,Keras 支持多操作系统下的多GPU并行计算,可以根据后台设置转化为 Tensorflow、Microsoft-CNTK 等系统下的组件。
// 20.Caffe2库
官网:
http://caffe.berkeleyvision.org/
特点:
Caffe是由Berkeley Vision and Learning Center(BVLC)建立的深度学习框架。它是模块化的,速度极快。
Python
分布式深度学习库
// 21.dist-Keras 库
官网:
https://joerihermans.com/work/distributed-keras/
特点:
dist-Keras 是在 Apache Spark 和 Keras 之上构建的分布式深度学习框架,其重点是“最先进的”分布式优化算法。以易于实现新的分布式优化器的方式设计了框架,从而使人们能够专注于研究。支持多种分布式方法,例如但不限于使用数据并行方法训练合奏和模型。
// 22.elephas 库
官网:
https://pypi.org/project/elephas/
特点:
elephas 是一个把 Python 深度学习框架 Keras 衔接到 Spark 集群的第三方 python 包。
// 23.Spark-Deep-Learning 库
官网:
https://databricks.github.io/spark-deep-learning/
特点:
Spark-Deep-Learning 为使用 Apache Spark 的 Python 中可伸缩的深度学习提供了高级api。该库来自 Databricks ,并利用 Spark 实现了两个最强大的方面:本着 Spark 和 Spark MLlib 的精神,它提供了易于使用的API,能够在很少的代码行中进行深入学习;它使用 Spark 强大的分布式引擎来扩展对海量数据集的深度学习。
// 24.Mxnet库
官网:
https://pypi.org/project/mxnet/
特点:
MXNet 是一款设计为效率和灵活性的深度学习框架。它允许你混合符号编程和命令式编程,从而最大限度提高效率和生产力。
// 25.Sklearn-theano库
官网:
https://github.com/sklearn-theano/
特点:
sklearn-theano的功能所在。你不能用它从头到尾的训练一个模型,但它的神奇之处就是可以把网络作为特征提取器。
Python
自然语言处理
// 26.NLTK 库
官网:
https://www.nltk.org/
特点:
NLTK(Natural Language Toolkit)自然语言处理工具包,是 NLP 研究领域常用的一个 Python 库,由宾夕法尼亚大学的 Steven Bird 和 Edward Loper 在 Python 的基础上开发的一个模块,至今已有超过十万行的代码。这是一个开源项目,包含数据集、 Python 模块、教程等。
// 27.SpaCy 库
官网:
https://spacy.io/
特点:
SpaCy 是一个 Python 和 CPython 的 NLP 自然语言文本处理库。SpaCy主要功能包括分词、词性标注、词干化、命名实体识别、名词短语提取等等。
// 28.PKUSeg 库
官网:
https://pypi.org/project/pkuseg/
特点:
PKUSeg-Python 是由北京大学语言计算与机器学习研究组研制推出的一个高准确度的中文分词工具包。PKUSeg-Python 简单易用,支持多领域分词,在不同领域的数据上都大幅提高了分词的准确率。
// 29.Gensim 库
官网:
https://radimrehurek.com/gensim/
特点:
Gensim 是一个相当专业的主题模型 Python 工具包。在文本处理中,比如商品评论挖掘,有时需要了解每个评论分别和商品的描述之间的相似度,以此衡量评论的客观性。评论和商品描述的相似度越高,说明评论的用语比较官方,不带太多感情色彩,比较注重描述商品的属性和特性,角度更客观。Gensim 就是 Python 里面计算文本相似度的程序包。
// 30.CoreNLP 库
官网:
https://stanfordnlp.github.io/CoreNLP/
特点:
Stanford CoreNLP 提供了一套人类语言技术工具。支持多种自然语言处理基本功能,Stanford CoreNLP 是它的一个 Python 接口。Stanford CoreNLP 主要功能包括分词、词性标注、命名实体识别、句法结构分析和依存分析等等。
// 31.TextBlob 库
官网:
https://pypi.org/project/textblob/
特点:
用于处理文本数据的Python库。它提供一个简单的API,可用于深入研究常见的NLP任务,如词性标注、名词短语提取、情感分析、文本翻译、分类等。
// 32.Stanfordnlp 库
官网:
https://github.com/stanfordnlp/stanfordnlp
特点:
Stanford NLP提供了一系列自然语言分析工具。它能够给出基本的词形、词性,并且能够标记句子的结构,语法形式和字词的依赖,指明那些名字指向同样的实体,指明情绪,提取发言中的开放关系等。
Python
计算机视觉
// 33.openCV 库
官网:
https://opencv.org/
特点:
OpenCV 是一个基于BSD许可(开源)发行的跨平台计算机视觉和机器学习软件库,可以运行在 Linux、Windows、Android 和 MacOS 操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了 Python、Ruby、MATLAB 等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。
// 34.Scikit-Image 库
官网:
https://scikit-image.org/
特点:
Scikit-Image 是图像处理算法的集合,采用 Python 语言编写。它实现了用于研究、教育和工业应用的算法和实用程序。它是一个相当简单和直接的库,即使对于 Python 生态系统的新手也是如此。
// 35.Pillow/PIL 库
官网:
https://pillow.readthedocs.io/en/stable
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注Python)
。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!**
因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
[外链图片转存中…(img-1I0Fp0US-1712761693556)]
[外链图片转存中…(img-bNjTZhm7-1712761693557)]
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注Python)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。