当前位置:   article > 正文

Python数据分析可视化和大模型的随想_py开发大模型

py开发大模型

       什么是智能?

我们今天所说的人工智能,即AGI,实质上距离我们大多数人所想的AI还差之甚远,今天所谓的“智能”是挖掘信息,实现预测的意思。其整个流程是Data--->Information--->Knowladge--->Wisdom,其实就是用简单的Data实现最复杂的Wisdom的过程,我们就称之为“智能”

        关于数据

数据是智能的基础,Π——圆周率,一个永不重复,永无止境的数据,其中包含了所有的数字组合,经过转化就是所有的文本组合,包括我们读过的每一本书,我们讲过的每一句话,我们的生日,身份证号码,我们的生平事迹......这就是数据。关于数据的研究可以分为三类:Vector(向量)、Matrix(矩阵)和Tensor(张量),即一维数组,二维数组和多维的数组

        什么是数据挖掘

“数据挖掘是从大型数据库中自动地发现有用信息的过程”。数据挖掘任务可以分为四个方面

  1. 预测建模
  2. 关联分析
  3. 聚类分析
  4. 异常检测

预测建模包括回归和分类,回归简单来讲就是由数据到方程的映射,解决的是产生数据的根本的问题。而分类就是我们了解的人脸识别、声音识别、情感分析、语音识别等任务。而这些任务的实现是基于模型的,即由训练集和测试集产生的模型得出结果

关联分析是由模型的反馈得出事物间的联系,最常见的案例就是啤酒和尿布的关联销售

聚类分析是无监督的学习,是基于数据的相似性和差异性进行分类的步骤

异常检测可以检测出异常或缺失的数据

常见的分类算法:决策树、KNN、BAYES、SVM和我们熟知的神经网络

常见的聚类算法:Kmeans、凝聚层次聚类和DBSCAN

泰坦尼克号数据的分析

下载好数据集,导入Pycharm就可以进行分析啦

数据:

 分析结果:

生还和舱位等级的关系

 生存和死亡人数的比例

 各年龄段生还和罹难的人数比例

 各因素间的相关性分析

 关于大模型

大模型时未来人工智能和机器学习领域的重点,采用预训练模型+微调的范式进行对AI的训练是现在的主流做法。所谓的预训练模型就是数据的迁移,利用可共享的现成数据进行训练,而后期的微调则是根据产品特点进行的个性化训练。解决数据处理速度的问题一般使用数据蒸馏的方法

数据蒸馏

 

大模型作诗

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/人工智能uu/article/detail/757570
推荐阅读
相关标签
  

闽ICP备14008679号