人工智能uu

这个屌丝很懒，什么也没留下！

热门标签

热门文章

当前位置: article > 正文

Python数据分析可视化和大模型的随想_py开发大模型

作者：人工智能uu | 2024-06-25 22:31:38

赞

踩

py开发大模型

什么是智能？

我们今天所说的人工智能，即AGI，实质上距离我们大多数人所想的AI还差之甚远，今天所谓的“智能”是挖掘信息，实现预测的意思。其整个流程是Data--->Information--->Knowladge--->Wisdom,其实就是用简单的Data实现最复杂的Wisdom的过程，我们就称之为“智能”

关于数据

数据是智能的基础，Π——圆周率，一个永不重复，永无止境的数据，其中包含了所有的数字组合，经过转化就是所有的文本组合，包括我们读过的每一本书，我们讲过的每一句话，我们的生日，身份证号码，我们的生平事迹......这就是数据。关于数据的研究可以分为三类：Vector（向量）、Matrix（矩阵）和Tensor（张量），即一维数组，二维数组和多维的数组

什么是数据挖掘？

“数据挖掘是从大型数据库中自动地发现有用信息的过程”。数据挖掘任务可以分为四个方面

预测建模
关联分析
聚类分析
异常检测

预测建模包括回归和分类，回归简单来讲就是由数据到方程的映射，解决的是产生数据的根本的问题。而分类就是我们了解的人脸识别、声音识别、情感分析、语音识别等任务。而这些任务的实现是基于模型的，即由训练集和测试集产生的模型得出结果

关联分析是由模型的反馈得出事物间的联系，最常见的案例就是啤酒和尿布的关联销售

聚类分析是无监督的学习，是基于数据的相似性和差异性进行分类的步骤

异常检测可以检测出异常或缺失的数据

常见的分类算法：决策树、KNN、BAYES、SVM和我们熟知的神经网络

常见的聚类算法：Kmeans、凝聚层次聚类和DBSCAN

泰坦尼克号数据的分析

下载好数据集，导入Pycharm就可以进行分析啦

数据：

分析结果：

生还和舱位等级的关系

生存和死亡人数的比例

各年龄段生还和罹难的人数比例

各因素间的相关性分析

关于大模型

大模型时未来人工智能和机器学习领域的重点，采用预训练模型+微调的范式进行对AI的训练是现在的主流做法。所谓的预训练模型就是数据的迁移，利用可共享的现成数据进行训练，而后期的微调则是根据产品特点进行的个性化训练。解决数据处理速度的问题一般使用数据蒸馏的方法

数据蒸馏

大模型作诗

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/人工智能uu/article/detail/757570

推荐阅读

相关标签

Copyright © 2003-2013 www.wpsshop.cn 版权所有，并保留所有权利。

闽ICP备14008679号