当前位置:   article > 正文

国内为什么诞生不了Hugging Face这样公司的思考以及知识岛发起(1)_hugging face 千帆 魔搭

hugging face 千帆 魔搭

最近一直在关注AI方面的内容,发现海外的AI发展势头非常迅猛——以Hugging Face为代表的AI开源平台一片生机勃勃,各种模型、数据集都以开源的形式发布在平台上,AI的从业人员不需要太多时间即可使用已调好的模型参数,免费下载模型以及数据集,真的是非常方便。反观国内的AI生态,虽然有阿里达摩院建立的”魔搭社区“,但AI的氛围明显跟Hugging Face不是一个感觉。我仔细对比了这两个网站,认为二者AI的开源氛围存在差异有两点:一是AI开源社区的建立和运营不能依赖任何单一的互联网巨头公司。因为对于互联网巨头来说,搭建这样一个社区网站真的非常容易,算力、模型、数据甚至用户,自己公司的池子里都有,为什么要把模型以及数据”资产“上传到别家公司的AI社区呢?就如同”魔搭社区“,被打上了阿里的标签后,里面的模型大部分是阿里自家的大模型”通义千问“,数据的来源也是多数跟阿里有关的平台或应用,并没有发现其他巨头的模型或数据集。而反观Hugging Face,分享一个我注册时的细节,Hugging Face在注册时是不能够选择Facebook、Google甚至Git等国外互联网巨头或社交媒体账号注册的,必须用邮箱注册,你可以说这是没有考虑到用户的注册体验,而我却反思这是不是它对互联网巨头们保持中立的一种体现。事实证明,作为一个”失败了“的智能聊天机器人起家的Hugging Face,已经是全球AI界的明星,国外互联网巨头的开源模型以及参数疯狂涌入社区,也给整个AI生态带来了无穷的活力。二是对于AI,似乎国内外巨头的方向并不是很一致,一个想要提升AI的上限,一个基于AI做产品。这两种方向并没有对错之分,这里我也分享两件事,一件是继开源LLaMA大模型之后,Meta又开源了翻译大模型SeamlessM4T,该模型支持100多种语言的语音和文字之间的相互翻译,随着该模型的开源,越来越多的开发者在此基础上开发和完善功能(Git短短一周获得4.6k星星)。第二件事是讯飞星火在《人工智能大模型体验报告2.0》里拔得头筹,被誉为国产大模型顶流。我好奇体验了一下星火的AI助手功能,从用户的角度来讲,体验还是不错的——低代码自定义的形式生成完成特定任务的AI助手,同时也可以将生成的助手发布至网站上让其他人体验(有点类似steam的创意工坊的功能,这种形式我非常赞同)。从这两件事情来看,Meta和讯飞走的明显是两条路,Meta更注重模型算法的完善,而讯飞更像是在做一个新的AI产品。这两个方向没有对错之分,但站在大模型算法的角度去想这个事情,我更希望国产的AI模型现阶段能够专注去完善大模型算法而不是过早地去考虑产品。动手调过模型参数的同学们都深有体会,每次的调参都是一个“浩大”的工程,不训练完成你永远不知道你调整的参数是否有效(所以很多人把这个过程叫做“炼丹”)。更别提算法的背后是一系列复杂的数学原理,真的是需要集体的智慧去探索。所以,开源一定是AI算法想快速发展的最佳途径。试想一下,大公司的AI团队人员流动性还是挺高的,如果闭源,这么浩大的工程,如何保证人员流动下的知识传递?就算核心人员固定,那又如何以闭源小团队的力量去对抗开源大集体的智慧?有人可能会说,“拿来主义“也很好啊,国外出钱,我们体验,不仅”少走了弯路“,还节省了算力和电费的投入。这种想法,我不敢苟同。且不说在AI算法优化过程中积累的经验可能会诞生新的算法架构从而巅峰整个AI界,也不说国外巨头开源的算法不一定是最新的成果。就拿目前的形势来说,AI模型算法界说是”百模大战“毫不为过,”拿来主义“怎么保证能”押对宝“?就算你是赌神,押中了最终胜利的模型算法,那难道不会处处受制于人,被”卡脖子“吗?所以,支持国产中文AI大模型的发展,摒弃”拿来主义“才是正途。

那作为普通人的我们能做些什么呢?数据、算法和算力,是AI发展的三大基础。算法和算力都是需要大公司的大量科研和资金投入才能发展的,所以普通人只能在数据上为AI贡献力量。优秀的大模型建设离不开高质量的数据集,从Hugging Face上的模型数据集数量来看,5W多的数据集中,英语的占比超过90%。因此,我想发起一个”知识岛“的项目,为国产大模型提供高质量的汉语训练数据集。如果你想加入该知识岛,成为志愿者,可以加入QQ群:916663510,或者点击知识岛社区文档了解详情: 知识岛-Knowledge DAO-社区导航

知识岛需要的人:

1、  愿意分享行业经验的伙伴,共同参与AI行业专家的模型训练;

2、  拥有IT技术的伙伴,为社区的发展添砖加瓦;

3、  想要参与社区运营的伙伴,为社区稳步发展保驾护航;

4、  天使投资者,看好知识岛,为知识岛的建设提供资金支持;

5、热心的参与者,参与知识岛社群规则建立,为社区的良性发展出谋划策。

Share your knowledge,empower the world!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/196926
推荐阅读
相关标签
  

闽ICP备14008679号