赞
踩
来源|Gradient Dissent
翻译|贾川、胡燕君
Hugging Face,这家以emoji“抱抱脸”命名的开源创业公司,以一种连创始团队不曾预料的速度成为了AI开源社区的顶级“网红”。目前,Hugging Face模型库在Github上获得了超过62,000个Star,14,000次forks,代码贡献者超1200人,每月被安装超100万次。
就在5月10日,Hugging Face宣布C轮融资筹集了1亿美元,由Lux Capital领投,红杉资本、Coatue、Betaworks、NBA球星Kevin Durant等参与投资,目前估值达到20亿美元。由此,Hugging Face进一步在业内引发强烈反响。
很多人好奇Hugging Face为何能一炮而红?凭什么受到资本青睐?
故事还要从2016年说起,法国连续创业者Clément Delangue(曾创办笔记平台VideoNot.es,媒体监测平台mention以及被Google收购的移动开发平台Moodstocks等项目)和Julien Chaumond、Thomas Wolf一起创办了Hugging Face,并从Betaworks和NBA球星杜兰特等拿到天使融资,他们最开始的方向是做对话机器人,但跟当时很多做类似方向的创业公司一样,一直没有起色。
直到2019年,为了训练聊天机器人的NLP能力,他们在GitHub开源了一个Transformers库,令人意外的是,在机器学习社区迅速流行起来,成为GitHub史上增长最快的机器学习库。无心插柳柳成荫,运气,有时就是这么邪门儿。
不止于NLP库,Hugging Face也在逐渐变成机器学习领域的ModelHub中心。如今,Hugging Face已经共享了超100,000个预训练模型,10,000个数据集,涵盖了 NLP、计算机视觉、语音、时间序列、生物学、强化学习等领域,以帮助科学家和相关从业者更好地构建模型,并将其用于产品或工作流程。现在,他们发起的BigScience项目,吸引了超1000名研究者共同训练超大规模模型。
作为一家商业公司,Hugging Face也从去年的30人扩张到了120多人,有超过10,000家公司在使用他们的产品和服务,其中付费用户超过1000。
Clément认为,取得这些成绩的主要原因在于,Hugging Face弥补了科学与生产之间的鸿沟,通过搭建平台为开源界和科学界赋能,所产生的价值比通过搭建专有工具产生的价值要高上千倍,而很多开源软件和公司都没有做到这一点。某种程度上,Hugging Face是在构建机器学习领域的“GitHub”,让其成为一个由社区开发者驱动的平台。
2021年6月,在机器学习播客《Gradient Dissent》中,Lukas Biewald与Hugging Face的CEO兼联合创始人Clément Delangue聊了聊Hugging Face Transformers库兴起的背后故事,揭示了Hugging Face快速增长的缘由,后者也分享了他对NLP技术发展的见解。
以下为对话内容,OneFlow社区做了不改变原意的编译。
1
Transformers库的源起
Lukas:2019年,是什么启发你们要搭建这样的Transformers开源库?
Clément:真实情况是,并没有考虑太多。当时我们使用开源库有一段时间了,在这个领域,总感觉我们是站在巨人的肩膀上在前进,许多人在从事科学研究时,已习惯了这样的方式。比如当你发表关于机器学习的研究时,可能更倾向于以开源而不是论文的形式发表。因此,从研发Hugging Face的第一天开始,我们就在开源库中进行共享。
至于Transformers
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。