赞
踩
开头还是介绍一下群,如果感兴趣polardb ,mongodb ,mysql ,postgresql ,redis 等有问题,有需求都可以加群群内有各大数据库行业大咖,CTO,可以解决你的问题。加群请联系 liuaustin3 ,在新加的朋友会分到3群(共950人左右 1 + 2 + 3),最近发展的速度比较快,2群除特殊情况,不在添加,默认去3群。
基于云的数据仓库公司Snowflake正在将其注意力转向大型语言模型和生成式人工智能。该公司成立于2014年,专注于颠覆传统的数据仓库市场和大数据分析,它不断增加新功能,如其原生应用程序框架,以针对不同的企业用户群体。
在其年度Snowflake峰会上,该公司宣布了Snowpark Container Services,这是与Nvidia的合作伙伴关系,以及其Streamlit Python库的更新,旨在帮助企业用户管理大型语言模型(LLM)并在其数据云平台内构建应用程序。
正在私有预览中的Snowpark Container Services将允许企业将更多不同类型的工作负载,包括LLM,带入数据云平台,Snowflake的产品高级副总裁Christian Kleinerman表示,它还允许开发人员使用任何编程语言构建应用程序。
新的容器服务充当了一个枢纽,将存储在Snowflake中的企业数据与LLM、模型训练接口、模型治理框架、第三方数据增强应用程序、机器学习模型、API和Snowflake的原生应用程序框架连接起来。
"Snowpark容器化服务将帮助公司根据客户的偏好将工作负载(如机器学习模型或LLM)在公有云和私有云之间迁移",Amalgam Insights首席分析师Hyoun Park说道。
随着企业发现与训练LLM和其他机器学习模型相关的大规模数据输入和使用可能存在合规风险,将这些模型迁移到受治理和隔离的系统变得越来越重要,这就使得安全迁移工作负载的过程变得非常重要,Park补充道。
据Constellation Research的首席分析师Doug Henschen表示,容器服务还将有助于减轻Snowflake数据仓库引擎的负担,因为它将在抽象化的Kubernetes环境中运行。
“简单来说,它是一种在Snowflake数据上直接运行一系列应用服务的方式,而不会给数据仓库和性能敏感的分析应用程序带来负担,” Henschen说道。
Nvidia与Snowflake合作,为LLM培训提供技术支持 为了帮助企业利用存储在Snowflake中的数据对LLM进行培训,该公司与Nvidia合作,以获得其结合了硬件和软件能力的AI平台。该公司表示,Snowflake将从Data Cloud内部运行Nvidia NeMo,这是AI平台的一部分,补充说NeMo可用于开发基于生成式人工智能的应用程序,例如聊天机器人和智能搜索引擎。
此外,Snowpark容器服务将允许企业获取第三方生成式人工智能模型提供商(如Reka AI)的访问权限,SanjMo的首席分析师Sanjeev Mohan说。
Mohal还表示,也可以通过API访问来自OpenAI、Cohere和Anthropic等其他LLM。
分析师表示,Snowflake的更新显示出其旨在与Databricks竞争的战略。
“Databricks目前在构建本地AI和ML(机器学习)模型方面的能力远远超过Snowflake,尤其是通过MosaicML收购,承诺以更低廉更快速地训练模型,”Constellation Research的首席分析师Andy Thurai说道。
dbInsights的首席分析师Tony Baer表示,这两家公司之间的策略差异似乎在于其扩大用户群的方式。
“Snowflake试图将其从数据和BI开发人员的基础上扩展到数据科学家和数据工程师,而Databricks则从相反的方向进行,”Baer说。
文档AI从非结构化数据中生成洞察 该公司表示,新的容器服务将允许企业访问数据增强和机器学习工具,例如Hex的用于分析和数据科学的笔记本,Alteryx、Dataiku和SAS的人工智能工具,以及基于Apache Airflow的数据工作流管理工具Astronomer。此外,还提供来自Amplitude、CARTO、H2O.ai、Kumo AI、Pinecone、RelationalAI和Weights & Biases的第三方软件。
Snowflake还表示,他们正在发布一款名为文档AI的自主开发的LLM,旨在从文档中生成洞察。
该公司表示,文档AI是基于Snowflake去年收购的Applica的技术构建的,旨在帮助企业更多地利用非结构化数据,新的LLM可以提升企业的生产力。
dbInsights的Baer认为,增加这个新的LLM是为了与AWS、Oracle和微软等竞争对手的产品保持步调一致的举措。
MLOps工具和其他更新 为了帮助企业进行机器学习模型操作(MLOps),Snowflake推出了Snowpark模型注册表。
公司表示,这个注册表是企业机器学习模型的统一存储库。它旨在让用户集中发布和发现模型,从而简化数据科学家和机器学习工程师之间的协作。
尽管AWS、Databricks、Google Cloud和Microsoft等竞争对手已经提供了MLOps工具,但分析师们认为新的模型注册表是一个重要的更新。
“模型注册表和存储库是数据中的一个新的重要战场,公司可以选择把自己珍贵的专有或商业模型放在哪里,并确保适当管理存储、元数据和版本控制,”Park说道。
此外,Snowflake还在将Streamlit集成到其Data Cloud平台中取得了进展,首先在公开预览阶段进行最后的微调,然后进行正式发布。
此外,该公司还表示正在将Apache Iceberg表格的使用扩展到企业自己的存储中。
其他主要面向开发人员的更新包括在Data Cloud平台中集成Git和全新的命令行界面(CLI),这两个功能目前正在私人预览中。
公司表示,原生的Git集成将支持CI/CD工作流程,而新的CLI将有助于在Snowflake中进行应用程序开发和测试。
为了帮助开发人员获取流式数据并消除批处理和流式处理之间的界限,Snowflake还推出了Dynamic Tables和Snowpipe Streaming这两个新功能。
Snowpipe Streaming预计很快即将正式提供,Dynamic Tables目前正在公开预览中。
Snowflake还表示,其原生应用程序框架现已在AWS上公开预览。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。