从买产品到卖服务英伟达的云服务布局显露深意
集微网消息,据外媒报道,英伟达近期一系列商业动作,显示出其正在利用自身优势,在巨头环伺的云服务市场找到自己的生态位,通过其构建的基础设施上销售服务赚取收入。
报道提到,英伟达创始人黄仁勋提出了DGX Cloud计划,试图将公司的DGX AI超级计算机硬件和配套软件——尤其是其广泛的企业AI套件——放到公有云平台上供企业使用。认为这是一种让缺乏资金的企业更容易获得AI算力运行大型语言模型等负载的方法。借助DGX Cloud,他们可以跳转到主要云服务提供商的环境之一,访问英伟达硬件和软件,并运行他们庞大而复杂的AI训练工作负载。
此次GTC大会上,英伟达高管正式推出了相关产品,报道分析称,DGX Cloud的巧妙之处不在于有经过认证的本地和云堆栈来运行其AI硬件和软件,其理念体现出使AI普惠化的有益尝试,将其带出HPC和研究机构的领域,并将其置于主流企业的范围内,这些企业非常渴望利用新兴技术可以带来的业务优势。
报道还认为,对英伟达而言,DGX Cloud的人工智能即服务(AI as a Service)代表着向云优先战略的强烈转变,以及一种定位——与其他组件制造商一样——它现在既是一家硬件制造商,也是一家软件公司,而公有云是一个使该软件易于访问,并且更重要的是,将其货币化的自然途径。
回顾过去,英伟达早在2016年推出了DGX-1,这是其第一台深度学习超级计算机。第四代系统于去年推出。2020年出现了第一批DGX SuperPOD,一年后其推出了AI Enterprise,这是一个包含框架、工具和VMware vSphere的软件套件。
AI Enterprise强调了软件对英伟达日益增长的重要性——反映了其他组件制造商的类似趋势——这家公司现在从事软件工作的员工多于硬件。
借助DGX Cloud,英伟达现在可以通过另一种方式将所有这些交付给那些希望在其工作流程中利用生成式AI工具的企业,他们现在可以通过云访问它,享受它所有的可扩展性和即用即付的好处。
英伟达企业计算副总裁Manuvir Das表示:“多年来,我们一直在与企业公司合作,创建他们自己的模型来训练他们自己的数据。过去几个月,像ChatGPT这样基于非常非常大的GPT模型的服务越来越受欢迎,每天有数百万人使用一个模型。当我们与企业公司合作时,他们中的许多人有兴趣使用自己的数据为自己的目的创建模型。”
Das还谈到,“它采用相同的模型,但现在将其托管在公共云中,多年来,我们使用 DGX 所做的不仅仅是一台最先进的超级计算机,而且我们还构建了一个位于其上的软件堆栈,将其转变为交钥匙服务。你只需提供你的工作,指向你的数据集,然后你点击“开始”,所有的编排和下面的一切都会被处理。现在在DGX Cloud中,相同的模型可用于托管在各种公共云中的基础设施。它是相同的界面,用于运行训练的相同模型。它还可以在本地使用,因此它是一个真正的多云、混合云解决方案。”
不过对于英伟达而言,只有云服务商才能提供对运行大规模多节点AI训练操作所需的数万个GPU的调度能力,英伟达没有资金构建类似的基于云的基础设施来提供这种能力,因此必须与IaaS厂商进行合作。英伟达称,Oracle云基础设施 (OCI) Supercluster将提供裸机计算、高端RDMA网络以及可扩展到超过32,000个GPU的高性能本地和块存储。
根据Das的说法,企业可以访问DGX Cloud实例,每个实例每月36,999美元起。每个实例包括八个Nvidia H100或A100 80 GB GPU,每个GPU节点内存高达640 GB。计算资源是专用的,不与云中的其他租户共享,网络也在租户之间隔离。
作为云业务的一部分,英伟达还在推出一个名为Nvidia AI Foundations的平台,这是一组云服务,使企业能够创建、定制和部署定制的生成AI模型。这些服务包括用于ChatGPU等文本到文本操作的NeMo,以及用于药物发现的大型语言模型的BioNeMo。英伟达现在还添加了Picasso,这是一种图像、视频和3D模型,也可以导入到其元宇宙平台Omniverse中。
报道还透露,该公司即将在微软Azure中推出Omniverse Cloud,这是一种平台即服务,它建立在英伟达已经提供的Omniverse基础设施即服务之上,旨在创建3D虚拟世界以创造身临其境的体验。中欧体育中欧体育
扫一扫关注中欧体育