VMware e NVIDIA desbloqueiam IA generativa para as empresas

VMware e NVIDIA desbloqueiam IA generativa para as empresas

O novo VMware Private AI Foundation com a NVIDIA permite que as empresas preparem seus negócios para a IA generativa; a plataforma oferece suporte adicional à privacidade, segurança e controle de dados


A VMware Inc. (NYSE: VMW) e a NVIDIA (NASDAQ: NVDA) anunciam a expansão da parceria estratégica para preparar as centenas de milhares de empresas que utilizam a infraestrutura de nuvem da VMware para a era da IA generativa.

O VMware Private AI Foundation com a NVIDIA permitirá que as empresas personalizem modelos e executem aplicações de IA generativa, incluindo chatbots inteligentes, assistentes, pesquisa e resumo.  A plataforma será uma solução totalmente integrada com software de IA generativa e computação acelerada da NVIDIA, desenvolvida no VMware Cloud Foundation e otimizada para IA.

"A IA generativa e a multi-cloud são a combinação perfeita", afirma Raghu Raghuram, CEO da VMware. "Os dados dos clientes estão em toda parte - em seus data centers, no edge e em suas nuvens. Juntamente com a NVIDIA, iremos empoderar as empresas a executar suas cargas de trabalho de IA generativa adjacentes aos seus dados com confiança, ao mesmo tempo em que abordamos suas preocupações de privacidade, segurança e controle de dados corporativos."

"As empresas de todos os lugares estão correndo para integrar a IA generativa em seus negócios", ressalta Jensen Huang, fundador e CEO da NVIDIA. "Nossa colaboração ampliada com a VMware oferecerá a centenas de milhares de clientes - em serviços financeiros, saúde, manufatura e muito mais - o software full-stack e a computação completa de que precisam para desbloquear o potencial da IA generativa usando aplicações personalizadas criadas com seus próprios dados."

 

Computação full-stack completa para turbinar a IA generativa

Para obter benefícios comerciais mais rapidamente, as empresas estão buscando simplificar o desenvolvimento, o teste e a implementação de aplicações de IA generativa. A McKinsey estima que a IA generativa poderia acrescentar até US$ 4,4 trilhões anualmente à economia global.(1)

O VMware Private AI Foundation com a NVIDIA permitirá que as empresas aproveitem esse recurso, personalizando grandes modelos de linguagem; produzindo modelos mais seguros e privados para uso interno; oferecendo IA generativa como um serviço para seus usuários; e executando cargas de trabalho de inferência em escala com mais segurança.

Espera-se que a plataforma inclua ferramentas de IA integradas para empoderar as empresas a executar modelos comprovados treinados em seus dados privados de maneira econômica. A ser construída sobre o VMware Cloud Foundation e o software NVIDIA AI Enterprise, os benefícios esperados da plataforma incluirão:

 

  • Privacidade - Permitirá que os clientes executem facilmente serviços de IA adjacentes a qualquer lugar em que tenham dados com uma arquitetura que preserve a privacidade dos dados e permita o acesso seguro.
  • Escolha - As empresas terão uma ampla escolha de onde construir e executar seus modelos - do NVIDIA NeMo™ ao Llama 2 e além - incluindo as principais configurações de hardware OEM e, no futuro, em nuvem pública e ofertas de provedores de serviços.
  • Desempenho - A execução na infraestrutura acelerada da NVIDIA proporcionará desempenho igual e até superior ao do bare metal em alguns casos de uso, conforme comprovado em benchmarks recentes do setor.
  • Escala do data center - As otimizações de escala da GPU em ambientes virtualizados permitirão que as cargas de trabalho de IA sejam dimensionadas em até 16 vGPUs/GPUs em uma única máquina virtual e em vários nós para acelerar o ajuste fino e a implementação do modelo de IA generativo.
  • Custo mais baixo - Maximizará o uso de todos os recursos de computação entre GPUs, DPUs e CPUs para reduzir os custos gerais e criar um ambiente de recursos agrupados que possa ser compartilhado com eficiência entre as equipes.
  • Armazenamento acelerado - A arquitetura de armazenamento VMware vSAN Express fornecerá armazenamento NVMe otimizado para o desempenho e oferecerá suporte ao armazenamento GPUDirect® sobre RDMA, permitindo a transferência direta de E/S do armazenamento para as GPUs sem o envolvimento da CPU.
  • Rede acelerada - A integração profunda entre o vSphere e a tecnologia NVIDIA NVSwitch™ permitirá que modelos multi-GPU sejam executados sem gargalos inter-GPU.
  • Implantação rápida e tempo de retorno do investimento - As imagens de VM do vSphere Deep Learning e o repositório de imagens permitirão recursos de prototipagem rápidos, oferecendo uma imagem de solução turnkey estável que inclui estruturas e bibliotecas otimizadas para desempenho pré-instaladas.

 

A plataforma contará com o NVIDIA NeMo, um framework nativo do cloud de ponta a ponta incluído no NVIDIA AI Enterprise - o sistema operacional da plataforma NVIDIA AI - que permite que as empresas criem, personalizem e implantem modelos de IA generativa em praticamente qualquer lugar. O NeMo combina frameworks de personalização, kits de ferramentas de guardrail, ferramentas de curadoria de dados e modelos pré-treinados para oferecer às empresas uma maneira fácil, econômica e rápida de adotar a IA generativa.

Para implantar a IA generativa na produção, o NeMo usa o TensorRT para grandes modelos de linguagem (TRT-LLM), que acelera e otimiza o desempenho da inferência nos grandes modelos de linguagem (LLMs) mais recentes em GPUs NVIDIA. Com o NeMo, o VMware Private AI Foundation com a NVIDIA permitirá que as empresas extraiam seus próprios dados para criar e executar modelos de IA generativa personalizados na infraestrutura de nuvem híbrida da VMware.

No VMware Explore 2023, a NVIDIA e a VMware destacarão como os desenvolvedores das empresas podem usar o novo NVIDIA AI Workbench para extrair modelos da comunidade, como o Llama 2, disponível no Hugging Face, personalizá-los remotamente e implantar IA generativa de nível de produção em ambientes VMware.

"Essa plataforma permitirá a integração de soluções de IA generativa em diversas empresas. As companhias poderão, de forma segura e com controle de dados, personalizar e produzir modelos para uso interno", pontua Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.

 

Amplo suporte do ecossistema para o VMware Private AI Foundation com NVIDIA

O VMware Private AI Foundation com NVIDIA será suportado pela Dell Technologies, Hewlett Packard Enterprise e Lenovo, que estarão entre as primeiras a oferecer sistemas que aumentam a personalização de grandes modelos de linguagem (LLMs) corporativo e as cargas de trabalho de inferência com GPUs NVIDIA L40SDPUs NVIDIA BlueField®-3 e SmartNICs NVIDIA ConnectX®-7.

A GPU NVIDIA L40S permite até 1,2x mais desempenho de inferência de IA generativa e até 1,7x mais desempenho de treinamento em comparação com a GPU NVIDIA A100 Tensor Core.

As DPUs NVIDIA BlueField-3 aceleram, descarregam e isolam a enorme carga computacional de virtualização, rede, armazenamento, segurança e outros serviços de IA nativos do cloud da GPU ou CPU.

As SmartNICs NVIDIA ConnectX-7 fornecem redes inteligentes e aceleradas para a infraestrutura do data center para impulsionar algumas das cargas de trabalho de IA mais exigentes do mundo.

O VMware Private AI Foundation com a NVIDIA se baseia na parceria de uma década entre as empresas. Seu trabalho de engenharia conjunta otimizou a infraestrutura em nuvem da VMware para executar o NVIDIA AI Enterprise com desempenho comparável ao do bare metal. Os clientes mútuos se beneficiam ainda mais do gerenciamento de recursos e infraestrutura e da flexibilidade possibilitada pelo VMware Cloud Foundation.

 

Disponibilidade

A VMware pretende lançar o VMware Private AI Foundation com a NVIDIA no início de 2024.

(1) “The economic potential of generative AI: The next productivity frontier,” McKinsey, 2023

 

Sobre a VMware

A VMware é uma fornecedora líder de serviços multi-cloud para todos os aplicativos, permitindo a inovação digital com controle empresarial. Como uma base confiável para acelerar a inovação, o software da VMware oferece às empresas a flexibilidade e as opções necessárias para construir o futuro. Com sede em Palo Alto, Califórnia, a VMware tem o compromisso de construir um futuro melhor por meio da Agenda 2030 da empresa. Para obter mais informações, acesse www.vmware.com/company.

 

Sobre a NVIDIA

Desde sua fundação em 1993, a NVIDIA (NASDAQ: NVDA) tem sido pioneira em computação acelerada. A invenção da GPU pela empresa em 1999 estimulou o crescimento do mercado de games para PC, redefiniu a computação gráfica, iniciou a era da IA moderna e tem ajudado a digitalização industrial em todos os mercados. A NVIDIA agora é uma empresa de computação full-stack com soluções em escala de data center que estão revolucionando o setor.


Veja fotos





O que achou desta notícia?


Cursos Básicos para Concursos