VMware e NVIDIA desbloqueiam IA generativa para as empresas
O novo VMware Private AI Foundation com a NVIDIA permite que as empresas preparem seus negócios para a IA generativa; a plataforma oferece suporte adicional à privacidade, segurança e controle de dados
A VMware Inc. (NYSE: VMW) e a NVIDIA (NASDAQ: NVDA) anunciam a expansão da parceria estratégica para preparar as centenas de milhares de empresas que utilizam a infraestrutura de nuvem da VMware para a era da IA generativa.
O VMware Private AI Foundation com a NVIDIA permitirá que as empresas personalizem modelos e executem aplicações de IA generativa, incluindo chatbots inteligentes, assistentes, pesquisa e resumo. A plataforma será uma solução totalmente integrada com software de IA generativa e computação acelerada da NVIDIA, desenvolvida no VMware Cloud Foundation e otimizada para IA.
"A IA generativa e a multi-cloud são a combinação perfeita", afirma Raghu Raghuram, CEO da VMware. "Os dados dos clientes estão em toda parte - em seus data centers, no edge e em suas nuvens. Juntamente com a NVIDIA, iremos empoderar as empresas a executar suas cargas de trabalho de IA generativa adjacentes aos seus dados com confiança, ao mesmo tempo em que abordamos suas preocupações de privacidade, segurança e controle de dados corporativos."
"As empresas de todos os lugares estão correndo para integrar a IA generativa em seus negócios", ressalta Jensen Huang, fundador e CEO da NVIDIA. "Nossa colaboração ampliada com a VMware oferecerá a centenas de milhares de clientes - em serviços financeiros, saúde, manufatura e muito mais - o software full-stack e a computação completa de que precisam para desbloquear o potencial da IA generativa usando aplicações personalizadas criadas com seus próprios dados."
Computação full-stack completa para turbinar a IA generativa
Para obter benefícios comerciais mais rapidamente, as empresas estão buscando simplificar o desenvolvimento, o teste e a implementação de aplicações de IA generativa. A McKinsey estima que a IA generativa poderia acrescentar até US$ 4,4 trilhões anualmente à economia global.(1)
O VMware Private AI Foundation com a NVIDIA permitirá que as empresas aproveitem esse recurso, personalizando grandes modelos de linguagem; produzindo modelos mais seguros e privados para uso interno; oferecendo IA generativa como um serviço para seus usuários; e executando cargas de trabalho de inferência em escala com mais segurança.
Espera-se que a plataforma inclua ferramentas de IA integradas para empoderar as empresas a executar modelos comprovados treinados em seus dados privados de maneira econômica. A ser construída sobre o VMware Cloud Foundation e o software NVIDIA AI Enterprise, os benefícios esperados da plataforma incluirão:
- Privacidade - Permitirá que os clientes executem facilmente serviços de IA adjacentes a qualquer lugar em que tenham dados com uma arquitetura que preserve a privacidade dos dados e permita o acesso seguro.
- Escolha - As empresas terão uma ampla escolha de onde construir e executar seus modelos - do NVIDIA NeMo™ ao Llama 2 e além - incluindo as principais configurações de hardware OEM e, no futuro, em nuvem pública e ofertas de provedores de serviços.
- Desempenho - A execução na infraestrutura acelerada da NVIDIA proporcionará desempenho igual e até superior ao do bare metal em alguns casos de uso, conforme comprovado em benchmarks recentes do setor.
- Escala do data center - As otimizações de escala da GPU em ambientes virtualizados permitirão que as cargas de trabalho de IA sejam dimensionadas em até 16 vGPUs/GPUs em uma única máquina virtual e em vários nós para acelerar o ajuste fino e a implementação do modelo de IA generativo.
- Custo mais baixo - Maximizará o uso de todos os recursos de computação entre GPUs, DPUs e CPUs para reduzir os custos gerais e criar um ambiente de recursos agrupados que possa ser compartilhado com eficiência entre as equipes.
- Armazenamento acelerado - A arquitetura de armazenamento VMware vSAN Express fornecerá armazenamento NVMe otimizado para o desempenho e oferecerá suporte ao armazenamento GPUDirect® sobre RDMA, permitindo a transferência direta de E/S do armazenamento para as GPUs sem o envolvimento da CPU.
- Rede acelerada - A integração profunda entre o vSphere e a tecnologia NVIDIA NVSwitch™ permitirá que modelos multi-GPU sejam executados sem gargalos inter-GPU.
- Implantação rápida e tempo de retorno do investimento - As imagens de VM do vSphere Deep Learning e o repositório de imagens permitirão recursos de prototipagem rápidos, oferecendo uma imagem de solução turnkey estável que inclui estruturas e bibliotecas otimizadas para desempenho pré-instaladas.
A plataforma contará com o NVIDIA NeMo, um framework nativo do cloud de ponta a ponta incluído no NVIDIA AI Enterprise - o sistema operacional da plataforma NVIDIA AI - que permite que as empresas criem, personalizem e implantem modelos de IA generativa em praticamente qualquer lugar. O NeMo combina frameworks de personalização, kits de ferramentas de guardrail, ferramentas de curadoria de dados e modelos pré-treinados para oferecer às empresas uma maneira fácil, econômica e rápida de adotar a IA generativa.
Para implantar a IA generativa na produção, o NeMo usa o TensorRT para grandes modelos de linguagem (TRT-LLM), que acelera e otimiza o desempenho da inferência nos grandes modelos de linguagem (LLMs) mais recentes em GPUs NVIDIA. Com o NeMo, o VMware Private AI Foundation com a NVIDIA permitirá que as empresas extraiam seus próprios dados para criar e executar modelos de IA generativa personalizados na infraestrutura de nuvem híbrida da VMware.
No VMware Explore 2023, a NVIDIA e a VMware destacarão como os desenvolvedores das empresas podem usar o novo NVIDIA AI Workbench para extrair modelos da comunidade, como o Llama 2, disponível no Hugging Face, personalizá-los remotamente e implantar IA generativa de nível de produção em ambientes VMware.
"Essa plataforma permitirá a integração de soluções de IA generativa em diversas empresas. As companhias poderão, de forma segura e com controle de dados, personalizar e produzir modelos para uso interno", pontua Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.
Amplo suporte do ecossistema para o VMware Private AI Foundation com NVIDIA
O VMware Private AI Foundation com NVIDIA será suportado pela Dell Technologies, Hewlett Packard Enterprise e Lenovo, que estarão entre as primeiras a oferecer sistemas que aumentam a personalização de grandes modelos de linguagem (LLMs) corporativo e as cargas de trabalho de inferência com GPUs NVIDIA L40S, DPUs NVIDIA BlueField®-3 e SmartNICs NVIDIA ConnectX®-7.
A GPU NVIDIA L40S permite até 1,2x mais desempenho de inferência de IA generativa e até 1,7x mais desempenho de treinamento em comparação com a GPU NVIDIA A100 Tensor Core.
As DPUs NVIDIA BlueField-3 aceleram, descarregam e isolam a enorme carga computacional de virtualização, rede, armazenamento, segurança e outros serviços de IA nativos do cloud da GPU ou CPU.
As SmartNICs NVIDIA ConnectX-7 fornecem redes inteligentes e aceleradas para a infraestrutura do data center para impulsionar algumas das cargas de trabalho de IA mais exigentes do mundo.
O VMware Private AI Foundation com a NVIDIA se baseia na parceria de uma década entre as empresas. Seu trabalho de engenharia conjunta otimizou a infraestrutura em nuvem da VMware para executar o NVIDIA AI Enterprise com desempenho comparável ao do bare metal. Os clientes mútuos se beneficiam ainda mais do gerenciamento de recursos e infraestrutura e da flexibilidade possibilitada pelo VMware Cloud Foundation.
Disponibilidade
A VMware pretende lançar o VMware Private AI Foundation com a NVIDIA no início de 2024.
(1) “The economic potential of generative AI: The next productivity frontier,” McKinsey, 2023
Sobre a VMware
A VMware é uma fornecedora líder de serviços multi-cloud para todos os aplicativos, permitindo a inovação digital com controle empresarial. Como uma base confiável para acelerar a inovação, o software da VMware oferece às empresas a flexibilidade e as opções necessárias para construir o futuro. Com sede em Palo Alto, Califórnia, a VMware tem o compromisso de construir um futuro melhor por meio da Agenda 2030 da empresa. Para obter mais informações, acesse www.vmware.com/company.
Sobre a NVIDIA
Desde sua fundação em 1993, a NVIDIA (NASDAQ: NVDA) tem sido pioneira em computação acelerada. A invenção da GPU pela empresa em 1999 estimulou o crescimento do mercado de games para PC, redefiniu a computação gráfica, iniciou a era da IA moderna e tem ajudado a digitalização industrial em todos os mercados. A NVIDIA agora é uma empresa de computação full-stack com soluções em escala de data center que estão revolucionando o setor.