NVIDIA e Oracle Aceleram IA Empresarial com Novas Ferramentas

A Inteligência Artificial está transformando a maneira como as empresas criam, implementam e escalam aplicações inteligentes. À medida que a demanda por soluções de IA de nível corporativo que ofereçam velocidade, escalabilidade e segurança aumenta, os setores estão migrando rapidamente para plataformas capazes de otimizar o processamento de dados e fornecer inteligência em todas as camadas do negócio.

No recente Oracle AI World, a Oracle fez um anúncio empolgante: um novo cluster de computação OCI Zettascale10, impulsionado por GPUs NVIDIA. Este cluster é projetado especificamente para cargas de trabalho de treinamento e inferência de IA de alto desempenho, prometendo até 16 zettaflops de desempenho máximo de computação de IA.

Destaque Técnico: O Poder do OCI Zettascale10
O cluster OCI Zettascale10 aproveitará a Ethernet NVIDIA Spectrum-X — a primeira plataforma Ethernet desenvolvida especificamente para IA. Esta tecnologia permite que os hyperscalers interconectem milhões de GPUs com eficiência e escalabilidade sem precedentes, um salto gigantesco para infraestruturas de IA.

Além do OCI Zettascale10, foram revelados outros avanços importantes, incluindo suporte adicional para microsserviços NVIDIA NIM no Oracle Database 26ai, a integração da computação acelerada da NVIDIA na nova Oracle AI Data e a disponibilidade nativa da plataforma de software NVIDIA AI Enterprise no OCI Console, entre outras novidades.

Mahesh Thiagarajan, vice-presidente executivo da Oracle Cloud Infrastructure, enfatiza a relevância da colaboração: “Acredito que o mercado de IA tenha sido definido por parcerias cruciais como a entre a Oracle e a NVIDIA. Essas parcerias fornecem multiplicadores de força que ajudam a garantir o sucesso do cliente neste espaço em rápida evolução.”

Ian Buck, vice-presidente de computação de hiperescala e alto desempenho da NVIDIA, complementa: “Por meio desta colaboração mais recente, a Oracle e a NVIDIA estão marcando novas fronteiras na computação acelerada de ponta — simplificando pipelines de IA de banco de dados, acelerando o processamento de dados, potencializando casos de uso corporativo e tornando a inferência mais fácil de implantar e escalar em OCI.”

Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina, ressalta o impacto local: “Nossa parceria de longa data com a Oracle segue desenvolvendo novas soluções para melhorar e inovar cada vez mais a IA e suas aplicações, atendendo às diversas camadas empresariais e industriais. É assim que transformamos a tecnologia em inteligência de mercado que possibilita melhores decisões e melhorias de processos, com retornos reais.”

Acelerando as Cargas de Trabalho do Banco de Dados de IA

O Banco de Dados Oracle 26ai, o carro-chefe da Oracle, está recebendo funcionalidades essenciais para acelerar cargas de trabalho de vetores de IA de alto volume, uma necessidade crescente no cenário atual.

As interfaces de programação de aplicações (APIs) do Oracle Database 26ai agora oferecem suporte à integração com o NVIDIA NeMo Retriever. Essa integração permite que desenvolvedores executem facilmente modelos de incorporação de vetores ou implementem pipelines de Geração Aumentada de Recuperação (RAG) utilizando os microsserviços NVIDIA NIM.

Microsserviços NVIDIA NIM: Otimizando Pipelines RAG
A NVIDIA oferece um conjunto completo de microsserviços NIM para cada etapa de um pipeline RAG. Isso inclui modelos de extração do NeMo Retriever para ingestão de dados multimodais em escala, modelos de incorporação do NeMo Retriever para converter blocos de dados em incorporações vetoriais, modelos de reclassificação do NeMo Retriever para aumentar a precisão das respostas e, finalmente, Modelos de Linguagem Grande (LLMs) para gerar respostas contextualmente precisas.

Um novo serviço, o Oracle Private AI Services Container, visa facilitar a implantação de serviços de IA onde quer que sejam necessários, seja em ambientes de nuvem ou locais. A primeira implementação da Oracle, que suporta execução em recursos de CPU, já está em funcionamento e foi projetada para suportar o uso futuro de GPUs NVIDIA para incorporação de vetores e geração de índices, utilizando a biblioteca de código aberto NVIDIA cuVS.

A geração de incorporação e a criação de índices de busca vetorial são duas tarefas cruciais exigidas por bancos de dados vetoriais, e a otimização dessas etapas é fundamental para o desempenho e a eficiência da IA em escala empresarial.