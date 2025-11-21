247 - A Huawei apresentou uma nova plataforma de código aberto voltada para otimizar o uso de processadores dedicados à inteligência artificial. A iniciativa, anunciada durante um evento da empresa em Xangai, integra o esforço chinês para ampliar sua autonomia tecnológica em meio às restrições de acesso aos chips mais avançados do mercado.

De acordo com o South China Morning Post, a empresa afirmou que o software, batizado Flex:ai, pode elevar em cerca de 30% a taxa de utilização de chips de IA, ao permitir o gerenciamento inteligente de diferentes tipos de aceleradores. A ferramenta será disponibilizada por meio da comunidade ModelEngine, da própria Huawei.

Construída sobre a plataforma aberta Kubernetes, a solução funciona como um sistema de orquestração capaz de integrar GPUs, NPUs e outros aceleradores produzidos por diferentes fabricantes. Entre as funções apresentadas, o Flex:ai permite dividir uma única placa em múltiplas unidades virtualizadas, o que possibilita a execução simultânea de várias cargas de trabalho de IA.

Segundo a Huawei, o software conta ainda com um escalonador inteligente, o Hi Scheduler, responsável por distribuir tarefas e realocar recursos ociosos entre nós distintos para acelerar processos de treinamento e inferência.

Zhou Yuefeng, vice-presidente e chefe da divisão de armazenamento de dados da companhia, explicou que a ferramenta responde a uma demanda crescente por eficiência em grandes clusters de processamento. “Tarefas menores raramente utilizam toda a capacidade de uma placa, enquanto as maiores não podem ser processadas por apenas uma”, afirmou. Para ele, o desafio de levar modelos de IA ao uso prático exige soluções abertas e colaborativas: “Fazer a IA funcionar em cenários reais é difícil. Os engenheiros da Huawei não conseguem fazer isso sozinhos”.

A nova solução foi desenvolvida em parceria com pesquisadores da Universidade Jiaotong de Xangai, da Universidade Jiaotong de Xi’an e da Universidade de Xiamen. Ela chega em um momento de forte investimento de empresas chinesas em otimização de software para compensar limitações no fornecimento de chips de última geração, ao mesmo tempo em que cresce a escala dos clusters utilizados em projetos de IA.

A proposta da Huawei guarda semelhanças com ferramentas desenvolvidas pela israelense Run:AI, adquirida pela Nvidia em 2024, que também gerenciam cargas de trabalho distribuídas em grandes fazendas de GPUs.

Em outra frente, a empresa chinesa já havia apresentado, em agosto, o Unified Cache Manager (UCM), software projetado para agilizar processos de inferência ao organizar dados em diferentes camadas de memória conforme a necessidade de latência. A tecnologia busca reduzir a dependência de componentes de alta largura de banda importados, reforçando a estratégia de autonomia no ecossistema de IA.