Na quinta-feira, a Unconventional AI, uma empresa liderada pelo ex-chefe de IA da Databricks, Naveen Rao, demonstrou seu modelo inaugural, Un-0, um sistema de geração de imagens que executa em uma versão simulada da arquitetura de computador baseada em oscilador da empresa. O lançamento marca a primeira prova de conceito pública de que essa arquitetura de hardware não convencional pode reproduzir o desempenho dos modelos de difusão de ponta, como o Stable Diffusion e as ferramentas de geração de imagens da OpenAI.
Rao, que deixou a Databricks no início deste ano, argumenta que a demanda incessante da indústria por inferência de IA está atingindo um teto de energia duro. "A escalabilidade de IA é difícil devido à energia", disse ele à TechCrunch. "Será o limite fundamental nos próximos anos." Ao repensar o substrato de computação subjacente, a Unconventional AI visa reduzir a energia necessária para a inferência em até 1.000 vezes.
O modelo Un-0 não foi treinado em um chip físico; em vez disso, a equipe de Rao executou uma simulação de software completa da arquitetura baseada em oscilador. Apesar da falta de hardware, o modelo gerou imagens que eram indistinguíveis em qualidade daquelas produzidas por modelos de difusão convencionais. O artigo de pesquisa acompanhante detalha como a equipe traduziu as operações matemáticas de um modelo de difusão para o domínio oscilatório, preservando a fidelidade enquanto aproveitava a eficiência energética intrínseca da arquitetura.
A computação baseada em oscilador diverge fortemente dos designs centrados em transistores que dominam os processadores atuais. Em vez de confiar na commutação binária, a abordagem usa sinais oscilantes contínuos para codificar e manipular dados. Rao acredita que esse método pode executar as multiplicações de matrizes no coração da inferência de IA com muito menos transições de voltagem, a principal fonte de perda de energia em chips digitais. As economias teóricas, afirma ele, se traduzem em uma redução de 1.000 vezes no consumo de energia por inferência.
A estratégia da Unconventional AI prevê a mudança da simulação para o silício dentro do próximo ano. A empresa planeja publicar esquemas para um chip físico baseado em oscilador, então construir uma pilha de inferência de ponta a ponta que possa ser integrada aos fluxos de trabalho de IA existentes. "Construiremos um novo tipo de sistema composto por nossos chips", disse Rao. "Executaremos modelos de IA lá e teremos um cabo de rede onde as solicitações entram e as inferências saem, mas será feito com 1/1000 de energia."
Embora a empresa atualmente empregue menos de 50 funcionários, sua ambição está alinhada com um consenso crescente de que os custos de energia podem se tornar um gargalo para a expansão contínua da IA. Analistas da indústria observam que as contas de eletricidade dos data centers já representam uma parcela significativa dos gastos operacionais de IA e as projeções sugerem que a demanda de energia pode superar a oferta se as tendências atuais persistirem.
Críticos alertam que mudar de um modelo de software para um chip fabricável apresenta desafios de engenharia significativos. Circuitos osciladores devem manter um tempo preciso sob condições de temperatura e voltagem variáveis, um obstáculo que os designs de silício tradicionais refinaram ao longo de décadas. No entanto, Rao permanece confiante. "Ao longo do próximo ano, você começará a ver algumas notícias interessantes sobre isso", disse ele aos repórteres.
Se a Unconventional AI tiver sucesso, as implicações podem se espalhar por provedores de nuvem, empresas e dispositivos de borda que dependem da inferência de IA. Uma redução de 1.000 vezes no poder reduziria os custos operacionais, diminuiria as pegadas de carbono e potencialmente democratizaria o acesso a modelos avançados para organizações sem orçamentos de computação maciços.
O próximo marco da empresa é a fabricação de um chip físico baseado em oscilador, seguido por benchmarks que comparam o uso de energia real contra GPUs e TPUs convencionais. Até lá, o Un-0 serve como uma demonstração de "hello world" - um vislumbre de um futuro onde a IA é executada em hardware projetado do zero para eficiência, em vez de adaptar processadores existentes.
Este artigo foi escrito com a assistência de IA.
News Factory APP - notícias agênticas para impulsionar seu SEO e AEO.