Engenheiros da BitEnergy AI, uma empresa inovadora em inteligência artificial, desenvolveram uma técnica que promete diminuir em até 95% a necessidade energética das aplicações de IA. Detalhes sobre este método foram publicados recentemente na plataforma arXiv.
À medida que a inteligência artificial se torna cada vez mais presente em nossas vidas, a preocupação com o consumo energético associado a essas tecnologias tem se intensificado. Por exemplo, o ChatGPT consome aproximadamente 564 MWh por dia, o que é suficiente para abastecer cerca de 18.000 residências nos Estados Unidos. Especialistas estimam que, se as tendências atuais continuarem, o consumo anual de energia das aplicações de IA poderá alcançar até 100 TWh nos próximos anos, comparável ao consumo das operações de mineração de Bitcoin.
Técnica inovadora para otimizar o consumo
A equipe da BitEnergy AI acredita ter encontrado uma solução eficaz para reduzir a carga computacional requerida por aplicações de IA, sem comprometer seu desempenho. A abordagem consiste em substituir a complexa multiplicação em ponto flutuante (FPM) por operações de adição inteira, que são menos exigentes em termos de energia. Embora a FPM seja necessária para processar números grandes com precisão, sua utilização é uma das partes mais intensivas em recursos do processamento de IA.
A técnica foi nomeada Multiplicação de Complexidade Linear, que aproxima os resultados da FPM através do uso de adições inteiras. Resultados preliminares indicam que essa nova abordagem pode reduzir drasticamente a demanda energética, potencialmente em até 95%.
Desafios na implementação
Um dos principais desafios para a adoção dessa técnica é a necessidade de hardware específico, que difere do atualmente utilizado. No entanto, a equipe de pesquisa já projetou e testou esse novo tipo de hardware. A incerteza persiste sobre como esse novo equipamento será licenciado, especialmente considerando o papel proeminente da Nvidia no fornecimento de GPUs para IA. A resposta da empresa a essa nova tecnologia pode impactar significativamente a velocidade de adoção do método, caso as reivindicações dos pesquisadores sejam confirmadas.