William Chen e Guan Wang, ex-alunos do ensino médio, desenvolveram um modelo de IA que supera grandes sistemas de inteligência artificial.
William Chen e Guan Wang recusaram uma oferta multimilionária de Elon Musk para desenvolver um modelo de IA inovador.
Recusa de uma proposta milionária de Elon Musk
William Chen e Guan Wang, dois jovens de 22 anos que se conheceram no ensino médio em Michigan, recusaram uma oferta multimilionária de Elon Musk para desenvolver uma inteligência artificial (IA) baseada no cérebro humano, conhecida como Sapient Intelligence. O modelo deles, que superou sistemas renomados como OpenAI e Anthropic em testes de raciocínio, foi uma escolha ousada, considerando a magnitude da oferta. O que levou esses jovens a optar por um caminho tão arriscado?
O surgimento do OpenChat
A história começou quando os amigos, com suas habilidades complementares, construíram um modelo de linguagem pequeno, mas altamente eficiente, chamado OpenChat. Ao contrário da maioria das IAs que dependem de grandes volumes de dados da internet, eles treinaram seu modelo com um conjunto cuidadosamente selecionado de conversas de alta qualidade, utilizando aprendizado por reforço. Essa abordagem inovadora fez com que o OpenChat rapidamente se tornasse um sucesso em círculos acadêmicos, atraindo a atenção de instituições como Berkeley e Stanford.
A proposta de Musk
A fama do OpenChat levou à proposta de Musk, que queria recrutar os jovens para sua nova empresa, xAI. Apesar da tentadora oferta, Chen e Wang decidiram que desejavam algo mais ambicioso: criar uma nova arquitetura de IA que superasse as limitações dos modelos de linguagem tradicionais. Em vez de aceitar a proposta, decidiram seguir em frente com uma abordagem mais inovadora.
Desenvolvimento da Sapient Intelligence
A Sapient Intelligence agora é o resultado dessa decisão. O modelo desenvolvido por Chen e Wang, chamado Hierarchical Reasoning Model (HRM), é projetado para superar as limitações dos transformadores, que são a base da maioria das IAs atuais. Em um teste realizado em junho, o protótipo do HRM demonstrou um desempenho excepcional em tarefas complexas de raciocínio, superando modelos de grandes empresas em desafios como Sudoku-Extreme e mazes de 30×30.
Uma nova abordagem para a inteligência artificial
O HRM utiliza uma estrutura de raciocínio hierárquico, que se assemelha ao funcionamento do cérebro humano, permitindo que a IA não apenas preveja palavras, mas também raciocine de maneira lógica e profunda. Essa inovação é vista como um passo crucial em direção à criação de uma IA geral, um objetivo que Chen e Wang acreditam que pode ser alcançado na próxima década.
O futuro da IA
Com planos de expandir para os Estados Unidos e continuar o desenvolvimento de sua tecnologia, a Sapient está se preparando para lançar a segunda versão de seu modelo. A visão de Chen e Wang é clara: eles querem garantir que, se não forem os primeiros a desenvolver uma IA que supera a inteligência humana, outra equipe o fará. Essa determinação reflete não apenas uma ambição pessoal, mas também um compromisso com o futuro da inteligência artificial.
O trabalho deles é um exemplo claro de como a inovação e a determinação podem desafiar gigantes da tecnologia, e como a juventude pode, de fato, desempenhar um papel fundamental na moldagem do futuro da tecnologia.