Karpathy lança autoresearch, o laboratório de AI que roda 100 experimentos enquanto você dorme
Andrej Karpathy publicou no GitHub o autoresearch, um repositório open-source com apenas 630 linhas de código que permite a agentes de AI rodar e iterar experimentos de treinamento de LLMs de forma autônoma em uma única GPU. O agente modifica o código de treino, executa sprints fixos de 5 minutos, verifica se o resultado melhorou e repete o ciclo chegando a cerca de 100 experimentos em uma única noite. O CEO da Shopify, Tobi Lutke, já adaptou o projeto internamente e reportou uma melhoria de 19% nos scores de validação usando o framework.
Anthropic lança tarefas agendadas no Claude Code para automação contínua
A Anthropic lançou suporte a tarefas agendadas no Claude Code, permitindo que o agente execute prompts recorrentes de forma autônoma como monitorar builds, verificar logs de erro e abrir PRs automaticamente em cadências definidas. A funcionalidade utiliza expressões cron padrão e está disponível via comando /schedule no app desktop Cowork, com suporte a até 50 tarefas por sessão. O recurso está disponível para assinantes dos planos Pro, Max, Team e Enterprise.
Luma lança Uni-1, primeiro modelo a unir raciocínio e geração de imagens numa única arquitetura
A Luma AI apresentou o Uni-1, seu primeiro modelo unificado de compreensão e geração, construído sobre um transformer autoregressivo que processa linguagem e imagens no mesmo pipeline. O modelo é capaz de raciocinar sobre prompts durante a geração, decompondo instruções complexas e planejando cenas e alcançou resultados de ponta no RISEBench, benchmark de edição visual baseada em raciocínio. A Luma posiciona o Uni-1 como base para uma nova geração de agentes criativos que cobrem texto, imagem, vídeo e áudio de forma integrada.
Diretora de robótica da OpenAI pede demissão em protesto ao acordo com o Pentágono
Caitlin Kalinowski, que liderava a equipe de hardware e robótica da OpenAI desde novembro de 2024, anunciou sua saída após o acordo da empresa com o Departamento de Defesa dos EUA, afirmando que "vigilância de americanos sem supervisão judicial e autonomia letal sem autorização humana são linhas que mereciam mais deliberação". Em post público, ela destacou que a decisão foi "sobre princípio, não sobre pessoas", e que o problema era a velocidade do anúncio sem garantias de governança definidas. A saída é considerada a primeira demissão de alto perfil por razões de princípio ligadas ao acordo que veio após a Anthropic recusar termos que levariam ao uso de AI em vigilância em massa.
Claude Opus encontra 22 falhas de segurança no Firefox em apenas duas semanas
Em parceria com a Mozilla, a Anthropic utilizou o Claude Opus 4.6 para varrer o código-fonte do Firefox durante duas semanas, identificando 22 vulnerabilidades inéditas sendo 14 classificadas como de alta severidade, representando quase um quinto de todas as falhas graves corrigidas no browser ao longo de 2025. O modelo detectou o primeiro bug em apenas 20 minutos de exploração, e os patches já foram distribuídos para centenas de milhões de usuários no Firefox 148. Apesar de Claude ter tentado criar exploits para as vulnerabilidades encontradas, conseguiu desenvolver apenas dois ataques funcionais em centenas de tentativas e somente em ambiente de teste com as proteções do sandbox removidas.
Fontes:
- https://x.com/karpathy/status/2030371219518931079
- https://code.claude.com/docs/en/scheduled-tasks
- https://lumalabs.ai/uni-1
- https://x.com/kalinowski007/status/2030320074121478618
- https://www.anthropic.com/news/mozilla-firefox-security
