Inteligência Artificial

DeepSeek revela novo método de raciocínio para IA

A nova abordagem veio de uma parceria entre a Universidade de Tsinghua e a DeepSeek; chamado de modelagem de recompensa generativa (GRM), trouxe avanços e ultraou modelos existentes

Ramana Rech
Ramana Rech

Redatora

Publicado em 7 de abril de 2025 às 15h51.

Última atualização em 7 de abril de 2025 às 16h37.

Tudo sobreInteligência artificial
Saiba mais

A DeepSeek está pesquisando um novo método para aprimorar a capacidade de raciocínio de grandes modelos de linguagem (LLMs). A companhia publicou em parceria com a Universidade de Tsinghua um artigo que explora a abordagem conhecida como modelagem de recompensa generativa (GRM) e ajuste por “crítica auto-orientada” (do inglês, Self-Principled Critique Tuning - SPCT).

De acordo com o artigo publicado no arXiv na última quinta-feira, 3, o uso de SPTC melhorou de forma significativa a qualidade e a escalabilidade de GRMs, “ultraando métodos e modelos existentes em vários benchmarks de RM (modelamento de recompensa)”. Esse tipo de sistema guia o LLM em direção a preferências humanas, explica o South China Morning Post.

Entretanto, o artigo ressalta que o DeepSeek-GRM ainda tem desafios ao realizar algumas tarefas, que os pesquisadores acreditam que possam ser resolvidos com sistemas de recompensa generalistas.

O artigo diz que o modelo será lançado em código aberto, mas não forneceu uma data. A pesquisa foi publicada em meio a expectativas para o lançamento do próximo modelo de linguagem da DeepSeek, o R2.

A Reuters reportou no fim de fevereiro que a startup está acelerando esforços para adiantar o lançamento do R2, inicialmente previsto para maio, com o intuito de manter a vantagem conquistada com o antecessor R1. Mas não foram divulgados mais detalhes sobre a linha do tempo da empresa. A DeepSeek espera que o novo modelo seja capaz de produzir melhor codificação e raciocinar em outros idiomas para além do inglês.

Acompanhe tudo sobre:Inteligência artificialDeepSeek

Mais de Inteligência Artificial

Wikipedia suspende teste com IA que gerava resumos automáticos após reação dos editores

Adobe projeta lucros acima do esperado, mas encara desafios na era da IA

Startup de nuvem Crusoe investe US$ 400 milhões em chips da AMD para novo data center de IA nos EUA

Cuidado ao usar o Meta AI: botão de compartilhar pode expor conversas privadas dos usuários