OpenAI treinou o novo CriticGPT com aprendizado por reforço para identificar possíveis erros e dar feedback humano.
A OpenAI desenvolveu recentemente uma nova ferramenta, o CriticGPT, que é uma variação do GPT-4 e tem como objetivo encontrar erros em respostas produzidas pelo ChatGPT. Segundo a empresa, ao utilizar o CriticGPT para revisar as saídas geradas pelo ChatGPT, os usuários conseguem resolver 60% dos problemas sem necessidade de auxílio adicional. A série de modelos GPT-4 que alimenta o ChatGPT é aprimorada por meio do ‘aprendizado de reforço a partir do feedback humano’ (RLHF), no qual a plataforma melhora sua performance conforme os treinadores de inteligência artificial classificam as respostas do ChatGPT e identificam possíveis falhas.
O CriticGPT se mostra como uma valiosa ferramenta para aprimorar a qualidade das respostas geradas pelo ChatGPT, contribuindo significativamente para a correção de possíveis erros. A integração do CriticGPT no processo de revisão não apenas aumenta a eficiência, mas também demonstra como a combinação de diferentes modelos de IA pode resultar em soluções mais precisas e confiáveis para os usuários. A abordagem de RLHF adotada pela OpenAI destaca a importância do feedback humano na evolução contínua das tecnologias de processamento de linguagem natural.
CriticGPT: A Ferramenta de Correção de Erros
À medida que o ChatGPT avança em seu aprendizado, é natural que seus erros se tornem mais refinados e específicos, o que pode dificultar a detecção de imprecisões pelos treinadores de IA. É aqui que o CriticGPT entra em ação. A empresa planeja integrar modelos semelhantes ao CriticGPT ao processo de RLHF, visando fortalecer os feedbacks humanos com o suporte dos feedbacks da IA. Embora as sugestões do CriticGPT não sejam infalíveis, elas podem auxiliar os treinadores de IA a identificar problemas que poderiam passar despercebidos.
O CriticGPT, assim como o próprio modelo GPT-4, evolui à medida que mais usuários utilizam a ferramenta e fornecem feedbacks. Um exemplo claro da atuação do CriticGPT é sua capacidade de apontar possíveis erros do ChatGPT, conforme divulgado pela OpenAI. Os testes entre os dois modelos revelaram que as correções feitas pelo CriticGPT foram consideradas superiores às do ChatGPT em 63% das vezes. Além disso, a nova ferramenta demonstrou menos alucinações, situações em que a IA cria informações falsas e as apresenta como verdadeiras.
No entanto, o CriticGPT ainda apresenta algumas limitações e só pode oferecer auxílio até certo ponto de especialização. Em casos de tarefas ou respostas extremamente complexas, mesmo um especialista com o suporte de um modelo pode não conseguir avaliá-las corretamente. A constante evolução do CriticGPT destaca sua importância como uma ferramenta de correção de erros no universo da inteligência artificial.
Fonte: © CNN Brasil
Comentários sobre este artigo