Nova abordagem amplia criatividade nos LLMs

​Pesquisadores da Midjourney, em parceria com a Universidade de Nova York, desenvolveram uma abordagem inovadora para ampliar a diversidade criativa de textos gerados por modelos de linguagem de grande porte (LLMs). Essa técnica introduz “métricas de desvio” no processo de treinamento, permitindo que os modelos produzam conteúdos mais variados sem comprometer significativamente a qualidade.

Entendendo as Métricas de Desvio

As métricas de desvio medem a diferença entre os textos gerados para um mesmo prompt, utilizando embeddings textuais e calculando a distância cosseno entre eles. Essa abordagem matemática permite quantificar a variação nos conteúdos produzidos, incentivando o modelo a explorar diferentes narrativas e estilos.

Resultados Promissores nos Testes Iniciais

Nos testes preliminares, modelos treinados com essa nova metodologia apresentaram um aumento de 23% na diversidade dos textos gerados, com uma redução de apenas 5% na qualidade, conforme avaliado pelo sistema de recompensas do Reddit. Por exemplo, ao receber o prompt “Por que você está tremendo, meu amor? Você é rei agora”, o modelo padrão GPT-4o tendia a criar histórias sobre novos reis nervosos. Em contraste, o modelo modificado Llama-3.1-8B produziu narrativas que variavam de contos de fantasia sombria sobre príncipes ursos a histórias sobrenaturais ambientadas no fundo do mar.

Diversidade Semântica e Estilística

Os pesquisadores focaram em dois tipos principais de diversidade:​

  • Semântica: Diferenças no conteúdo e enredo das histórias.​
  • Estilística: Variações no estilo de escrita, simulando diferentes autores.​

Eles desenvolveram versões específicas para cada tipo, mas descobriram que a combinação de ambas produzia os melhores resultados.

Aplicações e Limitações

A técnica mostrou-se eficaz em tarefas de escrita criativa, onde modelos anteriores frequentemente produziam respostas repetitivas. No entanto, ainda não foi testada em outros contextos, como documentação técnica ou resumos, que podem exigir abordagens diferentes. Além disso, a avaliação da qualidade baseada em upvotes do Reddit pode não capturar aspectos como precisão técnica e consistência, sugerindo a necessidade de métodos de avaliação mais abrangentes.

Conclusão

A introdução de métricas de desvio no treinamento de LLMs representa um avanço significativo na geração de textos mais diversos e criativos. Essa abordagem oferece uma solução promissora para superar limitações anteriores, incentivando a exploração de narrativas variadas sem comprometer a qualidade do conteúdo.​

Para empresas que buscam soluções personalizadas em inteligência artificial, a C4 Lab é especializada em oferecer treinamentos e workshops corporativos, além de desenvolver agentes de IA adaptados às necessidades específicas do seu negócio. Entre em contato com um de nossos especialistas para saber mais.​

Fonte: The-Decoder