Personalizando LLMs para tarefas específicas de domínio

Views: 141
0 0
Read Time:2 Minute, 54 Second

A expansão de grandes modelos de linguagem (LLMs) nos últimos tempos trouxe uma mudança revolucionária nos processos de aprendizagem de máquina e introduziu novas perspectivas sobre o potencial da IA, de acordo com Predibase.

Com base em dados de pesquisas de organizações que estão experimentando LLMs, os pesquisadores descobriram que as empresas estão procurando maneiras de personalizar e implantar LLMs de código aberto sem dar aos fornecedores comerciais acesso a dados proprietários, e estão explorando outros casos de uso além dos recursos de IA generativa .

“Agora é temporada de caça aos LLMs. Graças ao amplo reconhecimento do ChatGPT da OpenAI, as empresas estão numa corrida armamentista para obter uma vantagem competitiva usando os mais recentes recursos de IA. Ainda assim, eles exigem LLMs mais personalizados para atender a casos de uso específicos de domínio”, disse Piero Molino , CEO da Predibase.

“Este relatório destaca a necessidade de a indústria se concentrar nas oportunidades e desafios reais, em vez de seguir cegamente o hype”, acrescentou Molino.

Adoção empresarial de LLMs

Menos de um quarto das empresas sente-se confortável com a utilização de LLMs comerciais . 33% citam preocupações sobre o compartilhamento de dados confidenciais ou proprietários com fornecedores comerciais de LLM, levando a um maior interesse em alternativas de código aberto e hospedadas de forma privada.

Os LLMs de código aberto estão ganhando impulso. Quase 77% dos entrevistados não usam ou não planejam usar LLMs comerciais além dos protótipos em produção, citando preocupações com privacidade, custo e falta de personalização, levando a um aumento nas alternativas de código aberto. A Meta, por exemplo, deixou de construir LLMs de código fechado como o LLaMA-1, substituindo-o pelo LLaMA-2, disponível como código aberto e gratuito para aplicações comerciais e de pesquisa.

Embora os casos de uso de IA generativa continuem populares, as empresas veem o potencial de outras aplicações para fornecer valor comercial. A extração de informações é o segundo caso de uso mais popular (selecionado por 32,6% dos entrevistados).

Isso envolve aproveitar LLMs para converter dados não estruturados, como documentos PDF ou e-mails de clientes, em tabelas estruturadas para análises agregadas. Em seguida vieram as perguntas e respostas e a pesquisa (15,2% dos entrevistados), o cérebro dos chatbots que fornece respostas precisas e relevantes às dúvidas dos usuários em tempo real.

LLMs personalizados

As organizações estão recorrendo a LLMs personalizados para obter resultados mais precisos e personalizados. A maioria das equipes planeja personalizar seus LLMs por meio de ajustes finos (32,4%) ou reforço do aprendizado com feedback humano (27%). Os obstáculos que a equipe enfrenta com o ajuste fino continuam a ser a falta de dados (21%) e a complexidade geral do processo, como o gerenciamento da infraestrutura (46%).

“Vemos um claro potencial para melhorar os resultados de nossos esforços de conservação usando LLMs de código aberto personalizados para ajudar nossas equipes a gerar insights e aprendizados a partir de nosso grande conjunto de relatórios de projetos”, disse Dave Thau, Cientista Líder Global de Dados e Tecnologia, World Wildlife Fund.

“O truque, claro, não residirá na construção destes resultados, mas em garantir que eles produzam resultados consistentes, seguros e responsáveis. Com um desejo crescente de personalizar e implementar modelos de código aberto, as empresas precisarão investir em ferramentas operacionais e infraestruturas capazes de acompanhar o ritmo rápido da inovação na comunidade de código aberto”, concluiu Shimmin.

FONTE: HELP NET SECURITY

POSTS RELACIONADOS