Melhores práticas de NLP

Algumas das melhores maneiras de configurar um modelo de NLP forte e confiável para seu bot.

⭐️ Melhores práticas para criar boas intents

Algumas dicas para criar as melhores intents:

  • Use intents que você já tem

Tem dados do cliente como FAQs? Analise-os para ver quais perguntas são mais comuns e importantes, então programe seu bot para lidar com elas. Calcule o volume de cada pergunta para priorizá-las. Não tem certeza do que os usuários precisam? Comece com um click-bot simples para coletar dados e depois use essas informações para definir as intents do seu bot.

  • Comece pequeno

Comece pequeno. Se seu bot consegue responder 5 de 15 perguntas mas cobre 80% das consultas, isso é um ótimo começo. Isso permite que sua equipe trate os 20% restantes. Adicione novas intents com base nos dados dos usuários e deixe seu bot crescer naturalmente. É melhor começar pequeno e se destacar do que fazer demais e falhar.

  • Equilibre o número de expressões por intent

É importante ter aproximadamente o mesmo número de expressões por intent para garantir que o bot não treine mais em intents com grande quantidade de expressões, ignorando as que têm menos expressões.

  • Revise e otimize

Comece com uma intent geral para acionar um fluxo básico e depois adicione perguntas de acompanhamento para entender melhor as necessidades do usuário, permitindo que você refine as intents posteriormente.

Por exemplo, em um bot de suporte de telecom:

  1. Problema com o telefone

  2. Problema com o wifi

Cada intent pode cobrir múltiplos problemas (bateria, tela, software, pedido perdido para telefones; tipos de conexão para wifi). Use perguntas de acompanhamento para especificar o problema (por exemplo, modelo do telefone, tipo de modem). Com o tempo, analise as mensagens dos usuários: se os usuários frequentemente especificam modelos de telefone mas não problemas de wifi, crie mais intents ou use entidades para telefones enquanto mantém intents de wifi mais amplas. Criar intents é um processo contínuo e iterativo.

  • Evite conflito

Quando intents são muito semelhantes, una-as para evitar confusão. Por exemplo, se você tem intents para reservar passagens de trem e ônibus, una-as em uma intent 'reservar passagens' e diferencie pelo entity de modo de transporte.

⭐️ Melhores práticas para criar boas expressões

Criar um bom conjunto de expressões é fundamental para criar um bot inteligente. A precisão do seu bot depende da qualidade das suas expressões, então certifique-se de dedicar tempo suficiente a isso, bem como revisá-las regularmente.

Aqui estão algumas dicas e truques para criar boas expressões:

  • Use expressões diversificadas em termos de vocabulário e estrutura

Para mais informações, leia nosso artigo dedicado.

  • Use dados reais

É bem provável que já existam muitas expressões de usuários que você pode alimentar ao seu bot. Pense em registros de suporte ao cliente, postagens em redes sociais, comentários no fórum da sua empresa etc.

  • Use intents pré-construídas

Não há necessidade de reinventar a roda quando você pode baixar a roda diretamente na plataforma Chatlayer! Temos muitas intents pré-construídas prontas para você usar. Basta baixá-las, treinar o NLP e pronto!

  • Seja específico

As expressões devem corresponder a uma intent específica. Para change_address, frases como Tenho uma pergunta são vagas demais. Para forgot_password, Eu esqueci é insuficientemente específico. Seja claro e preciso.

  • Evite palavras de preenchimento

Evite adicionar a expressão olá, quero reservar uma passagem de trem. Você pode me ajudar com isso? Obrigado, porque essa frase contém muitas palavras irrelevantes. Simplesmente use Quero reservar uma passagem de trem que é mais curta e mais relevante.

  • Use linguagem real

Adicione palavras e frases ao seu bot que uma pessoa real usaria nessa conversa. Não use parágrafos inteiros ou linguagem excessivamente formal. Mantenha mais leve e natural. Faça uso de mensagens reais de usuários caso você as tenha; dados são conhecimento.

  • Permita gírias e dialetos

Sinta-se à vontade para usar gírias, abreviações comuns (por exemplo, asap em vez de o mais rápido possível) e dialetos regionais. Não exagere, porém: mantenha apenas coisas que a maioria das pessoas realmente usaria.

  • Crie expressões suficientes

Para atingir desempenho ideal do bot, garanta que cada intent tenha de 40 a 50 expressões. Para um comportamento excelente, vise de 200 a 400 expressões por intent. Revise regularmente seus dados de usuários e incorpore expressões fornecidas por usuários para aprimorar continuamente a precisão do seu modelo.

  • Mantenha o número de expressões equilibrado

Garanta um número equilibrado de expressões por intent. Se uma intent tem 100 expressões e outra apenas 10, o modelo combinará mais frequentemente as mensagens dos usuários com a intent de 100 expressões, causando gatilhos excessivos. Correspondências imprecisas acontecem porque o modelo aprende melhor com a intent que tem mais dados.

  • Use ortografia correta

Garanta que cada palavra nos dados de treinamento esteja escrita corretamente. O mecanismo mapeia palavras para formatos numéricos, mas apenas para um vocabulário predefinido de 200.000 palavras. Palavras com erros ortográficos podem levar a interpretações incorretas, como pone sendo corrigido para pony ou phone. Verifique a ortografia para garantir que seu bot aprenda com precisão os significados relevantes.

  • Minúsculas vs MAIÚSCULAS

Os usuários frequentemente não usam capitalização ao conversar com um bot. No entanto, para classificação de intent, a capitalização é ignorada, então você não precisa se preocupar com isso. Mas tenha cuidado: a capitalização é relevante para extração de entidades.

  • Sem necessidade de pontuação (ou acentos)

Pontuação e acentos são ignorados pelo nosso NLP, então não se preocupe em adicioná-los. Por exemplo, élève é tratado da mesma forma que eleve.

Ordem das palavras e diversidade de expressões
⭐️ Melhores práticas para criar boas entidades

Entidades devem ser usadas apenas se o valor delas for necessário no fluxo do bot.

Ao adicionar entidades aos seus dados de treinamento, leve em conta o seguinte:

  • Pontuação

Não inclua qualquer pontuação como '.' ou '?' na sua entidade. '-' é aceitável, pois frequentemente faz parte da entidade, como em Sint-Niklaas.

  • Capitalização

Os modelos de extração de entidade não são sensíveis a maiúsculas/minúsculas. Portanto não há necessidade de adicionar tanto Brussels e brussels.

  • Palavras, não frases

Entidades são uma palavra ou um pequeno número de palavras, geralmente sintagmas nominais. Nunca marque frases completas ou expressões maiores como uma entidade. Caso os usuários frequentemente usem paráfrases em vez de uma palavra, o que acontece frequentemente com termos mais técnicos, como a caixinha que eu uso para ter internet em toda a minha casa em vez de extensor de wifi, considere não usar entidades, mas sim uma intent separada.

  • Exiba entidades nas expressões

Recomendamos adicionar pelo menos 30 expressões por entidade, para garantir a qualidade da detecção da entidade

Last updated

Was this helpful?