Estratégias e Desafios na Seleção de Perguntas para o Chatbot ANA

Um dos maiores desafios na construção da base de perguntas e respostas para o chatbot ANA foi descobrir quais perguntas eram realmente relevantes para a população em geral. Afinal, a base construída inicialmente, composta por perguntas elaboradas pelos próprios pesquisadores, poderia não corresponder às dúvidas e anseios dos usuários finais.

Para solucionar este problema, recorremos à sessão de comentários dos vídeos do YouTube sobre COVID-19 do Dr. Drauzio Varella, que é considerado o mais popular influenciador de Saúde do Brasil atualmente. Primeiramente, baixamos todos os comentários dos vídeos relacionados à COVID-19 e selecionamos quais eram perguntas e/ou dúvidas. Com estas em mãos, foram realizadas duas etapas de tratamento. Na primeira, foi feita uma correção das perguntas que compreendeu a adequação de pontuação, padronização da escrita em caixa alta e baixa, retirada de caracteres repetidos ou espaçamento inadequado, reparação de erros de digitação, entre outros. Na segunda etapa, foi feita a pós-edição das perguntas, visando a correção gramatical e adequação da linguagem. Nessa etapa as perguntas não sofreram alteração nas palavras escolhidas, regionalismos ou estilos individuais dos espectadores dos vídeos, uma vez que essas diferenças são muito importantes para o treinamento do chatbot. Com as perguntas devidamente corrigidas, nós as dividimos de acordo com os temas do chatbot: Diagnóstico do Coronavírus, Informações gerais, Informação sobre transmissão, Sintomas, Orientações para pacientes com suspeita da doença, Tratamento, Cuidados em Casa, Higiene das mãos e superfícies, Comportamento e hábitos de vida, Uso da máscara, Gravidez, e Animais domésticos. Os temas Sintomas, Orientações para pacientes com suspeita da doença, Informação sobre transmissão, Comportamento e hábitos de vida e Tratamento foram os que apresentaram um maior número de perguntas, e também uma maior variação em seu conteúdo. Em seguida, as perguntas foram classificadas entre respondidas e não respondidas pela ANA. As perguntas não respondidas ou respondidas de forma parcial foram filtradas e submetidas à equipe da Medicina para a elaboração de respostas, enquanto as perguntas já respondidas passaram para a fase de seleção das perguntas de treinamento do chatbot, realizada pela equipe da Letras.

Um esquema desse processo pode ser verificado na figura a seguir:

Fonte: elaborado pelos autores

No próximo post explicaremos sobre o que se trata a etapa de Treinamento do chatbot ANA (já vamos adiantar que envolve Inteligência Artificial). Não perca!

Achou interessante? Quer saber como funciona e se a ANA pode te ajudar? Para interagir com a ANA, clique aqui e veja o widget no canto inferior direito da tela.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *