A tecnológica de origem portuguesa Unbabel, especialista em serviços de tradução multilingue, anuncia esta quinta-feira o TowerLLM, que apresenta como o “primeiro Large Language Model concebido, treinado e otimizado para tradução”. Treinado ao longo dos últimos meses pela companhia liderada por Vasco Pedro, o TowerLLM é hoje o “modelo de tradução de IA com melhor desempenho disponível no mercado”, assegura a Unbabel.

Para provar o statement, a Unbabel fez um conjunto de testes e concluiu que o TowerLLM está a conseguir melhor desempenho que o GPT-4, o GPT-3.5, o Google e o DeepL na tradução em várias línguas e em contextos complexos como a área médica, financeira, técnica e jurídica. Os testes também revelaram que o modelo da Unbabel “supera outros LLMs no raciocínio e na compreensão contextual”.

“O TowerLLM oferece uma qualidade de tradução superior à dos líderes de mercado de LLMs, GPT-4 e GPT-3.5, e demonstra um desempenho consistentemente superior ao Google e DeepL, uma vez que foi criado de raiz para ser multilíngue”, acrescenta a tecnológica.

Já na fase de lançamento, o modelo vai disponibilizar tradução automática em 18 pares de idiomas. Progressivamente serão acrescentadas mais línguas à oferta, que só estará disponível para empresas. A Unbabel garante que o TowerLLM melhora significativamente a precisão da tradução automática, reduzindo os erros e os custos, o que para os clientes destes serviços vai traduzir-se numa melhor relação qualidade-preço, por comparação com os LLMs mais populares, onde se destaca claro o GPT da OpenAI.

É capaz de fazer o reconhecimento de entidades nomeadas para localizar nomes, métricas e códigos (como moeda, pesos, localizações, marcas e outros). Tem capacidade para fazer correções da fonte e eliminar erros textuais de gramática e ortografia antes da tradução e para fazer a pós-edição automática da tradução, atendendo a estimativas de qualidade da IA que identificam erros específicos.

Recorde-se que a Unbabel transformou-se numa empresa de escala mundial graças à sua plataforma de tradução multilingue baseada em IA. O seu serviço permite, por exemplo, que empresas com clientes em diferentes pontos do mundo interajam com estes clientes em tempo real e na própria língua, graças à tecnologia da Unbabel.

"Apesar das dúvidas que surgiram na indústria, o TowerLLM demonstra, claramente, que os LLMs são a melhor solução para a tradução automática. Investimos anos no desenvolvimento de LLMs e, por isso, não estamos surpreendidos por ver o TowerLLM superar o GPT-4”, refere João Graça, cofundador e diretor de tecnologia da Unbabel.

O mesmo responsável acrescenta que os resultados agora obtidos são uma prova de que os grandes modelos de linguagem têm condições para ser o futuro da tradução automática.

O novo modelo da Unbabel também foi construído com base num grande conjunto de dados públicos, como acontece com os LLM da concorrência. A diferença está no facto de em seguida ter sido treinado com dados de tradução de qualidade, filtrados e selecionados pelo LLM anterior da companhia, o COMETKiwi.