A Anthropic atualizou a versão mais recente do seu modelo de linguagem de inteligência artificial generativa, para passar a suportar agentes capazes de realizarem tarefas complexas em computadores, como um humano faria. O agente é capaz de interpretar a informação no ecrã e desenvolver diferentes ações para responder a um pedido, como preencher um formulário, por exemplo. É capaz de selecionar opções, procurar informação na internet, ou noutras fontes no computador, digitar texto e reunir diferentes dados identificados pela sua própria pesquisa.

A ferramenta já está em beta pública para programadores. O plano é que nos próximos meses chegue a consumidores e clientes empresariais, integrada em aplicações para diferentes fins. Entre os exemplos apontados pela startup que desenvolveu o chatbot Claude, estão aplicações para reserva de voos, pesquisas online, preenchimento de formulários e relatórios de despesas, ou agendamento de compromissos.

“Queremos que o Claude ajude as pessoas em todo o tipo de tarefas e acreditamos que formato do chatbot é muito limitado para isso porque podemos perguntar-lhe algo, receber informação de contexto, mas fica por aí”, disse Jared Kaplan,  Chief Science Officer, em entrevista à CNBC. Na nota de lançamento, a empresa frisa no entanto que esta ainda é uma versão de testes, disponibilizada já a programadores para recolha de feedback, e como tal mais susceptível por isso a erros que uma versão final.

Anthropic mostra as novas capacidades de utilização do PC do Claude

A startup garante também que o Claude foi treinado para manter algumas barreiras à utilização deste novo recurso com “medidas para monitorizar quando é convidado a participar em atividades relacionadas com as eleições, bem como sistemas para o afastar de atividades como gerar e publicar conteúdos nas redes sociais, registar domínios Web ou interagir com sites públicos”.

O Claude compete diretamente com o ChatGPT da OpenAI e com o Copilot da Microsoft, que recorre à mesma tecnologia e que ainda esta segunda-feira apresentou também um pacote de agentes autónomos para agilizar diferentes tipos de tarefas. Foi lançado em março de 2023 e a apoiar a empresa também há investidores de peso, como a Amazon, a Google ou a Salesforce.

Anthropic benchmarks
Anthropic benchmarks créditos: Anthropic

A novidade agora lançada está integrada numa versão melhorada do Claude 3.5 Sonnet AI, o LLM lançado no verão, que a empresa garante ter conseguido melhorias significativas nos principais benchmarks da indústria e mostra alguns resultados.

Os agentes de IA que já começaram a surgir noutras plataformas também, prometem ser a próxima grande tendência de evolução dos LLMs, em linha com os avanços para capacidades multimodais, que continuam a ser aperfeiçoados. A principal característica destes agentes é o facto de serem programados para conseguir realizar sequências de tarefas, interagindo com diferentes pontos, serviços ou aplicações, com ganhos significativos para a produtividade, já que podem realizar diferentes passos para cumprir a tarefa.