Arrancam no início de junho os primeiros testes de um projeto europeu que quer contribuir para devolver à região capacidade para ter uma palavra a dizer no mundo das pesquisas online, fora do domínio da Google e das grandes tecnológicas americanas.

O OpenWebSearch.eu está a criar um índice público que vai poder ser usado por empresas e outras instituições como base para serviços de pesquisa e treino de modelos de inteligência artificial, reduzindo a dependência das tecnologias da Google ou da Microsoft (Bing), que otimizaram os seus motores de busca para maximizar resultados comerciais com publicidade online.

O Open Web Index pretende sobretudo dar um contributo para acelerar projetos que possam crescer à margem deste ciclo, disponibilizando uma biblioteca digital onde os motores de busca podem ir buscar ficheiros e páginas Web e indexar informação, sem ficarem dependentes de ferramentas proprietárias.

Google volta a tribunal e enfrenta batalha judicial que pode levar à venda do Chrome
Google volta a tribunal e enfrenta batalha judicial que pode levar à venda do Chrome
Ver artigo

As críticas ao poder da Google nesta área são antigas e reforçadas com a introdução da inteligência artificial generativa no motor de pesquisa da empresa, que estará a concentrar ainda mais na tecnológica o controlo do tráfego gerado com essa atividade. Criar alternativas que forneçam aos negócios locais uma base para poderem criar e escalar serviços pode ser a única forma de crescer sem depender da Google, como sustentam alguns dos promotores.

Esta será também uma forma de responder a outra crítica feita aos motores de pesquisa americanos, que tende a ganhar mais relevância à medida que a IA generativa ganhar expressão nesses produtos. Os resultados da pesquisa tendem a ser mais assertivos em inglês, porque é essa a língua de base para o treino dos modelos de IA que a suportam. Os projetos europeus que assentarem na tecnologia vão ter uma base mais capaz de refletir a multiculturalidade europeia e as várias línguas da região.

Numa primeira fase, o Open Web Index vai dar acesso a 1 petabyte de informação, mas o objetivo é avançar até aos 5 petabytes e no futuro escalar para 10 petabytes. Note-se que o licenciamento de tecnologia é hoje uma parte importante do negócio dos principais motores de pesquisa do mercado, através do qual dão precisamente acesso a este tipo de informação a companhias que desenvolvem produtos de pesquisa, mas não têm meios nem capacidade financeira para criarem esta base indispensável para esse tipo de produtos.

O projeto europeu está apoiado num consórcio com 14 membros, onde cabem empresas de tecnologia, centros de investigação, universidades e o CERN. Numa primeira fase o objetivo é criar o Indice público numa segunda fase uma infraestrutura de suporte, como é explicado no vídeo.

O Open Web Index vai ficar à disposição de pequenas e médias empresas da região, que vão poder usá-lo para criar motores de busca, grandes modelos de linguagem ou outras aplicações sem uma orientação à partida para a venda de publicidade. O arranque dos primeiros testes está marcado para 6 de junho, data do evento de lançamento, uma iniciativa online.