Por Manuel Dias (*)
Em 2023, a Inteligência Artificial (IA) Generativa saiu do laboratório e trouxe-nos inovações inesperadas, que despertaram a curiosidade do mundo e desafiaram aquilo que até então sabíamos sobre IA. O chatGPT, lançado no final de 2022, foi o primeiro exemplo, atingiu 100 milhões de pessoas em apenas dois meses, mas houve muitos outros desenvolvimentos durante 2023. Além da Open AI, várias startups como a Stability AI, a Midjourney, a Anthropic, entre outras, viram a sua valorização multiplicar-se durante o último ano.
A nível empresarial, 2023 foi um ano com um ritmo de inovação espantoso. Na Europa, mais de 2/3 das empresas já usam soluções de IA no seu core business, e em 2024 mais 21% irá fazê-lo também. Mas o potencial da IA Generativa só está a começar. A primeira metade de 2023 foi fundamentalmente focada na exploração de uses cases de negócio, de forma transversal a várias industrias. Em Portugal tivemos vários exemplos: no Ministério da Justiça foi criada uma solução baseada em chatGPT para serviço ao cidadão, a Agência da Modernização Administrativa criou um avatar com IA Generativa para apoiar os cidadão no uso da chave móvel digital, no sector privado, a Helena, o chatbot com IA Generativa disponibilizado pelos CTT para atendimento ao cliente, e a Talkdesk que passou a integrar os serviços de Azure Open AI no seu CRM.
Em 2024 espera-se uma democratização na utilização de IA Generativa, seja em termos individuais com tecnologias como o Microsoft Copilot, em que estes modelos estão totalmente integrados nas ferramentas que usamos diariamente, como o Excel ou o PowerPoint, seja em termos empresarias, com uma expansão dos uses cases a soluções end-to-end mais sofisticadas, que permitirão passar dos chatbots que vimos surgir em 2023, para aplicações mais inteligentes, hiperpersonalizadas e com uma capacidade de interação muito mais intuitiva e contextualizada, que passará apenas do texto, para a imagem, voz e vídeo.
Este artigo aborda algumas das principais tendências para 2024 na área da IA Generativa, com uma perspetiva prática da utilização da tecnologia e do impacto que daí advém para as empresas e para todos nós enquanto utilizadores. Hoje mais do que nunca, as organizações precisam de recursos especializados, ferramentas mais abrangentes e novas competências para criar a próxima onda de aplicações inteligentes baseados em IA Generativa.
1. A democratização e sofisticação da IA Generativa
Depois da aceleração, a democratização. De acordo com estimativas da Gartner, mais de 80% das empresas terão modelos de IA Generativa em produção até 2026, um salto quântico, uma vez que no início de 2023 o mesmo índice estava abaixo de 5%.
A democratização dever-se-á largamente à acessibilidade aos diversos LLMs, através de serviços Cloud, que disponibilizam infraestruturas de GPUs escaláveis, um fator critico para o deployment destas soluções de computação intensiva, e através da disponibilização dos próprios LLMs, já pre-treinados, como um serviço (Model-as-a-Service), prontos a ser integrados em aplicações e processos de negócio mais complexos.
Por último, também a disponibilização de LLMs em modelo open-source será um fator de democratização, especialmente em cenários especializados ou menos exigentes em termos de precisão dos modelos. Exemplos como a Llama 2 da Meta, o Phi2 da Microsoft e outras centenas de modelos open-source disponíveis na Hugging Face permitem hoje antever esta tendência.
2. IA Generativa multimodal, onde a voz, a imagem e o vídeo serão “reis”
Apesar da inovação dos modelos fundacionais durante 2023, a nova onda da IA Generativa permitirá realizar atividades muito mais complexas que se caraterizarão pela multimodalidade, ou seja, pela capacidade de compreender, processar e gerar vários tipos de informação, incluindo texto, voz, imagem, vídeo, entre outras. Estas capacidades avançadas abrem oportunidades mais criativas e experiências mais abrangentes, em que a IA vai obter uma melhor perceção do mundo, tal como nós o conhecemos.
Esta tendência já arrancou em 2023, com a inclusão do modelo do DALLE-3 da Open AI no Bing Chat, permitindo a análise e geração de imagens, seguido da componente de voz, e mais recentemente a inclusão da visão nos modelos GPT-4 da Open AI, nomeadamente o GPT-4 Turbo with Vision. A mesma tendência foi seguida com o recente lançamento da Google do seu modelo multimodal Gemini, capaz de processar imagem e vídeo.
A interação multimodal vai revolucionar a forma como interagimos com os computadores, e será um pilar fundamental para o desenvolvimento de novas aplicações inteligentes, que não só nos entenderão melhor e mais naturalmente mas sobretudo irão ampliar as nossas capacidades.
3. A era dos Copilotos e o impacto no novo mundo do trabalho
Outra tendência dominante para 2024 envolve a utilização de IA Generativa em assistentes virtuais que nos ajudam a fazer parte das tarefas do dia-a-dia, agilizar processos, aumentar a eficiência e a produtividade. Um estudo recente da Microsoft sobre o futuro do trabalho, conclui que passamos 57% do nosso tempo em tarefas administrativas, como a gestão de emails, videoconferências, chats, e apenas 43% em tarefas criativas.
O conceito do Copiloto, que a Microsoft anunciou durante 2023 e que passados 9 meses se concretizou na inclusão de um assistente pessoal – o Microsoft Copilot - nas ferramentas que todos usamos, como o PowerPoint, o Excel ou o Teams -, recorre à IA Generativa (em particular aos modelos GPT-4 e DALLE-3) e aplica-a ao nosso domínio específico de informação empresarial, como documentos, emails, gravações de reuniões, entre muitos outros. O Copilot representa a nova interface homem-máquina para o conhecimento que reside nas organizações e que nos ajudará a atuar com base nesse conhecimento.
O ano de 2024 será sem dúvida o ano em que o florescimento de modelos especializados, sejam embebidos em ferramentas de produtividade ou em aplicações de negócio, terão um impacto direto na produtividade e satisfação de todos nós, mas também na forma como iremos fazer negócios no futuro.
4. O poder surpreendente dos Small Language Models (SLMs)
Os LLMs como o GPT-4 da Open AI, o PaLm 2 da Google, ou o Claude da Anthropic, têm demonstrado uma notável capacidade de raciocinar, respondendo a perguntas complexas, e até mesmo resolvendo problemas que exigem raciocínio em várias etapas, capacidades que antes eram consideradas fora do alcance da IA. O desafio consiste em saber se tais habilidades emergentes poderão ser alcançadas em modelos de menor escala, usando diferentes estratégias para o treino, que vão desde a seleção de dados de elevada qualidade, a utilização de dados sintéticos, às arquiteturas dos próprios modelos.
O lançamento pela Microsoft Research dos modelos de linguagem Orca (13 biliões de parâmetros) e, vários meses depois, Orca 2 (7 biliões e 13 biliões de parâmetros) demonstraram como métodos de treino aprimorados, como a criação de dados sintéticos, podem elevar o raciocínio de SLMs a um nível equivalente ao de modelos 10 vezes maiores. Outro exemplo da Meta foi o lançamento, em junho 2023, do modelo Llama 2, uma coleção de modelos open-source que variam em escala de 7 a 70 biliões de parâmetros e que estão disponíveis gratuitamente para uso comercial e de pesquisa. O Llama 2 supera outros modelos de linguagem open-source em muitos benchmarks externos, incluindo testes de raciocínio, codificação, proficiência e conhecimento.
Recentemente a Microsoft expandiu sua família de SLMs com o Phi-2, de 2,7 bilhões de parâmetros, que eleva o nível de raciocínio e compreensão de linguagem entre modelos base com até 13 bilhões de parâmetros. O Phi-2 também atingiu ou excedeu o desempenho de modelos 25 vezes o seu tamanho, obtendo um desempenho notável numa variedade de benchmarks, graças à utilização de dados de elevada qualidade, cuidadosamente selecionados que são filtrados com base no valor educacional e na qualidade do conteúdo.
5. IA Generativa Empresarial – dos chatbots às aplicações inteligentes
A IA Generativa irá revolucionar a forma como as empresas operam. Da analítica avançada à automação de tarefas trabalhosas, as organizações irão medir o impacto da IA na produtividade e na criatividade dos seus colaboradores. Uma das tendências apontadas pela Gartner são as aplicações inteligentes, definidas como aplicações capazes de responder de forma adequada, dinâmica e autônoma, e que começa com dados. Muitas organizações já têm os dados de que precisam para gerar insights significativos com IA, mas, a menos que integrem esses dados em aplicações inteligentes, não serão capazes de tirar pleno partido deles para crescer, inovar e fornecer um serviço de excelência.
Em 2024, a IA Generativa irá redefinir a forma como as empresas criam aplicações de negócio. Se até hoje a maioria das aplicações que suportam o negócio são estáticas, com interfaces predefinidos, programados para cenários conhecidos, e com elevados custos de mudança, o novo paradigma levar-nos-á a aplicações inteligentes, que usam a linguagem natural como meio de interação, com experiências personalizadas, que melhoram ao longo do tempo e com uma impressionante capacidade de processamento semântico.
Os chatbots podem ter sido a porta de entrada das organizações no mundo da IA Generativa, mas foram apenas o começo. Com o introdução de IA Generativa nas soluções de negócio, muitas das aplicações serão totalmente redefinidas. Por exemplo, todo o processo de suporte a clientes num call center, que hoje exige recursos humanos intensivos para muitas tarefas, será fortemente transformado com estes novos motores semânticas que processam as chamadas, em tempo real, em múltiplas línguas, de forma personalizada. Outro exemplo, é a educação, com a introdução de novas experiências no processo de ensino, no método de aprendizagem ou simplesmente como ferramenta de suporte ao professores e alunos. 2024 será um ano de expansão do tipo e da abrangência de use cases que tiram partido da IA Generativa, alguns dos quais serão profundamente transformadores.
6. LLMOPs – uma nova fronteira na operação de IA
As mudanças no último ano em torno da IA Generativa implicam também uma mudança fundamental na forma como as equipas técnicas e não técnicas devem colaborar, avaliar e gerir o desenvolvimento de soluções de IA Generativa, em escala.
Tal como o MLOps, o LLMOps é mais do que tecnologia ou adoção de produtos. É uma confluência das pessoas envolvidas no problema, os processos de desenvolvimento e os produtos para implementá-los. As empresas que vão implementar LLMs em produção vão necessitar de equipas multidisciplinares em data science, user experience e engenharia, e geralmente incluem o envolvimento de equipas jurídicas e outros especialistas.
Ao contrário dos modelos tradicionais de Machine Learning (ML), que muitas vezes têm resultados mais previsíveis, os LLMs podem ser não-determinísticos, o que nos obriga a adotar metodologias de desenvolvimento diferentes. Em vez de treinar um modelo do zero, um cientista de dados pode hoje dedicar-se à seleção e teste dos LLMs adequados, à integração de fontes de conhecimento, texto ou imagem, em bases de dados vetoriais, ao desenho das prompts, à integração em aplicações, à avaliação do groundness do modelo ou à monitorização usando ferramentas de IA responsável para identificar enviesamentos, entre outras.
Os clientes que já iniciaram a sua jornada de MLOps beneficiarão de algumas técnicas usadas em MLOps que abrem caminho para o LLMOps, mas precisarão de novas ferramentas no portfólio de IA para ajudar a gerir todo este processo de LLMOps.
7. A emergência de novas competências
À medida que as organizações adotam soluções de IA generativa, torna-se evidente a necessidade de uma gama diversificada ferramentas tecnológicas mas também de competências.
Uma das competências mais importantes está na essência da comunicação com estes LLMs, o Prompt Engineering, que consiste na criação de instruções ou perguntas específicas que são colocadas ao modelo para que este gere a resposta desejada. É um conceito fácil de entender, mas que requer conhecimentos profundos na forma como cada prompt deve ser feita para obter o melhor resultado. Temas como o contexto fornecido, o formato da resposta, o nível de alucinação, as restrições, as fontes de informação, a cadeia de raciocínio, são apenas alguns dos exemplos associados a esta nova disciplina.
Outras das áreas fundamentais prende-se com a utilização destes modelos em contexto empresarial, em cima das bases de conhecimento que a maioria das empresas tem na sua posse, e que vê na IA Generativa um ativador crucial. Para isso é necessário entender como usar essa informação, através de bases de dados vetoriais, que alternativas devem ser usadas para a pesquisa semântica, como é feito o chunking de documentos, e como é feita a integração de todos estes componentes para criar o padrão de Retrieval Augmented Generation (RAG), um dos padrões atuais que irá dominar muitas das implementações em 2024.
8. A pesquisa na era da IA Generativa
Uma das primeiras aplicações dos LLMs, após o lançamento do chatGPT em novembro de 2022, foi a inclusão do GPT-4 nos motores de busca, redefinindo o processo de pesquisa tal como o conhecemos, com base em palavas-chave, para um chatbot conversacional, funcionalidade conhecida como Bing Chat, lançada em fevereiro de 2023 e que alcançou mais de 100 milhões de utilizadores diários!
O conceito consiste na interação em texto ou voz com os utilizadores através de um chatbot de IA, em vez de se escrever uma palavra para pesquisa. Para além de incluir de base o GPT-4, o Bing Chat – ou o Microsoft Copilot no Bing - possibilita desde a descrição de uma imagem carregada pelo utilizador, a geração de uma imagem usando o modelo DALLE-3 da Open AI, ou responder em áudio após uma questão formulada por voz, tudo de forma gratuita.
Adicionalmente foram criadas funcionalidades totalmente novas, que não existiam no próprio portal do chatGPT. A possibilidade de escolher o estilo de conversação entre “Mais criativo”, “Mais balanceado” e “Mais preciso”, permite de alguma forma controlar o nível de alucinação do modelo com respostas mais objetivas e precisas. A disponibilização das fontes de informação usadas na sintetização da resposta a uma pergunta permite ainda trazer transparência sobre as fontes usadas para formular a resposta e criar confiança sobre o resultado que é obtido destes modelos.
Mas a maior atualização neste domínio é o Deep Search, funcionalidade já está disponível para utilizadores do Bing, que visa fornecer resultados mais abrangentes e relevantes para pesquisas complexas. Depois de agregar uma vasta coleção de páginas Web, o Deep Search divide uma pesquisa simples em várias direções e apresenta respostas relevantes para cada uma delas para que utilizador não tenha o problema das etapas de pesquisa subsequentes. Munido de uma compreensão mais robusta da intenção, o Deep Search amplia automaticamente a consulta original, gerando frases de pesquisa relevantes adicionais.
9. O futuro da cibersegurança na era de IA Generativa
Em apenas dois anos, o número de ataques a passwords detetados pela Microsoft subiu de 579 para mais de 4.000 por segundo. A crescente velocidade, escala e sofisticação dos ataques cibernéticos potenciados por ferramentas de IA exigem uma nova abordagem à cibersegurança. Se por um lado, a IA pode contribuir para melhorar a deteção, a prevenção e a resposta a ataques, com base em modelos de Machine Learning, análise de dados em larga escala, e automação, por outro lado, a IA e em particular a IA Generativa pode levar à sofisticação de ataques, através da geração de conteúdo falso e da manipulação de dados, aumentando a superfície e a escala dos ataques.
Proteger uma organização hoje requer uma abordagem inovadora que previna, detete e interrompa ataques cibernéticos em tempo real, e que, tirando partido da IA Generativa, ofereça simplicidade e experiências conversacionais avançadas para ajudar as equipas dos centros de operações de segurança (SOC) a serem mais rápidas e eficientes a reunir e a analisar todos os sinais de segurança e inteligência de ameaças. As equipas de segurança enfrentam um desafio assimétrico: devem proteger tudo, enquanto os ciberatacantes só precisam de encontrar um ponto fraco.
O Microsoft Security Copilot é o primeiro produto de segurança que visa endereçar estes desafios, combinando o LLM da OpenAI com um modelo específico de segurança da Microsoft, que incorpora um conjunto crescente de capacidades específicas de segurança e é informado pela inteligência de ameaças global exclusiva da Microsoft com mais de 65 triliões de sinais recolhidos diáriamente. Na prática, a IA Generativa pode ajudar a capturar o que outras abordagens podem perder e aumentar o trabalho de um analista, com ganhos na qualidade da deteção, velocidade de resposta e capacidade de fortalecer a postura de segurança.
A cibersegurança envolve aspetos técnicos, sociais, económicos, políticos e éticos, impactando a soberania, a segurança, a democracia e o desenvolvimento global. É por isso fundamental exigir o compromisso, a consciencialização e capacitação de todos os utilizadores de recursos cibernéticos para aproveitar os benefícios da IA, sem comprometer os seus direitos, deveres e valores.
10. Inteligência Artificial Responsável
A crescente democratização do uso da IA Generativa em diversos setores da nossa sociedade levantou preocupações sobre a transparência e a justiça dos algoritmos, a alucinação presente nos modelos e sobre a potencial destruição de empregos e incertezas relativas ao controlo da própria IA.
Foram diversas as iniciativas que foram tomadas durante o último ano, com destaque para a criação em julho de 2023 do Frontier Model Safety Forum, um novo órgão da indústria formado pela Anthropic, Google, Microsoft e OpenAI, focado em garantir o desenvolvimento seguro e responsável de modelos fundacionais de IA, a Ordem Executiva da Casa Branca sobre IA, que demonstra o compromisso do governo com o desenvolvimento responsável da IA, e por último, o EU AI Act, o Regulamento de Inteligência Artificial que recentemente obteve recentemente o acordo provisório do Parlamento Europeu.
O EU AI Act é uma iniciativa legislativa que visa promover o desenvolvimento e a adoção de IA segura e confiável e garantir que os sistemas de IA colocados no mercado único são seguros e respeitam os direitos fundamentais e os valores da União Europeia. Com uma abordagem baseada no risco, este regulamento, pioneiro a nível mundial, diferencia utilizações de IA que criam risco inaceitável, risco elevado, risco limitado e risco mínimo. O acordo exige que os modelos de base cumpram obrigações de transparência antes de serem postos no mercado, que incluem a elaboração de documentação técnica, o cumprimento da legislação da UE em matéria de direitos de autor e a divulgação de resumos pormenorizados sobre os conteúdos utilizados na formação.
Estamos apenas a começar a lidar com todas estas questões, o ano de 2024 terá por isso uma maior ênfase na IA ética e responsável, bem como na justiça, transparência, privacidade e a proteção de dados, valores orientadores para o desenvolvimento de sistemas de IA para garantir que não prejudiquem os indivíduos ou a sociedade como um todo.
Considerações finais
Apesar de toda a inovação esperada para 2024, o ritmo de amadurecimento das tecnologias de IA Generativa e as diversas abordagens dificultam a captura de valor em muitas organizações. Mais do que apenas tecnologia, a adoção de modelos operacionais de IA eficazes que aproveitam os investimentos atuais em pessoas, processos e tecnologias e que permitam aos líderes de IT impulsionar iniciativas de IA bem sucedidas, são o primeiro fator de sucesso. Mas não é apenas uma questão do IT, as organizações que obtêm mais valor da IA são tipicamente aquelas cuja liderança reconhece e apoia as oportunidades da IA com palavras, recursos e ações.
Outros pilar fundamental é o desenvolvimento de competências de forma transversal à organização. Este desenvolvimento de competências deve ser encarado como uma aprendizagem contínua e promovida em todos os níveis da organização.
Por último e numa perspetiva mais tecnológica, 2024 ira certamente surpreender-nos com mais inovações, com o mesmo caracter disruptivo que vimos em 2023, no entanto à medida que a maturidade desta tecnologia aumenta, é fundamental distinguir projetos de IA Generativa que são vistos como experiências científicas e que desempenham um papel em termos de inovação empresarial, e aqueles que são incorporados em todos os aspetos do negócio e por isso se tornam impulsionadores de valor significativos. A escolha de abordagem correta para cada caso será em última análise o principal fator de sucesso para a adoção de IA Generativa para cada organização, como todos esperamos.
(*) National Technology Officer da Microsoft Portugal
Pergunta do Dia
Em destaque
-
Multimédia
20 anos de Halo 2 trazem mapas clássicos e a mítica Demo E3 de volta -
App do dia
Proteja a galáxia dos invasores com o Space shooter: Galaxy attack -
Site do dia
Google Earth reforça ferramenta Timelapse com imagens que remontam à Segunda Guerra Mundial -
How to TEK
Pesquisa no Google Fotos vai ficar mais fácil. É só usar linguagem “normal”
Comentários