Os sistemas generativos de IA agem como “papagaios estocásticos”, usando modelos estatísticos para adivinhar a ordem das palavras e o posicionamento dos pixels. Isso é incompatível com uma imprensa livre que comanda as suas próprias palavras.
IA generativa representa a maior ameaça à liberdade de imprensa em décadas, e os jornalistas devem agir rapidamente para se organizarem e remodelarem radicalmente o seu poder de produzir notícias.
A indústria noticiosa tem sido fustigada por desafios económicos e tecnológicos que estão fora do seu controlo. Desde as primeiras inovações em tipos móveis e reprodução de fotos até preocupações mais recentes sobre classificações em mecanismos de busca, algoritmos de mídia social , análise de audiência , financiamento puxado de tecnologia e o infame “pivô para vídeo ”, as organizações de notícias têm tentado se adaptar aos ecossistemas de informação em rápida evolução. seguir o poder e o dinheiro das novas tecnologias e, ao mesmo tempo, tentar alinhá-las com os valores das notícias e os julgamentos editoriais. A imprensa hoje depende de infra-estruturas tecnológicas distribuídas pertencentes e operadas por um seleto grupo de corporações poderosas.
E agora chega a GenAI, ameaçando derrubar indústrias. Os professores estão a questionar o valor dos trabalhos de redação, os médicos estão a usar a GenAI para comunicar com os pacientes e os atores e escritores de Hollywood estão a montar defesas vigorosas contra os estúdios que pretendem usar a GenAI para criar guiões, capturar imagens de atores e gerar filmes sinteticamente.
O jornalismo também está a tentar compreender e aproveitar o poder da GenAI. Existem inúmeras experiências para fabricar manchetes, histórias, imagens, vídeos, podcasts, personalidades de transmissão e até mesmo entrevistas por meio de tecnologias fáceis de usar e prontas para uso que até recentemente eram material de protótipos industriais e laboratórios de ciência da computação. Embora as redações tenham usado alguma versão da IA durante anos – para criar histórias simples, pesquisar arquivos, testar manchetes e analisar dados de audiência – e os jornalistas tenham desenvolvido rotinas de verificação forense de fatos para se protegerem contra mídias falsas, os jornalistas de hoje também estão experimentando rapidamente meios sintéticos. ferramentas de mídia como ChatGPT, Bard, DALLE, Jasper.ai, protótipo Genesis do Google e inúmeros outros concorrentes.
A NewsCorp usa GenAI para criar cerca de 3.000 notícias locais australianas a cada semana. Planet Money da NPR usou GenAI para roteirizar um episódio com vozes clonadas. O Kuwait News usou o GenAI para fabricar um apresentador de notícias de televisão. A CNET experimentou usar GenAI para escrever dezenas de histórias (embora muitos artigos contivessem erros ). Muitas redações têm estado ocupadas desenvolvendo suas próprias regras em torno do uso do GenAI. E no início deste verão, o Google apresentou um “companheiro” da GenAI que, segundo ele, poderia gerar notícias.
Mas a linguagem GenAI não tem esse compromisso com a verdade, a eloquência ou o interesse público. Os sistemas GenAI usam modelos estatísticos para adivinhar quais ordens de palavras e posicionamentos de pixels se ajustam aos padrões que os modelos computacionais identificaram em conjuntos de dados vastos e em grande parte não examinados. Eles agem como “ papagaios estocásticos ”. O jornalismo que utiliza os grandes modelos de linguagem e padrões estatísticos da GenAI da Big Tech corre o risco de não ser apenas tendencioso ou enfadonho. Tal jornalismo é potencialmente um anátema para uma imprensa livre porque renuncia à autonomia – para não mencionar a alegria estética – que advém de saber porquê e como usar a linguagem.
Como estudiosos do jornalismo e da liberdade de imprensa, temos acompanhado de perto estes desenvolvimentos. Através do nosso trabalho com Knowing Machines — um projeto de pesquisa que traça a história, as práticas e a política de sistemas de aprendizado de máquina como GenAI — analisamos centenas de notícias, políticas, diretrizes, comentários e artigos de reflexão sobre GenAI no jornalismo. E estamos preocupados com o facto de estas implicações para a liberdade de imprensa – para além dos fluxos de trabalho de reportagem, das políticas das redações e das pressões laborais – não terem estado no centro do debate público que o jornalismo precisa de ter sobre a GenAI.
Até agora, esta conversa reflectiu um sentimento generalizado de inevitabilidade sobre a tecnologia e a sua capacidade de substituir, melhorar ou engolir as notícias. Na esperança de proteger uma indústria já abalada económica e politicamente, os jornalistas adotaram posturas amplamente defensivas e reativas, focadas em duas preocupações inter-relacionadas: proteger os empregos e os modelos de negócios nas redações e garantir que a GenAI — com as suas alucinações de desinformação e erros de alto perfil — passa nos testes jornalísticos de veracidade.
Esses focos no trabalho e na verdade são importantes e compreensíveis, mas ignoram o que está acontecendo abaixo da superfície. A visão de que a GenAI é apenas a mais recente ferramenta tecnológica para jornalistas e organizações de notícias aproveitarem de forma responsável ignora como ela aumenta drasticamente a dependência da indústria em empresas de tecnologia de maneiras perturbadoras e muitas vezes desconhecidas, inclusive confiando na GenAI para classificar, computar e criar a linguagem que os jornalistas usam para contar histórias – as histórias que usamos para nos conhecer e governar.
Existem duas maneiras pelas quais os jornalistas podem usar este momento da GenAI para defender e até fortalecer a liberdade de imprensa.
Primeiro, pegando uma página do Writers and Screen Actors Guilds e alinhando-se com alguns sindicatos de redações , os jornalistas poderiam encontrar sua voz coletiva na GenAI. Na verdade, começámos a ver alguns esforços hesitantes, mas esperançosos, de acção colectiva. Alguns editores estão a tentar formar uma coligação para exigir uma compensação justa às empresas GenAI que utilizam textos noticiosos para treinar os seus modelos – embora veículos importantes como o The New York Times e a AP pareçam ter a intenção de agir sozinhos. E os sindicatos das redações estão a pressionar por uma maior protecção dos trabalhadores, embora esses esforços estejam até agora concentrados em mitigar os efeitos da GenAI.
Os jornalistas poderiam olhar para além das preocupações sobre direitos de autor e trabalho automatizado para perguntar se a natureza sintética, estatística e proprietária da GenAI – a sua linguagem provém de sistemas controlados por algumas pessoas poderosas – é sequer compatível com uma imprensa livre que comanda as suas próprias palavras. Os jornalistas poderiam perguntar como as suas obrigações como funcionários públicos com direitos constitucionalmente protegidos se alinham com a sua vontade de usar ideias, manchetes, ledes, frases, edições, imagens e muito mais, feitas por sistemas computacionais irresponsáveis, controlados de forma privada e muitas vezes opacos, usando conjuntos de dados que são conhecidos . ser _falho. Se os jornalistas pudessem falar com as empresas tecnológicas a uma só voz, poderiam afirmar o seu poder e remodelar radicalmente a GenAI, exigindo que as empresas tecnológicas ajudassem a apoiar a imprensa de que as pessoas necessitam.
Em segundo lugar, para que os jornalistas possam refazer a GenAI no interesse público, precisam de usar a sua voz colectiva para mudar a infra-estrutura da GenAI. Isso significa mais do que aprender como fazer perguntas ao ChatGPT, reagir às respostas, rotular notícias da GenAI ou verificar fatos em uma história da GenAI. Significa criticar, refazer e rejeitar os sistemas GenAI quando os jornalistas os consideram inadequados para o trabalho noticioso. Escondido sob os resultados da GenAI está um vasto oceano de dados com histórias e políticasque tornam a GenAI tudo menos neutra ou objetiva. Quem categorizou e rotulou o conjunto de dados, o que está sobre-representado ou ausente de um conjunto de dados, com que frequência o sistema falha e quem sofre mais com esses erros? Quem nas redações tem o poder de licenciar os sistemas GenAI, o que perguntam antes de lançar uma nova ferramenta e quanto poder os jornalistas têm para recusar parte ou toda a infraestrutura GenAI? Os estudantes de jornalismo estão sendo treinados não apenas para usar dados em histórias, mas também para interrogar a política dos conjuntos de dados e modelos da GenAI – incluindo aqueles em suas próprias redações?
Os jornalistas precisam ser bons e rápidos em analisar os bastidores dos sistemas GenAI e desenvolver o poder para moldá-los. Isso significa examinar conjuntos de dados, categorias, suposições, taxas de falha, culturas de engenharia e imperativos econômicos que impulsionam os sistemas GenAI. Os repórteres precisam fazer perguntas difíceis sobre como a GenAI pode revelar dados confidenciais, colocar fontes em risco e confundir de forma prejudicial notícias cuidadosamente elaboradas com outros tipos de “dados” ou “conteúdo”. Embora os jornalistas possam ser seduzidos pelas promessas da GenAI de uma linguagem estatística sem política, deveriam ver como esses meios de comunicação sintéticos são muitas vezes incompatíveis com a linguagem mais subtil e precisa que jornalistas experientes levam anos a aprender a usar.
É provável que a GenAI se enraíze na indústria noticiosa, aprofundando ainda mais a dependência da imprensa em relação às empresas tecnológicas, às suas infra-estruturas de dados e, muitas vezes, aos modelos de aprendizagem automática inescrutáveis. As organizações de notícias poderão em breve terceirizar para empresas de tecnologia não apenas o poder e a responsabilidade de disseminar e curar notícias, mas também de criá-las em primeiro lugar.
Este poder está no cerne do serviço público do jornalismo, nomeadamente na sua capacidade e obrigação de usar a linguagem de forma artística, eloquente e intencional para criar e debater as verdades básicas que ancoram as realidades sociais partilhadas. Como demonstraram inúmeros estudiosos do jornalismo , e como sabem os profissionais especializados, as palavraso jornalismo usa a matéria como nenhuma outra palavra porque, na melhor das hipóteses, as palavras do jornalismo emergem do serviço público, da reportagem incontestável, do julgamento auto-reflexivo das notícias, da narrativa eloquente, da edição rigorosa e da publicação oportuna. Notícias não são “conteúdo”, leitores não são “usuários”, histórias não são “sínteses”. Uma imprensa verdadeiramente livre controla a sua linguagem do início ao fim. Sabe de onde vêm as suas palavras, como escolhê-las e defendê-las e o poder que advém da sua utilização em nome do público.
Uma imprensa livre e responsável é uma imprensa eloquente que conhece as suas palavras. Conhece a política das suas palavras, defende a sua linguagem com coragem e muda as suas palavras quando sabe que deveria. Como instituição – e não apenas como jornalistas individuais ou organizações que tomam as suas próprias decisões – a imprensa precisa de saber como a GenAI cumpre ou prejudica a sua missão pública. Precisa de falar a uma só voz com as empresas tecnológicas que vendem ferramentas GenAI, usando o seu poder único como instituição pública vital e constitucionalmente protegida para rejeitar a aquisição tecnológica da linguagem que utiliza em nome do público. Se a GenAI continuar a ser uma curiosidade técnica, uma moda fetichizada, um mistério incognoscível ou uma ferramenta aparentemente neutra, os jornalistas correm o risco de se libertarem de uma missão, aceitando gradualmente os tópicos, factos, histórias, palavras, e a falsa eloquência da GenAI como “boa o suficiente”. Tal imprensa seria tudo menos gratuita.
Imagem: Nieman Lab
Obs: publicação original em NiemanLab, tendo sofrido ligeiras adequações na presente edição.
O autor Mike Ananny é professor associado de comunicação e jornalismo na Annenberg School da University of Southern California. Jake Karr é vice-diretor da Clínica de Política e Direito Tecnológico da Universidade de Nova York. Ambos são membros do Knowing Machines , um projeto de pesquisa que traça as histórias, práticas e políticas de como os sistemas de aprendizado de máquina são treinados para interpretar o mundo.”
[em atualização]