Início Tecnologia O Google torna os dados do mundo real mais acessíveis à IA-e...

O Google torna os dados do mundo real mais acessíveis à IA-e os pipelines de treinamento vão adorar

3
0

 

O Google está transformando seu vasto trove de dados públicos em uma mina de ouro para a IA, com a estréia do servidor de protocolo de contexto de modelo Data Commons (MCP)-permitindo que desenvolvedores, cientistas de dados e agentes de IA acessem estatísticas do mundo real usando linguagem natural e melhor treinem sistemas de IA.

Lançado em 2018, o Data Commons do Google organiza conjuntos de dados públicos de um gama de fontesincluindo pesquisas governamentais, dados administrativos locais e estatísticas de órgãos globais, como as Nações Unidas. Com a liberação do servidor MCP, esses dados agora estão acessíveis via linguagem natural, permitindo que os desenvolvedores o integrem a agentes ou aplicativos de IA.

Os sistemas de IA são frequentemente treinados em dados da Web barulhentos e não verificados. Combinado com sua tendência a “preencher os espaços em branco” quando falta fontes, isso leva a alucinações. Como resultado, as empresas que procuram ajustar os sistemas de IA para casos de uso específicos geralmente precisam de acesso a conjuntos de dados grandes e de alta qualidade. Ao lançar publicamente o servidor MCP para seus dados Commons, o Google pretende enfrentar os dois desafios.

O novo servidor MCP do Data Commons preenche os conjuntos de dados públicos – desde números do censo até estatísticas climáticas – com sistemas de IA que dependem cada vez mais do contexto preciso e estruturado. Ao tornar esses dados acessíveis por meio de avisos de linguagem natural, a versão visa fundamentar a IA em informações verificáveis ​​do mundo real.

“O protocolo de contexto do modelo está nos deixando usar a inteligência do modelo de idioma grande para escolher os dados certos no momento certo, sem ter que entender como modelamos os dados, como nossa API funciona”, disse o chefe do Google Data Commons Prem Ramaswami em entrevista.

Uma amostra de Data do Google Data Commons MCP Server conectando a IA com dados do mundo realCréditos da imagem:Google

Introduzido pela primeira vez pela Antrópica em novembro passado, o MCP é um padrão aberto da indústria que permite que os sistemas de IA acessem dados de várias fontes, incluindo ferramentas de negócios, repositórios de conteúdo e ambientes de desenvolvimento de aplicativos, fornecendo uma estrutura comum para entender os avisos contextuais. Desde o seu lançamento, empresas como OpenAi, Microsoft e Google adotaram o padrão para integrar seus modelos de IA com várias fontes de dados.

Enquanto outras empresas de tecnologia exploraram como aplicar o padrão aos seus modelos de IA, Ramaswami e sua equipe no Google começaram a investigar como a estrutura poderia ser usada para tornar a plataforma Data Commons mais acessível no início deste ano.

Evento do TechCrunch

São Francisco
|
27-29 de outubro de 2025

O Google também fez parceria com a Campanha One, uma organização sem fins lucrativos focada em melhorar as oportunidades econômicas e a saúde pública na África, para lançar o One Data Agent. Essa ferramenta de IA utiliza o servidor MCP para superfície dezenas de milhões de pontos de dados financeiros e de saúde em linguagem simples.

A única campanha abordou a equipe do Google Data Commons com uma implementação de protótipo do MCP em seu próprio servidor personalizado. Essa interação, disse Ramaswami ao TechCrunch, foi o ponto de virada que levou a equipe a construir um servidor MCP dedicado em maio.

No entanto, a experiência não se limita à campanha. A natureza aberta do Data Commons MCP Server o torna compatível com qualquer LLM, e o Google forneceu várias maneiras de os desenvolvedores iniciarem. Um agente de amostra está disponível através do Kit de Desenvolvimento de Agentes (ADK) em um Caderno de Colabe o servidor também pode ser acessado diretamente através do CLI GEMINI ou qualquer cliente compatível com MCP usando o Pacote Pypi. O código de exemplo também é fornecido em um Repositório do GitHub.

avots

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui