O portal noticioso Cyber News, com sede em Vilnius, capital da Lituânia, informou ontem que seus pesquisadores, junto com o pesquisador científico Bob Diachenko, localizaram na Internet um banco de dados no padrão MongoDB, contendo cerca de 4,3 bilhões de registros relacionados a credenciais de pessoas. O banco de dados ocupa cerca de 16 TB de armazenamento. A equipe do Cybernews analisou o banco de dados não é seguro, encontrando novas coleções, cada uma com um nome que provavelmente indica o tipo de informação contida nelas. As coleções são as seguintes:
- intenção (intenção) – 2.054.410.607 documentos (604,76 GB)
- perfis (perfis) – 1.135.462.992 documentos (5,85 TB)
- unique_profiles (perfis exclusivos) – 732.412.172 documentos (5,63 TB)
- pessoas (gente) – 169.061.357 documentos (3,95 TB)
- mapa do site (mapa do site) – 163.765.524 documentos (20,22 GB)
- empresas (empresas) – 17.302.088 documentos (72,9 GB)
- company_sitemap (mapa do site da empresa) – 17.301.617 documentos (3,76 GB)
- address_cache (cache de endereço) – 8.126.667 documentos (26,78 GB)
- intent_archive (arquivo de interesse) – 2.073.723 documentos (620 MB)
Sgundo o portal, a instância era totalmente estruturada e provavelmente composta por dados profissionais e corporativos extraídos de fontes externas. O banco de dados expõe perfis altamente detalhados do LinkedIn, informações de contato, relacionamentos corporativos e históricos de emprego.
Leia também
Megabanco de dados expõe 26 bilhões de registros na internet
Hackers fazem bem e fazem mal guerreiam pela Rússia e Ucrânia
Todos os registros dentro de cada coleção específica são únicos. No entanto, podem ser repetidos em outras coleções. Embora diferentes coleções contenham conjuntos de informações diferentes, os pesquisadores confirmaram que pelo menos três delas – profiles , unique_profiles e people — continham informações de identificação pessoal. A estrutura do banco de dados é indicativa de redução de dados no estilo do LinkedIn, o que geralmente significa que a maior parte dos dados, como e-mails, números de telefone, cargas e redes sociais, está atualizada e precisa.
Os registros de dados e hora de “atualização” do banco de dados indicam que as informações foram coletadas e/ou atualizadas em 2025. No entanto, em 2021, agentes maliciosos publicaram relatos de que melhoraram Extraiu centenas de milhões de registros do LinkedIn . O banco de dados MongoDB exposto pode conter registros extraídos no passado.
Os pesquisadores também observaram que o banco de dados possui esquemas uniformes para perfis, contatos e históricos profissionais. As coleções Mapa do site e mapa_do_sitedaempresa que contém 180 milhões de registros, vinculam URLs a IDs de perfil. A equipe acredita que o grande volume do banco de dados vazado indica fortemente a presença de pipelines automatizados de extração e enriquecimento de dados.
