O MGES é um programa genético usado para analisar e criar bases de dados de saúde pública, como o MGES, MGI, MGB, GBP e o MZS. A ferramenta MGES foi desenvolvida para analisar as cepas históricas de origem entérica de origem animal da Dinamarca, Alemanha, EUA e em outros lugares. Durante o estudo, observou-se que os Mges pareciam ser conservados dentro do organismo anfitrião, indicando um forte nível de conservação de elementos genéticos dentro do genoma. Esses estudos foram publicados em uma revista científica on-line chamada geneologia ambiental. Este artigo fornecerá mais informações sobre o MGES e suas aplicações.
Existem várias maneiras de gerar um banco de dados de MGES, o primeiro a usar MGES para gerar os bancos de dados. A segunda maneira é gerar o banco de dados das seqüências MGE completas usando a abordagem de metagenômica de espingarda, a terceira e última é alinhar as seqüências MGE com outras seqüências usando ferramentas de sequenciamento bacterianas. Essas abordagens dão origem a um conjunto de loci Tandem MGE que estão funcionalmente relacionados uns aos outros e podem ser usados para gerar os bancos de dados. Os bancos de dados gerados são então comparados com os bancos de dados ECORIS para detectar quaisquer seqüências não caracterizadas com função desconhecida. Este passo também nos dá acesso a seqüências regulatórias não genéticas.
Para gerar os bancos de dados da MGES, as estruturas genéticas precisam ser processadas primeiro. Aqui usamos a abordagem de metagenômica de espingarda inteira genoma para este fim, gerando impressões digitais da MG com alta resolução e qualidade. Depois de gerar a impressão digital, comparamos as seqüências dos MGES dos seres humanos e outras espécies com clusters microbianos conhecidos ou previstos. Detectamos mais de 6.000 clusters microbianos putativos e obtidos 3.000 seqüências completamente verificadas por amostra. Com os dados obtidos, geramos ortologias e seqüências específicas de espécies de ortolos bacterianos e identificados rrnas putativas dos clusters. No geral, as bases de dados montadas mostram alto nível de identidade de sequência com as entidades microbianas identificadas.