Resumo: | Nas últimas décadas os progressos verificados a nível da biologia molecular e das tecnologias do DNA (nomeadamente a utilização da PCR-"Polymerase Chain Reaction" e dos processos de sequenciação automática, de ESTs-"Expressed Sequence Tags" e de SNPs-"Single Nucleotide Polymorphisms") levaram ao crescimento exponencial da informação biológica produzida pela comunidade científica. Para tal contribuiu muito o aparecimento de inúmeros projectos de sequenciação de genomas, sobretudo o ''Human Genom Project'', com início em 1990. No ano de 1996 existiam cerca de 280 000 ESTs nas bases de dados (1). Esta avalanche de informação teve de ser armazenada e organizada. No ano de 1998 as três grandes bases de dados de sequências nucleotídicas existentes (no Japão, Reino Unido e Estados Unidos da América, respectivamente "DNA Database of Japan": DDBJ, "European Molecular Biology Laboratory": EMBL, e GenBank) estabelecem um protocolo de colaboração, criando o "International Nucleotide Sequence Database" (INSD). Em cada uma delas se podem anotar novas sequências nucleotídicas decorrentes de trabalhos de investigação, ou corrigir as pré-existentes. Todas as correcções e novas entradas são partilhadas diariamente entre as três bases de dados, pelo que em todas elas a informação disponível é a mesma, embora com algumas diferenças de formato. O acesso aos dados é livre.
|