Olá pessoal! Hoje iniciaremos uma nova série sobre BLAST! Essa ferramenta é essencial para o desenvolvimento de pesquisas nas áreas da biotecnologia e biomedicina, então abordaremos sobre de que se trata o BLAST, como funciona e o que podemos fazer através dessa ferramenta! Lembrando que o BLAST pode ser usado por meio do webserver e através da linha de comando, então fiquem ligados nos próximos posts!!! O programa BLAST, ferramenta básica de pesquisa de alinhamento local (Basic Local Alignment Search Tool), foi desenvolvido para a realização de buscas, através da comparação de sequências biológicas primárias, como as sequências de aminoácidos de proteínas ou os nucleotídeos das sequências de DNA e/ou RNA contra um banco de dados que contém uma grande quantidade de informações. Nessa busca, são retornadas as sequências com maior grau de similaridade e de maior significância estatística em relação a sequência submetida. É uma ferramenta rápida que possui diferentes variações, atendendo diversas possibilidades de busca. Essas possibilidades relacionam-se a cada tipo de BLAST que é disponibilizado pela ferramenta: BLASTn, BLASTp, BLASTx, tBLASTn e tBLASTx, sendo estas variações selecionadas de acordo com o tipo de sequência de entrada utilizada e, também, de acordo com o banco de dados que se deseja buscar.
Onde encontrar a ferramenta BLAST?Os programas BLAST hospedam-se no National Center for Biotechnology Information (NCBI) e possuem ligação com o banco de dados deste centro. As buscas utilizando são realizadas através de um conjunto de algoritmos desenvolvidos para a busca de sequências similares em um banco de dados, através do alinhamento local. Como o BLAST funciona?A seguir, trazemos uma visão geral e uma visão detalhada de como funciona o algoritmo de busca! O algoritmo do BLAST encontra sequências semelhantes, localizando correspondências curtas entre as duas sequências (seeding). Após encontrar essas sequencias, o BLAST começa a fazer alinhamentos locais utilizando conjuntos de 3 letras (para aminoácidos; nucleotídeos, este número é 11), chamados palavras. Como exemplo, a sequência GLKFA seria pesquisada de três em três: GLK, LKF, KFA. O algoritmo heurístico do BLAST localiza todas as palavras de três letras comuns entre a sequência de interesse à sua correspondente no banco de dados. Um par de segmentos é definido como um par de subsequências do mesmo comprimento que formam um alinhamento sem gaps (lacunas). O BLAST calcula todos os pares de segmentos entre a consulta e as sequências do banco de dados, acima de um limite de pontuação. O algoritmo procura por ocorrências de comprimento fixo, que são então estendidas até que um limiar pré-determinado (T) seja alcançado, quando comparadas usando uma matriz de pontuação. O alinhamento é estendido em ambas as direções pelo algoritmo e o valor T vai determinar se uma palavra será incluída ou não no alinhamento. Se esta pontuação for superior ao valor T pré-determinado, o alinhamento será incluído nos resultados fornecidos pelo BLAST. Caso contrário, o alinhamento deixará de se estender, evitando que as áreas de alinhamento incorreto sejam incluídas nos resultados do BLAST. Os pares de segmentos de alta pontuação (High-scoring Segment Pair, HSPs) resultantes formam a base dos alinhamentos que caracterizam a saída do BLAST. O algoritmo procura por alinhamentos de sequência de alta pontuação nos bancos de dados usando uma abordagem heurística (menos precisa, porém 50x mais rápida) semelhante ao algoritmo Smith-Waterman. Visão geral dos principais passos realizados pelo algoritmo. Direitos de imagem reservados ao OmixData.Passo-a-passo detalhado de uma pesquisa no BLAST: Remoção de regiões de baixa complexidade ou repetições de sequência na sequência de consulta Quebra das longas sequências em palavras Listagem das possíveis palavras correspondentes Busca por correspondências exatas de alta pontuação nos bancos de dados Extensão das correspondências exatas para HSPs Listagem de todos os HSPs no banco de dados cuja pontuação seja alta o suficiente para ser considerada Avaliação da significância da pontuação HSP União de duas ou mais regiões HSP em um alinhamento mais longo
Resultado dos alinhamentos locais com gaps E aí, entendeu um pouco melhor como essa ferramenta pode nos ajudar nas pesquisas? Nos próximos posts abordaremos de forma prática os parâmetros usados pelo BLAST e como se relacionam com os resultados! Até a próxima!
|