Bioinformatica

Disponível somente no TrabalhosFeitos
  • Páginas : 7 (1695 palavras )
  • Download(s) : 0
  • Publicado : 7 de novembro de 2011
Ler documento completo
Amostra do texto
1 - Banco de Dados
Banco de dados incluem:
- Registros contendo informações
- Organização lógica e estrutura das inform.
- Ferramentas para acessar

Problemas:
- São projetados para administrar dados empresariais, nº simples, caracteres e datas
- Pouca habilidade para dados complexos (multimídia, espacial e genético)

Como deveria ser a pesquisa por dado biolog.:
- Propriedade
-Semelhança estrutural
- Local

BDs Públicos de BIOINFO
1. BDs primários (seq. De nucleotídeos): NCBI, EMBL, DDBJ
2. Meta-database: Entrez
3. Banco de dados genômicos: Ensembi, SGD, TAIR
4. Banco de Dados de proteínas: UNIPROT, InterPRO
5. Bancos de Proteínas : PDB
6. BDs de domínios e motivos protéicos: PFAM,SMART,PROSITE...
7. Bancos de vias metamólicas: KEGG, BioCyc
8. Bancos de dados deexpressão gênica: ArrayExpress, GEO
9. BDs de desordens genéticas: OMIM
10. BDs de Ontologia: Gene Ontology

ENTREZ
-Não é banco de dados
-É uma interface todos os componentes de BD podem ser acessados
Espaço de informações inclui:
-Registros PubMed
- Dados sobre seq de nucleotídeos e proteínas
- Info. De estrutura 3D
-Info. De mapeamento
Vantagem: Utiliza apenas uma query

OMIMOnline Medelian Inheritance in Man
- Informaçções de desordens mendelianas, contém: todas as desordes conhecidas e mais de 12.000 genes
- Relação fenótipo e genótipo

Gene Ontology (GO)
- Representação de algo que já sabemos
- Fornece um vocabulário controlado para descrever genes e produtos gênicos de um organismo
- objetiva realizar um trabalho colaborativo para descrever o produto dosgenes
- inclui diversos repositórios de genomas e BDs
- Os termos GO são divididos em 3 partes: Componente celular (onde atua), Função molecular (o que ele faz) e Processo Biológico (o que ele produz)
- Estrutura : grafo acíclico direto hierárquico (is_a e part_of)
-Áreas não cobertas: Produtos de genes, processos, domínio de proteínas, interações prot.-prot.
-Desafios: Verificação e manutençãodas representações na ontologia, Prover anotações compreensivas onde a prova experimental está disponível para todos os genes

PFAM
(Protein families database)
- É uma coleção de alinhamentos de seq. Múltiplas e profiles de Markov escondidos (HMMs)
- Cada HMM Pfam representa uma família de proteínas ou domínio
- Pode usar para analisar proteomas (conj. de proteínas que podem ser encontradasnuma célula especifica quando sujeita a um certo estímulo) e arquiteturas de domínio

Tipos de Família PFAM
PFAM-A: descritas manualmente em famílias baseadas em HMM , construídas usando uma alinhamento de um pequeno número de sequencias representativas (“sementes”)
PFAM-B: são geradas automaticamente a partir da PFAM –A e do BD ADDA

Termos usados em PFAM
Clã: conjunto de famílias que temuma única origem evolutiva
HMMER: Suite de programas que o PFAM usa pra construir e procurar HMMs

Alinhanhamento de Sementes: é um alinhamento de um número representativo de sequencias para uma entrada PFAM.

Domínio: unidade estrutural na qual pode ser encontrado múltiplos contextos de proteínas

Arquitetura: Coleção de domínios que estão presentes em uma proteína

Família: coleção deproteínas relacionadas

iPFAM: recurso que descreve interações domínio-domínio.Quando dois ou mais domínios PFAM ocorrem em uma única estrutura

Gráficos de Domínio: representação gráfica das características encontradas na seqüência

2. BLAST / STRINGS

Busca de padrões entre os genes

Approximate Pattern Match
- achar ocorrências de um padrão em um texto de forma aproximada

QueryMatch
- achar todas as substrings do query que se aproximam do texto, de acordo com um determinado Hamming distance

Scoring Matrice
- contém valores proporcionais à probabilidade do aminoácido i mutar para o j para todos os pares de aminoácidos
- 20x20
- PAM (percent Accepted Mutation): baseadas em alinhamentos globais de proteína bem relacionadas;
-PAM1: claculada de comparações de seq...
tracking img