Robots/pragma/seo

Disponível somente no TrabalhosFeitos
  • Páginas : 7 (1656 palavras )
  • Download(s) : 0
  • Publicado : 27 de março de 2012
Ler documento completo
Amostra do texto
UNIVERSIDADE NOVE DE JULHO – UNINOVE

Tecnologia em Analise e Desenvolvimento de Sistemas





ROBOTS/PRAGMA/SEO

























São Paulo

2012










|O que é Robots ? | | |

||
|Robots, ou robôs, são aplicativos que percorrem a internet em busca de conteúdo com o objetivo de indexá-lo ou verificarem alterações ocorridas|
|desde a última "visita" Nem todo o conteúdo de um site deve ser indexado pelos robots. Páginas de login, páginas repetidas, páginas de|
|impressão são alguns desses exemplos. O que é robots.txt, então? Como o próprio nome já diz, é um arquivo no formato txt que funciona como um |
|filtro para os Crawlers, fazendo com que webmasters possam controlar permissões de acesso a determinados pontos dos sites. O robots.txt |
|controla qual informação de um site deve ou não deve ser indexado pelos sites de busca. A sintaxe doarquivo é bem simples, e deve ser colocada|
|pelo webmaster responsável pelo site na raíz da hospedagem. |
| |
|ROBOTS.TXT - SINTAXE|
|O arquivo robots.txt tem o papel de criar uma política de acesso para os Robots. Para a execução dessas tarefas há palavras reservadas, ou |
|seja, palavras com a função de comandos que permitirão ou não o acesso a determinados diretórios ou páginas de um site: |
|User-agent|
|A função deste comando é apenas dizer quais Robots devem seguir as regras indicadas no Robots.txt. Supondo que você deseje apenas que o |
|mecanismo de busca do google siga as definições constantes no arquivo robots.txt, este deve ser indicado como User-agent:Googlebot. Eis as |
|principais opções: |
|Google: User-agent: Googlebot |
|Yahoo: User-agent: Slurp|
|MSN: User-agent: msnbot. |
|Todos os mecanismos: User-agent: *. |
|Disallow|
|Este comando diz aos mecanismos qual diretório ou página deve ser impedida de ter o conteúdo verificado. Exemplos: |
|Disallow: /images diz aos robots para que não seja indexado o conteúdo do diretório /images ||Disallow: print1.html instrui os robots a não indexarem a página print1.html. |
|Allow |
|Este comando diz aos robots qual diretório ou página deve ter o conteúdo verificado. Mas qual seria a...
tracking img