domingo, 29 de julho de 2007

Meta Buscadores - O Mistério d Internet

O que são meta buscadores?

Bem a tempos atrás quando ainda se falava que HTML era uma linguaguem de programação e quase tudo era manual tinhamos um grande problema para achar qualquer coisa na internet. As páginas tinha que ser cadastradas manualmente pelo webmaster do site - imagina o trabalho do coitado? - em contra parte ele poderia mentir, colocando no cadastro do site no buscadors coissas que o site não tem. Dai alguem teve a ideia de fazer um sistema que cadastre-se "todas"as paginas da internet automaticamente, foram criados os robots, ou bots como preferir chamar.
Estes robots passam o dia inteiro visitando sites e salvando os dados dos mesmos pelo o conteudo que ele "ve" na página. Mas estes robos precisariam ter um controle para saber o que cadastrar, em qual categoria e etc, dai surgiram as metas tags, que dão origem ao nome META BUSCADORES.

Como é feito o cadastro ?

Os robos são soltos na internet apartir de sites pre-determinados (normalmente pela ultima visita do proprio bot e/ou listagem do buscador). A partir dai em todas as paginas que forem permitidos esses robos entram e cadastram as mesmas, se a pagina conter a permissão follow (siga) alem do robo cadastrar a página ele seguirá os links que estiverem na mesma cadastrando posteriormente a outra página ou site para que o link apontar.

Como é feito o raking?

Para melhorar a navegação do internauta, ou seja asegurar que o cabloco vai la digitar por exemplo historia natural do brasil e vai aparecer o conteudo correto para o mesmo cada buscador tem seu raking no caso do Google, o Page Rank, o page rank é feito da seguinte forma:

* Quando o robo passa no seu site ele avalia, se teu site tem mais textos ou mais códigos, o ideal para o Google é ter pelo ao menos 60% só de texto na página.

    * Após isto ele avalia se no titulo da pagina tem alguma palavra que a pessoa digitou na busca.

    * Depois ele vai ver se tem a palavra em um h1, h2, h3

    * Depois verifica-se se tem a palavra na meta keywords da página

    * Depois verifica se tem algum link na página com a palavra

Bem todos esses pontos ditos até agora são usados para posicionar o resultado da pesquisa mas tem mais um intém que influi diretamente nisso, o Page-Rank do seu site.... Mas que diabo de page-rank é esse como é feito? A grande verdade é que ninguem ou quase ninguem sabe ao certo, isto é um segredo industrial, mas nos desenvolvedores web vamos chutando e quando fizemos alguma coisa e posteriormente o site sobe de rank... repetimos aquilo!

Algumas coisas que aumentam o page-rank:

    * Ter seu site cadastrado no Open Directory.
    * Ter seu site castrado no Adsense.
    * Ter seu site constantemente atualizado.
    * Que seu site já esteja algum tempo no ar sem muda a url e o endereco das paginas
    * Que as palavras chaves do seu site coicidam com o titulo da pagina e url.

Como cadastrar meu site?

Se vc num fizer nada seu site pode ser cadastrado e aparecer na famosa "cagada" mas não custa nada dar uma ajudinha a sorte...

* Criando meta tags:
Você precisa definir as metas do seu site/pagina para que o mesmo seja cadastrado e obtenha maior sucesso nos resultados. Veja abaixo algumas metas tags das mais importantes:

Código:
meta name="robots" content="INDEX, FOLLOW"


Meta robots - define as permisões de todos os robos de cadastro em geral, os valores mais comuns são:
Código:

INDEX, FOLLOW - CADASTRA E SEGUE OS LINKS
NOINDEX, NOFOLLOW - NÃO CADASTRA E NÃO SEGUE
ALL - ACEITA TUDO

Também temos as metas de cada meta buscador especifico, Ex:

Código:
meta name="googlebot" content="INDEX, FOLLOW"


especifica para o Google

Código:
meta name="msnbot" content="INDEX, FOLLOW"


especifica para o MSN Live Search

Obs: os valores são os mesmos da meta robots

Código:
meta name="revisit-after" content="15 days"


De quantos em quantos dias o site será atualizado, o agendar sua proxima visita. Mas atençao com essa meta, se ele voltar e num tiver mudado nada na pagina seu page rank cai.

Código:
meta name="language" content="PT-BR"


Define o idioma

Código:
meta http-equiv="Content-Language" content="PT-BR"


Define o idioma tb


Código:
meta name="description" content="poesias mensagens frases pensamentos piadas artigos contos crônicas. poetrix haikais literatura, poesias, poesia, poetas, poeta"


Define a descriçao da pagina, é bom colocar palavras chaves aqui tb.
No maximo 255 caracteres.

Código:
meta name="keywords" content="poesias mensagens frases pensamentos piadas artigos contos crônicas poetrix haikais literatura, poesias, poesia, poetas, poeta, poetry, erotica, sensual, frase, frases, amizade, pensamentos, letra, musica, recomende, anuncio, divulgue, servicos, midi, mid, midivoice, musicaecia, webdesigner, buscamidi, italiana, francesa, laurapoesias, iraimawebsites, iraima, bagni, nacional, internacional, bolero, antologicas, franksinatra, tangos, cartao, cartoes, cards, aniversario, homenagem, busca, link, tradutor, webmaster, icq, download"

Define as palavras chaves do site
Entre 40 e 80 palavras chaves.

Código:
meta name="URL" content="http://www.poesiasdiversas.com"

Define o endereço principal do site (nao eh o da pagina)

Feito isto você já tem as metas tags que indicarão o bot como cadastrar teu site, mas primeiro pra isto o bot precisa chegar até a página do seu site. Dai vem a pergunta Como ele irá chegar lá?

- Através de links que estejam em outro site apontando para o seu site.

Se seu site for novo e não tiver links em outros sites você deve enviar seu site a lista de programaçao de passagem do robo, no caso do Google isto é feito através da seguinte URL: http://www.google.com.br/intl/pt-BR/add_url.html

Como saber se seu site têm links em outros sites?

No caso do Google, vá lá e digite link:www.seusite.com como resultado irá retornar todas páginas catalogadas que tenham link para seu site.
É importante lembrar que em caso de sistemas dinamicos com link para seu site redirecionando, como por exemplo sistemas de troca de banners não irão aparecer.

Robots.txt

É um arquivo colocado na pasta wwwroot, raiz do front do site no servidor, que define as permissões gerais que os metas buscadores terão no seu site, como por exemplo:

* Acesso a pastas
* Se poderá catalogar imagens
* Instruções de navegação do mesmo

Modelo de um robots.txt

Citação:

User-agent: Googlebot
allow:
User-agent: Slurp
allow:
User-agent: MSNBot
allow:
User-agent: Googlebot-Image
Disallow: /
User-agent: yahoo-mmcrawler
Disallow: /
User-agent: psbot
Disallow: /
User-agent: *
Disallow:
Disallow: /admin
Disallow: /mods
Disallow: /theme
Disallow: /includes


Ror.XML

Um modelo mais moderno para os meta buscadores catalogarem seu site, chamado Site Map, ultiza a mesma tecnologia de um RSS. poucos meta buscadores ultizam este metodo, mais estes poucos podem representar milhares de internautas por dia entao eh bom criar...
Siga o modelo:
Citação:



Sitemap do Portfólio de Norivan Oliveira
http://www.mrdesigners.com/norivan/

Sitemap do Portfólio de Norivan Oliveira
http://www.mrdesigners.com/norivan/
sitemap
SiteMap


http://www.mrdesigners.com/norivan/
week
0
sitemap


http://www.mrdesigners.com/norivan/default.asp
week
0
sitemap





Bem é isso aí espero que estas dicas tenham ajudado vocês.
Até a próxima!