Arquivo da categoria: Projetos

Como os search engines funcionam?

Olá Pessoal!

Finalmente tive tempo para organizar o PDF final do meu Trabalho de Conclusão de Curso e agora disponibilizo à todos. Espero que com este estudo eu possa ajudar muitos outros estudantes e interessados na área, a conhecerem mais sobre o funcionamento dos Search Engines.

Aquivo PDF: TCC – Como os search engines funcionam?

Autor: Fábio Carvalho Motta Ricotta
Orientador: Roberto Affonso Costa Junior
Universidade Federal de Itajubá
Instituto de Ciências Exatas
Departamento de Matemática e Computação

Resumo:

Um search engine é um web site especializado em buscar e listar páginas da internet a partir de palavras-chave indicadas pelo utilizador.
Os search engines surgiram com a intenção de prestar um serviço importante: a busca de qualquer informação na web, apresentando os resultados de uma forma organizada, e também com a proposta de fazer isto de uma maneira rápida e eficiente. Ele permite que uma pessoa solicite conteúdo de acordo com um critério específico (tipicamente contendo uma dada palavra ou frase) e responde com uma lista de referências que combinam com tal critério.
Os search engines baseiam sua coleta de páginas em um robô que varre a Internet à procura de páginas novas para introduzir em sua base de dados automaticamente. Eles possuem índices atualizados constantemente para operar de forma rápida e eficiente.
Quando um usuário faz uma busca, tipicamente digitando palavras-chave, o sistema procura o índice e provê uma lista das páginas que melhor combinam ao critério, normalmente com um breve resumo contendo o título do documento e, às vezes, partes do seu texto.
Este trabalho abordará as três grandes áreas da arquitetura do search engine, Web Crawling, Indexação Web e Busca Web, e seguida apresentará um exemplo ilustrativo desta arquitetura.

Abstract:

A search engine is a web specialized site in search and retrieve pages of the internet starting from keywords indicated by the user.
The search engines appeared with the intention of rendering an extremely important service: the search of any information in the web, presenting the results in an organized way, and also with the proposal of doing this in a fast and efficient way. It allows a person to request content in agreement with a specific (typically containing a given word or sentence) criterion and it shows a list of references that combine with such criterion.
The search engines base their collection of pages automatically on a robot that sweeps the Internet searching new pages to introduce in their database. They have indexes updated constantly to operate in a fast and efficient way.
When a user makes a search, typically typing keyword, the system seeks the index and provides a list of the pages that best combines to the criterion, usually with an abbreviation summary containing the title of the document and, sometimes, parts of web page text.
This work will approach the three great areas of the architecture of the search engine, Web Crawling, Web Indexing and Web Search, and following it will present an illustrative example of this architecture.

SEO, Search Engines e um pouco de Blogs

E aí galera e amados assinantes do Feed!

Bom, hoje, feriado, 7 de setembro e eu venho com mais um post. Ontem, informei o meu status no blog Eu Quero Trabalhar no Google, mostrando que ainda não fui contratado pelo Google e falando sobre o meu TCC e o novo projeto, o SEO Dicas.

Estou dedicando um tempo bom ao SEO Dicas por ser um blog novo e ser de responsabilidade de uma galera e não só minha. Então estamos tentando ganhar respeito junto à comunidade de SEO e Blogs com posts interessantes e inovadores.

Por isto, a maioria dos artigos de SEO estou postando lá, mas apartir de hoje, uma réplica será postada aqui, sempre que eu criar algo por lá, assim todos os leitores que gostam dos meus artigos de SEO, não ficarão sem nada.

Quando ao meu TCC, gostaria de pedir aos leitores, que enviem referências, links e material sobre Search Engines, pois o que eu tenho está acabando e não está completando muita coisa aos meus conhecimentos já adquiridos através da web. Se alguém descobrir um site bom(ou pdf) sem ser a Wikipedia, envie no comentário.

Abraços a todos!

Concorrência em blogs: como, quando e onde?

Eu estava quase saindo do meu trabalho hoje, quando entrei aqui no meu site e vi as novas referências. Vi que o meu amigo Tiago Celestino, havia linkado para mim, e logo fui ver sobre o que se tratava.

Era um post relacionado à competitividade na blogosfera brasileira, e algo falando de Meme ou algo do gênero criado pelo Carlos Carvalho. Vou ser sincero, eu havia ouvido falar apenas uma vez sobre isto, então, fui às pesquisas para saber o que realmente se tratava este tal de Meme.

Na visão dos blogueiros, Meme significa criar um post, sobre um determinado assunto e convidar outras pessoas a falarem sobre este tema com o seu ponto de vista, ou seja, o Tiago, queria que eu falasse sobre esta competitividade na blogosfera. Então vamos lá.

Atualmente eu trabalho com SEO, e esta posição me faz um competidor de quaisquer formas de conteúdo que falem do mesmo assunto que o meu. Infelizmente não me considero concorrente de ninguém ao escrever neste blog. Nunca vi algum site que mostre mostre um conteúdo similar ao meu, mesmo porque eu normalmente coloco dicas e tutoriais sobre o que faço no trabalho ou para o MXStudio.

Com relação à concorrência brasileira, vejo de uma forma boa e de uma forma ruim. Muitos lançam posts totalmente informativos, sobre coisas que foram lançadas no momento, criando uma opinião sobre a notícia, ou ainda com uma dica sobre algo que muitos precisam. Isto sim é informação relevante. Agora existem aqueles que simplesmente jogam a informação, de modo desorganizado, esperando que alguém leia ou ainda comente. Minha dica, produza algo que as pessoas achem interessantes, que tenha uma finalidade, não apenas para o mundo ser melhor, mas sim para o usuário(leitor) ache a informação que procure.

Com relação ao Adsense que muitos idolatram, eu acho que simplesmente eles esquecem de quem está lendo. Veja o meu exemplo: na última reformulação do blog, adicionei o Adsense em começo do post, como uma caixa gigante. Qual o retorno? Alguns dólares…. mas isto compensa quando proporciona uma insatisfação dos leitores? Eu, particularmente, não fico satisfeito em entrar em um blog e achar várias propagandas e o conteúdo todo comprimido.

Agora o diferencial que tenho neste post é falar sobre SEO. Qual a graça de eu escrever sobre competição e não aconselhar todos os meus amigos, leitores e anônimos, sobre como crescer nos mecanismos de busca.

A alguns dias atrás, eu fiz a reformulação do blog e ao mesmo tempo fui adicionando plugins e dicas. Abaixo faço uma listagem do que você, blogueiro, pode utilizar nesta “guerra de concorrência”:

Meta Tags e Meta Description – Ainda que muito desvalorizada pelos buscadores, as meta tags servem para identificar o seu conteúdo em tópicos. Já a meta description é algo fundamental. Eu obtive 20% a mais de visitas no blog depois que iniciei os trabalho com a description.

Paginação – Criar links para a navegação do conteúdo auxiliam os buscadores a indexarem o seu conteúdo.

Sitemap – Além de ajudar o usuário a se achar, é uma página que indica aos buscadores, uma forma de acessar todas as suas páginas. Dica importante: conte o número de cliques para se atigir uma página dentro do seu blog. Dependendo da data, pode demorar alguns cliques. Utilizando um sitemap, ele fica a dois cliques da index. Acreditem, faz a diferença.

Google Sitemap – É um arquivo listando todas as URLs que o seu blog possui. Não criei um post explicando como utilizar, mas devo fazer em breve.

Convido os seguintes sites, com conteúdo similar(ou quase) ao meu, para escreverem sobre este assunto:

WebBemFeita – Blog do meu colega Rochester, colunista do MXStudio e atualmente empresário, dono da Surrealis. Escreve sobre usabilidade e já escreveu alguns posts relacionados com SEO.

Celso Junior – Procurei no Google e acabei encontrando o blog dele. Possui vários artigos sobre SEO e rentabilidade na web. (Já está participando)

Vinicius.biz – Também achei ele no Google, e possui alguns artigos bacanas sobre SEO. O blog é novo mas tem muito material

Leandro Viera Pinho – Bem no meu estilo, falando várias dicas sobre desenvolvimento web.

about:blank – Tudo sobre acessibilidade, desenvolvimento e o cotidiano da web

BrPoint – Blog sobre utilidades, seo e web.

Espero que todos participem, pois gastei um tempão para escrever um post interessante.

Obs.: Vou tirar o adsense do site, acho muito poluidor e o resultado é muito baixo.