Como os search engines funcionam?

Olá Pessoal!

Finalmente tive tempo para organizar o PDF final do meu Trabalho de Conclusão de Curso e agora disponibilizo à todos. Espero que com este estudo eu possa ajudar muitos outros estudantes e interessados na área, a conhecerem mais sobre o funcionamento dos Search Engines.

Aquivo PDF: TCC – Como os search engines funcionam?

Autor: Fábio Carvalho Motta Ricotta
Orientador: Roberto Affonso Costa Junior
Universidade Federal de Itajubá
Instituto de Ciências Exatas
Departamento de Matemática e Computação

Resumo:

Um search engine é um web site especializado em buscar e listar páginas da internet a partir de palavras-chave indicadas pelo utilizador.
Os search engines surgiram com a intenção de prestar um serviço importante: a busca de qualquer informação na web, apresentando os resultados de uma forma organizada, e também com a proposta de fazer isto de uma maneira rápida e eficiente. Ele permite que uma pessoa solicite conteúdo de acordo com um critério específico (tipicamente contendo uma dada palavra ou frase) e responde com uma lista de referências que combinam com tal critério.
Os search engines baseiam sua coleta de páginas em um robô que varre a Internet à procura de páginas novas para introduzir em sua base de dados automaticamente. Eles possuem índices atualizados constantemente para operar de forma rápida e eficiente.
Quando um usuário faz uma busca, tipicamente digitando palavras-chave, o sistema procura o índice e provê uma lista das páginas que melhor combinam ao critério, normalmente com um breve resumo contendo o título do documento e, às vezes, partes do seu texto.
Este trabalho abordará as três grandes áreas da arquitetura do search engine, Web Crawling, Indexação Web e Busca Web, e seguida apresentará um exemplo ilustrativo desta arquitetura.

Abstract:

A search engine is a web specialized site in search and retrieve pages of the internet starting from keywords indicated by the user.
The search engines appeared with the intention of rendering an extremely important service: the search of any information in the web, presenting the results in an organized way, and also with the proposal of doing this in a fast and efficient way. It allows a person to request content in agreement with a specific (typically containing a given word or sentence) criterion and it shows a list of references that combine with such criterion.
The search engines base their collection of pages automatically on a robot that sweeps the Internet searching new pages to introduce in their database. They have indexes updated constantly to operate in a fast and efficient way.
When a user makes a search, typically typing keyword, the system seeks the index and provides a list of the pages that best combines to the criterion, usually with an abbreviation summary containing the title of the document and, sometimes, parts of web page text.
This work will approach the three great areas of the architecture of the search engine, Web Crawling, Web Indexing and Web Search, and following it will present an illustrative example of this architecture.

14 opiniões sobre “Como os search engines funcionam?”

  1. olha eu nao entendo muito mais sou apaixonado por ciencia e sei que a maior parte dela e baseada em matematica e seus calculos.outra paixao minha eu tava procurando um modelo de emprego assim onde eu possa estudar trabalhar com a mente com esforço de estudo em vez de capinar uma roça e a mao plantala contruir uma maquina que faça os dois serviços ao mesmo tempo apesar de nao ser nenhum fazendeiro…eu nao sei como disse que jeito e que funciona todo o sistema da computaçao mais oque estudo e por esforço proprio tenho boas ideias de desenvolvimento mais nao sei nem para quem apresentalas!!!se estiver disposto a conversar sobre oque sei e aonde podemos chegar pensando juntos !!sera um imenso praser e honra para mim! ped-junior@hotmail.com

  2. Olá caro colega, fico muito feliz pela sua graduação.

    Gostaria de lhe dar meus parabéns e também lhe dizer que eu estou me formando ano que vem e já iniciei meu TCC, bom venho através deste pedir lhe permissão para utilizar seu TCC como Bibliografia do meu que tem como assunto E-commerce baseado em SEO “O título não é este, ainda estou pensando” e também gostaria de sua ajuda, algumas indicações e tudo mais.

    Se estiver disposto a compartilhar seu conhecimento comigo fico muito agradecido.

    Atenciosamente Ruan Carlos

  3. Olá Ruan,

    Fique à vontade para usar o meu TCC como bibliografia. Assim que terminar o seu me mostre. Se quiser eu publico aqui no meu blog.

    Qualquer coisa é só entrar em contato pelo email fabioricotta [at] gmail [dot] com

  4. olá Fabio, meus parabens, teu TCC ficou ótimo cara, ano passado entrei no teu outro site, e até deixei um comentário que estava iniciando meu tcc sobre o mesmo tema que o teu, e tbm quero pedir permição para utilizar teu trabalho como bibliografia, o meu não é um trabalho tao completo, o meu é um artigo que preciso publicar… posso utilizar teu trabalho então né??

    no aguardo…

  5. Olá Fabio, estou no 4º ano de Ciência da Computação e estou na fase do TCC, mas ainda tenho muitas duvidas sobre o meu tema. Vi o sei site e gostei muito, por isso que gostaria de pedir algumas dicas sobre como desenvolver um site de busca, pois estou pensando tambem em desenvolver um.

    Se você puder me ajudar, agradeceria…

  6. Olá Thais,

    Em que posso ajudá-la? Se você der uma olhada no meu TCC verá que tem bastante conteúdo lá.

    Eu sugiro você a pegar um web crawler open source e trabalhar em uma arquitetura com ele. Produzir todo um search engine é um grande trabalho.

  7. Fábio, parabéns pelo TCC. Gostaria de abrir um site para comparação de preços de produtos que sejam locais…tipo comparar preço de refrigeradores em lojas de Belém…e por aí vai..conheces alguma empresa confiável que pode fazer isso…preciso de detalhes..vlw,abç

    Derek

  8. Ola td bem?
    Adorei o seu TCC. PARABENS!
    Eu vou me fomra no final desse ano e estou pensando em fazer o meu TCC sobre Internet Local Search (Busca Local via internet, e quero pedi a permisao de utilizar o seu trabalho como bibliografia do meu.
    T++
    bjs

Deixe uma resposta

O seu endereço de email não será publicado Campos obrigatórios são marcados *

Você pode usar estas tags e atributos de HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>