Sistemas de búsqueda de información en la web
Buscadores generalistas
Funciones
1. Acceder a sitios web, localizar y descargar documentos
2. Extraer el contenido textual (y multimedia) de los documentos descargados.
3. Analizar e indexar el contenido de los documentos para construir los índices del motor.
4. Realizar el análisis de enlaces de cada página y otorgar alguna medida de popularidad.
5. Permitir la formulación de consultas mediante palabras clave.
6. Facilitar el acceso a los resultados de una consulta ordenándolos conforme a unos criterios de relevancia.
Componentes
Rastreador del motor de búsqueda o Spider.
Sistema de recuperación de información
Índices directos
Índices invertidos
Interfaz
Formulario de consulta
Búsqueda simple
Búsqueda avanzada
Página de resultados
Resultados
Enlaces patrocinados
Software de relevancia
Principales Buscadores Generalistas
Ask
Metabuscadores
Tradicionales
Metacrawler
Dogpile
De agrupamiento
Visuales
Buscadores especializados
Académicos
Fuentes
Universidades (.edu)
Centros de investigación (NASA, RAND; etc.)
Gobierno
Editores de libros y revistas
Colecciones de bibliotecas
Repositorios digitales (e-prints, e-books...)
Tipos de documentos recuperados
Páginas web (html) y documentos publicados en instituciones académicas o científicas
Artículos de publicaciones científicas (abiertas o de pago)
Trabajos académicos (tesis doctorales, tesis de licenciatura...)
Documentos depositados en repositorios científicos
Patentes
Libros (monografías)
Principales buscadores académicos
Scirus
Science Research
Libros
Informes
Esade Knowledge
Blogs
Mapas
Precios
Kelkoo
Buscadores semánticos
Wolfram Aplha