lunes, 12 de septiembre de 2011

Buscadores


INFORME I
I.                    Investigar la naturaleza, las posibilidades y la utilidad original de los siguientes buscadores:

1.- DOGPILE:

Dogpile es un meta buscador de Internet que retorna las búsquedas desde los motores About, Ask.com, FinWhat, Google, LookSmart,MSNSearch, Teoma, 
Yahoo, Bing y otros buscadores populares, incluyendo de audio y video.

Este meta buscador comenzó en noviembre de 1996, siendo parte de la red Go2net en 1999, la cual fue adquirida por InfoSpace, empresa que poseía también Metacrawler, Webcrawler y Excite.
En el 2005, Dogpile publicó un estudio acerca de los resultados que retorna cada buscador. El estudio mostró que existe un 3% de redundancia entre Google, Yahoo y Ask Jeeves. El 85% de los resultados fueron únicos para uno de los buscadores.

Como en los buscadores ya clásicos, Dogpile, nos permite buscar en la web,  noticias, imágenes, ofertas diarias, vídeos, páginas amarillas y en las páginas blancas.

Cabe destacar que Dogpile es totalmente configurable ya que podemos filtrar nuestras búsquedas. Así se pueden mostrar resultados con contenido explícito en tres niveles,  desde básico, moderado o muy estricto;  por términos de búsquedas; por búsquedas recientes y hasta la cantidad de resultados a mostrar.
Además tenemos el apartado de las búsquedas avanzadas, las que podemos realizar con tan solo llenar un pequeño formulario en el que podemos poner las palabras claves de nuestra búsqueda, palabras a filtrar, excluir o incluir algunos dominios y hasta elegir el idioma de la búsqueda.
En fin Dogpile es un buscador recomendable si se quiere tener una alternativa a los buscadores clásicos y ya conocidos.
 2.-  A9
A9 es  un motor de búsqueda, es decir un sistema que anexa archivos que otros servidores web han recopilado. La búsqueda en A9 necesita de una palabra clave que permitirá que el resultado sea una lista de direcciones electrónicas en las que se desarrollan distintos temas relacionados con las palabras ingresadas. 

Este buscador fue creado por Amazon.com y sus resultados provienen de LiveSearch, Alexa y otros buscadores definidos según su contenido. A9 funciona igual que los demás buscadores, con palabras claves, sin embargo, la peculiaridad de este servicio es que al acceder a la opción “searchinsidethebook”, también puede brindar resultados en libros de la base de datos de Amazon.com.

A diferencia de sus principales competidores –Google, Yahoo y Microsoft–, los resultados en A9 se despliegan en dos columnas: por un lado, las páginas relacionadas con el término tecleado, y por el otro, las imágenes que se ajustan a los criterios de búsqueda.

A9 es entre los buscadores el único que surge con un concepto de personalización diferente, con un enfoque más dirigido hacia las ventas y la atención al cliente, no como el resto de sus pares inclinados a la obtención de ingresos provenientes de la publicidad y la promoción principalmente.

Entre las características de este  buscador, destaca la posibilidad de guardar favoritos y hacer búsquedas en ellos, o contar con un ‘diario’ en el que añadir notas a los resultados.
Como para otros buscadores, la publicidad será la principal fuente de ingresos de A9. Este mostrará en la parte superior de la lista de resultados, enlaces patrocinados. Además, ofrecerá a sus usuarios la instalación gratuita de una barra de herramientas para el navegador con accesos directos a las herramientas que ofrece A9

Las YellowPages o páginas amarillas es un servicio universalmente conocido y popular en su término general. En todos los países existe, hay variadas versiones online por lo que no habría tanta sorpresa ni merecería tanto destacarse A9 con su nuevo servicio.

Sin embargo, el impacto visual de las fotos digitales de los negocios indexados por su buscador, la posibilidad que cada comerciante “adapte digitalmente su negocio con sus propias fotos” y brinde la posibilidad de llamar directamente desde Internet para sus consultas o hacer pedidos es realmente un avance en la concepción básica de una guía esta naturaleza en Internet.

3.- ALEXA

Alexa es un medidor internacional que ofrece resultados sobre la clasificación de las webs, además provee información acerca de la cantidad de visitas que recibe un sitio web dado. Alexa recolecta información de los usuarios que tienen instalado Alexa Toolbar, lo cual le permite generar estadísticas acerca de la cantidad de visitas y de los enlaces relacionados; y manifiesta los gustos de los usuarios.
Alexa, además, presenta nuevos servicios como la  lista de sitios relacionados con el que estamos navegando, información acerca del website en el que nos encontramos, comentarios de otros usuarios, sitios más visitados, temas de interés y acceso a blogs.

Alexa Toolbar es una aplicación producida por Alexa Internet. Incluye un bloqueador de pop-ups, un cuadro de entrada al motor de búsqueda, un enlace a Amazon.com, un enlace a Alexa, información sobre la calificación actual de Alexa del sitio web que el usuario está visitando, y enlaces relevantes al sitio que el usuario navega. 

A principios del 2005 hubo más de 10 millones de descargas de la barra de herramientas, según Alexa. Pero la empresa no ofrece información sobre cuántas de ellas son usadas actualmente.
Alexa Toolbar para Internet Explorer 7 es considerada malware por Microsoft y, como tal, no se puede instalar en Windows Vista.

4.- KARTOO

El 25 de Abril de 2002 se lanzó la nueva meta buscador Kartoo, que está basado en una tecnología desarrollada durante cerca de 3 años por Laurent Baleydeir y su equipo.
Kartoo está programado en Flash aunque dispone opcionalmente de una interface HTML tradicional. Una vez en marcha, Kartoo lanza la cuestión en una serie de motores de búsqueda, recupera los resultados, los compila y los representa en una serie de mapas interactivos mediante un algoritmo propietario.

La presentación gráfica dispone los 10 primeros resultados en forma de bola, de tamaño proporcional a su relevancia relativa. Si se pasa el cursor por encima de la bola podemos ver la descripción de lo que ha devuelto ese enlace.


Lo interesante de Kartoo es que elabora los denominados enlaces semánticos entre los resultados. Dichos resultados se representan mediante líneas sinuosas que enlazan las bolas.

Kartoopresenta una vista minimizada de cada resultado, da una idea de la página web y un sumario del contenido. Numerosas opciones permiten personalizar desde el contenido hasta la apariencia del sitio.
Kartoo es un metabuscador de información en Internet, basado en Web Semántica, que presenta visualmente los sitios encontrados en lugares de diferentes tamaños (según una estimación de su pertinencia), todo ello en diferentes mapas. En estos mapas, simplemente situando el ratón encima de un sitio, se muestran las relaciones con los demás. Búsquedas alternativas y avanzadas permiten ajustar sucesivamente la búsqueda.

El silencio documental hace referencia a aquella información que no ha sido encontrada por los buscadores o motores de búsqueda, debido a que la estrategia de búsqueda ha sido demasiado específica o que las palabras claves utilizadas no son las adecuadas para definir la búsqueda.
Mientras el ruido documental es aquella información que si ha sido encontrada por el buscador pero que no son relevantes. Esto se origina cuando la estrategia de búsqueda que se ha definido ha sido demasiado genérica.

5.- BUSCOPIO

Buscopio es un buscador de buscadores que en su haber se halla un índice de más de 3.600 buscadores que pueden ser territoriales, temáticos, históricos, deportivos, médicos, etc.
Tiene un índice bastante bueno donde se pueden localizar el buscador que se buscaba. Este buscador es recomendado para los que quieran buscar información sobre un tema general y se lían con el Google y muchos otros. Tiene su apartado de recomendaciones donde aconseja los mejores buscadores y Webs.
A pesar de ello, Buscopio tiene el defecto de ser lento y, también, se usa con  una sola palabra, porque dos o más no las coge.

6.- BEAUCOUP

Beaucoup es un buscador de “información libre” que ofrece varia información a parte de las lista de productos y servicios. Permite la búsqueda en las páginas relacionadas con el tema a investigar y la información especializada de manera gratuita.
Beaucoup empezó en el invierno de 1995-96 como una pequeña página y busca en 10 buscadores simultáneamente.

7.- COMPLETE PLANET

CompletePlanet es un portal de Web Invisible con un servicio rápido, los resultados relevantes, y una interfaz fácil de usar. CompletePlanet busca más de 70.000 bases de datos de búsqueda y motores de búsqueda especializados, un número bastante impresionante, y los resultados de la búsqueda son creíbles y fiables.
En la parte inferior de cada resultado de búsqueda, verás pequeñas plazas de color indica la relevancia de su resultado es a su consulta de búsqueda original, el puntaje más alto es de cuatro plazas, así que cuanto más plazas, mejor. Al lado de eso verá el tamaño de ese archivo en particular y la fecha en que fue "cosechado", más bien, cuando CompletePlanet indexado la página.
La Búsqueda avanzada es bastante estándar, se tiene la opción de buscar por título, palabra clave, descripción, fecha, etc

En primer lugar, es extremadamente fácil de usar, y aún más simple para reducir los allanamientos sin una gran cantidad de sintaxis de búsqueda complicada o los operadores de búsqueda.En segundo lugar, CompletePlanet es buscar en la Web Invisible, de modo que sus resultados en general son de un nivel superior (ya que están en instituciones académicas, gubernamentales, militares, bases de datos, etc.) que si ha buscado el mismo tema en un motor de búsqueda general. En tercer lugar, la lista de temas es la derecha en la primera página - que hace que sea fácil de reducir o ampliar su búsqueda, además, CompletePlanet como una gran herramienta con la que buscar en la web profunda.


INFORME II
II.                  Escoge un tema de actualidad que sea de tu interés (suceso, personaje, premio, evento, tendencia, producto, etc.

El tema elegido para desarrollar y aplicar las diversos métodos de filtrado mediante operadores esGastón Acurio.
La primera búsqueda en Google consistió básicamente en escribir el nombre del cocinero Gastón Acurio, lo que me dio como resultado un aproximado de 647 000 páginas.
A continuación utilicé el operador (+) para obtener menos resultados y más cercanos a lo que estaba buscando, como por ejemplo:

a.- Al utilizar la siguiente combinación: Gastón Acurio + Mistura encontré  cerca de 165 000 páginas entre las cuales destaco la página principal del tema elegido, lo cual es muy útil para mi investigación.

b.- Luego utilicé la combinación: Gastón Acurio + Mistura 2011 y obtuve 142 000 páginas, la información que muchas de estas páginas contenían me fueron muy útiles.

d.- Para tener información del tema seleccionado en nuestro país escribí la combinación Gastón Acurio+ Perú y el resultado fue de 1’430 000 páginas, muchas de ellas me lograron dar la situación Gastón Acurio en el Perú así como sus principales noticias de este cocinero. Pero para tener conocimiento más actual de su situación escribí Gastón Acurio + Perú + 2011 reduciendo el número de páginas a 832 000.

e.- Finalmente decidí utilizar las comillas en el motor de búsqueda, “Cocinero Gastón Acurio”, lo que me dio como resultado 14 400 páginas sobre él todas ellas con información valiosa para mi investigación.

Para el método de búsqueda avanzada en Google, primero probé escribiendo en el rango de “con todas las palabras”Gastón Acurio; en el rango de “con algunas palabras” escribí cocina, mistura, Perú, 2011; y en el rango “sin palabras” escribí cocinaque era lo que generalmente encontraba en la búsqueda normal en Google. En el rango de “Idioma” di en la opción español, el número de páginas obtenidas fue de 1’ 360 000 páginas.

Pero lo que ahora necesitaba era publicidad televisiva acerca de Mistura  así que en la misma búsqueda avanzada de Google fui al rango “Dominios” para ingresar la página de Youtube en la forma youtube.com y de esta manera solo encontrar lo especificado antes en la página Youtube. Como resultado obtuve una página con un video acerca de unas noticias sobre él. Luego de seguir combinando palabras obtuve 11 600 videos de la publicidad televisiva de Gastón Acurio.

INFORME III

III.                Describir en breve el funcionamiento de los siguientes buscadores (elegir solo un buscador de cada grupo), indicando su URL y las principales características.
ü  Buscadores de Información académica
                                    
Los buscadores académicos son sistemas de información que sólo registransitios Web vinculados al mundo académico, es decir, contienen artículosde revistas científicas, investigaciones, ponencias presentadas a congresos,tesis y tesinas, patentes, libros, y páginas Web de instituciones académicas.
Dos de los buscadores académicos de mayor relevancia en la actualidad son:
·         Google Scholar ( http :// scholar.google.cl / schhp?hl=es ), creación de la empresa google.com
 Creado en el año 2005, su principal aporte radica en la facilidad que ofrece de indicar las veces y en dónde fue citado el material que se busca.
Registra artículos de revistas; libros con la indicación de las bibliotecas en donde encontrarlos; documentos y páginas Web de instituciones académicas; e investigaciones y tesis de repositorios de acceso abierto.
La consulta de libros digitales, disponibles se debe a acuerdos firmados con prestigiosas bibliotecas universitarias.
La búsqueda avanzada permite combinar términos y delimitar por autor, título de revista, y rango de fechas, el número de veces citado el artículo, Texto completo, Total documentos recuperados.
 ·         Scirus ( http :// www.scirus.com / ), creación de la importante editorial de revistascientíficas Elsevier
  •   Buscadores de blogs:
Existen diversos buscadores de blogs. Los dos primeros los más populares. Los segundos son más útiles para el ámbito anglosajón. Blogscope analiza curvas de popularidad. Podemos introducir el siguiente ejemplo (la carga del gráfico es lenta): New York Society for Ethical Culture y Manchester City Libraries

·         Technorati:  http://www.technorati.com
Motor de búsqueda de blogs que, según Wikipedia. En junio de 2008  contabilizaba unos 112.8 millones de blogs.

·         Google blog: http://blogsearch.google.es/blogsearch?hl=es
Buscador de blogs de Google. Admite búsquedas tanto de blogs completos como de post
.
  •   Buscadores de libros:
 Busca Libros subidos en distintos servidores de la web.

·         Google Books books.google.com

Es un servicio que indexa la información contenida dentro de cientos de miles de libros impresos, para poder ofrecer a los usuarios la posibilidad de que encuentren cualquier dato dentro de ellos. 

Para indexar esta información, Google ha desarrollado una tecnología propia para escanear los libros y clasificar su información. 

  •  Buscadores de formatos:
 Herramienta de búsqueda para localizar archivos en formato Microsoft Word, Microsoft PowerPoint, Microsoft Excel y Adobe PDF indexados por Google.

·         PDFGeni: http://www.pdfgeni.com/

es un buscador de archivo en PDF efectivo y fácil de usar, está especializado tanto en temas de negocios como de computación, revistas e ingeniería.

  •  Buscadores de fotos:           
 ·         http://www.everystockphoto.com

Everystockphoto - buscador de fotografías libres de derechos o bajo licencias creativecommons.

  •  Buscadores de videos
 ·         YouTube : www.youtube.com

Servicio de búsqueda y alojamiento de vídeos, con la característica de poder etiquetar con tags los mismos.

  • Buscadores de audios
 ·         FindSounds:  http://www.findsounds.com

Buscador de audio en varios formatos: Mp3, AIFF, AU, WAVE, etc.

  • Buscadores visuales
 El concepto de búsqueda del futuro parece estar muy unido a la visual. En este aspecto es muy importante para el usuario de hoy día disponer de una imagen hacia la web que salga en los resultados de búsqueda.

·         Grokker: http://www.grokker.com/
Los resultados aparecen tanto en formato estándar como en mapas dinámicos con los cuales se puede interactuar. Grokker aprovecha los buscadores de Yahoo!, Wikipedia, Amazon Books para hacer sus búsquedas. Los resultados pueden aparecer por fecha, fuente, dominio y palabras clave específicas, relacionadas finamente (o así excluidas).


  • Recursos de internet profunda
Se conoce como Internet profunda o Internet invisible (en inglés: Deepnet, Invisible Web, Dark Web o Hidden Web) a todo el contenido de Internet que no forma parte del Internet Superficial, es decir, de las páginas indexadas por las arañas de los motores de búsqueda de Internet. Esto es debido a las limitaciones que tienen las arañas para acceder a todas las webs por distintos motivos. 

Internet invisible: http://www.internetinvisible.com
A imagen de su hermano anglosajón Invisible Web, este buscador  cataloga e 1775 bases de datos en español, de acceso gratuito
"Internetinvisible.com recopila, describe y ofrece el enlace a las bases de datos existentes en Internet en un directorio organizado en grupos temáticos, los cuales se subdividen a su vez en materias más específicas. Cuando accedemos al web mediante uno de sus dos modos de acceso: un directorio temático,  o un formulario de búsqueda -simple o avanzada- obtenemos una ficha con la descripción del contenido de la base de datos relacionada, el enlace a la pantalla de búsqueda y la entidad o persona responsable de su creación.