Archivo de la categoría: Buscadores

Indexación de audio en los vídeos de Youtube

El blog oficial de Google anuncia que ahora experimentalmente se esta indexando el audio en los vídeos de Youtube.

Inicialmente se están indexando vídeos de los canales políticos y se los puede encontrar en la página Google Audio Indexing.

Se trata realmente de una interesante funcionalidad que en el futuro va ha dar mayor impulso a los vídeos en Internet, ya que el contenido hablado podría ser indexado por el buscador de Google.

Nuevos operadores de búsqueda en Google Code Search

El blog oficial de Google Code Search ha anunciado que se han realizado varias mejoras en el buscador de código fuente de Google que fue lanzado ya hace casi 2 años atrás.

Una de las mejoras más interesantes es la función Outline que permite mostrar la estructura del código como por ejemplo las clases en C++, C#, Java, Phyton, JavaScript, etc.

Un ejemplo de la estructura de la clase, en realidad template, Singleton en C++ se puede observar en la siguiente imagen

Otra de las nuevas funciones de Google Code Search es que cuando en los resultados aparecen includes, estos pueden ser visualizados directamente haciendo un click en los mismos.

Estas nuevas funciones son muy interesantes para los desarrolladores que están analizando algún código fuente en la red, ya que no necesitan descargar el código fuente para poder analalizarlo con algún IDE. Ahora lo pueden hacer directamente en el navegador, con Google Code Search.

Y hablando de Google Code Search, hoy día también se comenta en TechCrunch que sus resultados han sido incluidos en el buscador universal de Google.

Google explica oficialmente el Google Ranking

En su política de abrirse más a los webmasters y tratar de dar una cara amigable y no la de un monopolista, Google ha comenzado a presentar una serie de artículos explicativos en sus Blogs, especialmente en el de Google Webmaster Central.

Hoy día se habla en el Blog oficial de sobre una introducción al Google Ranking, ojo que no se trata solamente del PageRank.

En la parte central del artículo se puede leer

Google ranking is a collection of algorithms used to find the most relevant documents for a user query. We do this for hundreds of millions of queries a day, from a collection of billions and billions of pages. These algorithms are run for every query entered into most of Google’s search services. While our web search is the most used Google search service and the most widely known, the same ranking algorithms are also used – with some modifications – for other Google search services, including Images, News, YouTube, Maps, Product Search, Book Search, and more.

Bueno, en resumen nada nuevo, pero al final se dice

Stay tuned for my followup post, where I will discuss in detail the technologies behind our ranking and show examples of several state-of-the-art ranking techniques in action.

Lo que significa que posiblemente, proximamente se van ha publicar más notas con algunos detalles generales sobre el funcionamiento de los buscadores de Google.

Goosh – Una web shell para Google

Goosh o Google Shell es una pequeña herramienta que permite usar muchas funciones de Google directamente desde una linea de comandos, como se las conoce por ejemplo en Linux.

La siguiente imagen muestra la lista de todas las funciones que actualmente soporta GooSh

Funciones de Google Shell
Funciones de Google Shell

Además de las funciones para buscar en la web o imagenes, también se pueden hacer búsquedas en Wikipedia, en blogs, en Google Video, y también en Maps.

Otra de las funciones interesantes es la posibilidad de usar GooSh desde la caja de búsqueda de Firerfox.

En resumen, Gooogle Shell es una interesante herramienta para los que están acostumbrados a trabajar en ambientes de texto, como en Linux.

Lo que todavía no he podido encontrar si es que esta herramienta se puede usar de forma externa para poder usar directamente sus resultados en otras aplicaciones, lo que la haría muy interesante para monitorear posiciones de páginas web, páginas indexadas, backlinks, etc.

Qué sucede con el googlebot?

Debido a una nota en Search Engine Roundtable sobre una baja en la frecuencia de rastreo del googlebot, qué a su vez menciona una discusión en Webmasterworld, me puse a revisar los datos de algunos de los proyectos que controlo

Frecuencia de rastreo del googlebot 1

Frecuencia de rastreo del googlebot 2

Frecuencia de rastreo del googlebot 3

Se trata de 3 proyectos con diferentes temas, diferentes tamaños, diferentes idiomas y en diferentes servidores.

Lo que se puede observar en los 3 casos es que en la última mitad de Abril, el numero de visitas del googlebot ha decaído considerablemente.

La siguiente gráfica muestra el número de páginas nuevas indexadas diariamente para el primer proyecto durante el mes de Abril

Numero de páginas indexadas por día

Como se puede apreciar, mas o menos en los días en que la frecuencia de rastreo del googlebot decayó, el numero de páginas indexadas cayo a 10, pero luego nuevamente subió a los niveles normales.

El motivo de la bajada de la frecuencia de rastreo del googlebot todavía es desconocido. Se podría tratar de algún un problema técnico, o también se podría tratar de alguna mejora en los algoritmos de Google que ya no hace necesario escanear una web con tanta frecuencia.

Lo qué si esta claro es que páginas nuevas son escaneadas como siempre, muy rápidamente, y blogs con WordPress también continúan siendo los mimados del googlebot.

Ya que Google todavía no se ha pronunciado (y tal vez tampoco lo haga) sobre el motivo de esta bajada, tendremos que esperar un poco más para poder analizar exactamente qué es lo que sucede con el googlebot.

Ejemplos de páginas indexadas en Google por formularios

Ayer mencionaba que Google ya puede indexar páginas detrás de formularios.

Hoy día, revisando uno de mis proyectos recién me he dado cuenta cómo muchas páginas fueron indexadas en el buscador de Google. Todas estas páginas muestran la URL mi-proyecto.com/?s=keyword, donde la palabra clave esta más o menos relacionada con el tema de mi proyecto.

El bot de Google toma las palabras claves de la web, las llena en el formulario de búsqueda de WordPress e indexa los resultados.

Muchas de estas páginas indexadas tienen sentido, como se puede apreciar en la siguiente imagen

Página indexada por el uso de formularios

Pero también he encontrado otros ejemplos como el siguiente

Ejemplo de página indexada por formularios

donde la palabra alles (alemán) no tiene ningún sentido en esta web.

La única forma que me puedo imaginar de que Google haya probado esta búsqueda en el blog es que algún usuario la realizó y con la información que Google puede obtener de la página – mediante Analytics o AdSense – la haya indexado.

Como ya lo había comentado en mi anterior nota, esta nueva forma de indexación en muchos casos puede tener sentido, pero en muchos otros no y no sé hasta que punto pueda mejorar la calidad de los resultados del buscador.

En este caso especifico, y seguramente en muchos otros blogs con WordPress esta forma de indexación ha sido positiva ya que la página resultante contiene los keywords buscados con un gran densidad, ya que es resultado de la función de búsqueda dentro del blog, y así estas páginas se han logrado posicionar fácilmente en los primeros lugares del índice de Google.

Finalmente, aquí una lista de algunas páginas indexadas mediante formulario, donde se puede observar si las mismas hacen sentido o no

Páginas indexadas por formularios

Búsquedas previas pueden influir en los resultados de Google

Esta forma de refinamiento de una búsqueda o Previous Query como se lo llama internamente en Google, ya se estaba usando en los anuncios de AdWords desde hace algún tiempo.

Pero ahora parece que ahora también será usada en los resultados orgánicos del Google.

Y cómo funciona?
Por ejemplo, si un usuario realiza primero una búsqueda con la palabra españa, y luego con viajes, entonces el buscador le presentará resultados muy similares a la búsqueda españa viajes. Es decir que el buscador va memorizando búsquedas anteriores y va refinado los resultados con el historial de palabras.

Esta forma de refinamiento de resultados, se aplicaría sobre todo a búsquedas de una palabra.

Hace algunos días leí un estudio de que la mayoría de los internautas no sabe como realizar correctamente una búsqueda. Tal vez esta es una buena posibilidad para ayudarles a encontrar lo que están buscando.

Pero por otra parte, este tipo de resultados podría afectar en el trafico a muchos sitios que están en las primeras posiciones del buscador para una sola palabra clave, ya que con este método se favorizarian los resultados con combinaciones de palabras.

Visto en Search Engine Land

Está Google experimentando un nuevo algoritmo para su buscador?

La época en que los webmasters y SEOs se dedicaban a revisar todos los IPs de los data centers (DC) del buscador de Google parecían haber acabado, ya que Google no estaba haciendo experimentos – por lo menos visibles – con sus algoritmos en algunos de esos DCs.

Pero ahora parece que situación nuevamente ha cambiado. Desde hace algunos días atrás, se comentaban los resultados de los DCs

72.14.207.104
64.233.183.104

en un hilo de WebmasterWorld. Poco después, el conocido Matt Cutts de Google escribio en este hilo

Hey all, I asked a few people to look into this and they weren’t seeing many large differences in rankings between these datacenters. The issue with discussing on this thread is that specific urls/queries aren’t allowed. If anyone wants to mention a search where they see large-scale differences, feel free to send feedback to Google in the usual way. I’m going to pick a random-but-pretty-unique keyword so that I can look up reports. Let’s use «dewey» as the word. So if you want to mention a search where you think the results are very different at one data center compared to other data centers, use the spam report form at http://www.google.com/contact/spamreport.html and make sure to include the word «dewey» in the «Additional details» text area. Or feel free to point out differences in other ways: do a blog post, leave specifics on the Google webmaster help group, or whatever way you want to point out specific searches that look different to you.

The usual rules of thumb apply: you probably won’t get a personal reply, but I’ll try to get someone to check out reports that get sent in. There shouldn’t be much difference between data centers, so I’m curious to find out what queries people seem to be seeing different results on.

De esto se puede deducir que Google esta pensando actualizar el índice de su buscador, no con los ya acostumbrados «data refresh», sino más bien con nuevos datos, fruto de algún tipo de cambio, en el buscador. Matt le ha dado el nombre de «dewey», lo cual también es un indicio de algo grande.

Por el momento, en el mencionado foro se discute si se trata de un cambio de algoritmos o de software/infra-estructura, como sucedió con la actualización BigDaddy que duró muchos meses.

La diferencia más palpable que he podido encontrar entre los DCs actuales y estos de prueba, es que el número de resultados que se muestran los nuevos DCs es mucho más grande.

Teleportación en el buscador de Google

Esta nueva función del buscador de Google ya había sido comentada ayer en varios blogs, pero hoy ya se ha oficializado en el blog oficial de Google donde la llaman teleportación.

En muchas búsquedas aparece como resultado en la primera posición un sitelink. Es decir un snippet o descripción con varios enlaces al mismo sitio pero con diferentes temas relevantes.

Ahora, Google ha adicionado a muchos de estos sitelinks una caja de búsqueda adicional, la teleportación, que permite buscar directamente en la web en cuestión.

Un ejemplo de esta nueva función se puede apreciar en la siguiente imagen para la esta búsqueda

Google Teleportación

En realidad se trata de la búsqueda site:mi-dominio.com palabra-clave que según la nota oficial es una función muy práctica para gente que busca alguna página especifica en una web, pero no la conoce exactamente. Por ese motivo la han llamado teleportación. Y luego de algunos experimentos que han resultado muy satisfactorios han decido implantarla rápidamente como una función estándar en el los resultados del buscador.

Sobre el buscador universal de Google versión 2008

Cómo ya es bien conocido, el año pasado Google presentó su Buscador Universal, justamente en el mes de Mayo del 2007. Inmediatamente después, aparecieron en la red una serie de opiniones sobre las consecuencias que esto traería al tráfico de las páginas que aparecen en los resultados orgánicos del buscador. También aparecieron estudios por ejemplo sobre eye tracking en el buscador universal, pero al final la mayoría de los webmasters y SEOs se quedó tranquilo, ya que en la mayoría de las búsquedas no aparecían los mapas, imágenes o vídeos que pueden atraer la atención a los usuarios.

Pero ahora parece que Google si es lo ha tomado en serio, y como se comenta en un hilo de xeoweb muchos resultados para palabras muy competitivas aparecen en google.es llenas de imágenes, mapas, y otras componentes multimedia que atraen la atención de los usuarios y colocan en la sombra los resultados orgánicos del motor de búsqueda. Esto ha causado la pérdida de tráfico en las páginas que están en las primeras posiciones.

Dany Sullivan se ha dado el trabajo de clasificar todos los tipos de resultados que presenta el buscador universal de Google. Se trata de un artículo muy interesante en el que muestra detalladamente todos los tipos de búsquedas (web, book search, imagenes, local search, news, vídeo) y cómo han sido integrados en los resultados del buscador en los últimos meses. Todos los ejemplos se refieren a google.com.

Por ejemplo los mapas aparecían inicialmente en un formato grande, solamente con 3 referencias. Luego este mapa aparecía después de los 3 primeros resultados orgánicos y ahora esta apareciendo al inicio de la página de resultados un pequeño mapa, pero con 10 referencias (Justamente esto se comentaba en el hilo de xeoweb mencionado anteriormente).

Adicionalmente, Danny muestra también otros tipos de resultados que suelen aparecer.

Actualmente y según mis observaciones, este tipo de resultados se observan solamente para palabras claves muy competitivas y en dominios de Google para «países grandes». Mientras que los resultados para palabras o frases poco buscadas todavía son los antiguos.

Esto posiblemente se debe a que estas búsquedas no generan resultados en los servicios multimedia, de productos o noticias de Google; o que todavía no han sido integrados en el buscador universal; o finalmente Google no los piensa integrar y los mantendrá así.

Ahora, los webmasters van ha tener que generar el tráfico hacia sus webs usando los resultados de la cola larga o long-tail, o tratar de inscribir sus proyectos en maps, products, etc. Y esto con seguridad va ha generar mucho SPAM en estos servicios verticales.