Panda Update 2.4 España y Fallo Analytics

Google Panda Update y la desinformación
Google Panda Update y la desinformación

Resucito mi abandonado blog para comentar la salida del nuevo algoritmo Panda Update en España y resto de Europa y LATAM. A excepción de Corea, Japón y China ya lo tenemos activo en el resto del mundo (también hay una actualización en el algoritmo para el idioma inglés).

ACTUALIZACION2  18 de Agosto: El comunicado de Google ayer diciendo que solucionó el problema no es cierto, Google Analytics sigue estropeado a dia de hoy. Los datos de visitas no son reales, cambian los datos mostrados de un dia al siguiente para fechas pasadas, los datos cambian según el panel, los segmentos no funcionan como deberían, hay cruces entre los estadisticos de una metrica y otra. SEGUIMOS IGUAL

ACTUALIZACION 18 Agosto!!!: Pues aunque algunos no me creyeron, yo tenía razón Analytics estaba bugeado (5 DIAS EN AVISAR). Mañana revisaré las explicaciones, ya que creo no me cuadran perfectamente con todos los fallos que detecté, aunque es posible. Volveré a actualizar para dar por solucionado el problema, o indicar si existen mas fallos.

Antes de nada aclarar que en este post NO VOY A COMENTAR DETALLES SOBRE EL ALGORITMO, pero si creo importante comentar lo sucedido estos dias y la indiferencia de Google ante los posibles problemas, y la crispación que está generando por una mala gestión de la información que facilita.

Por dar algún dato y resumiendo ha habido grandes caidas, y también algunos vencedores. Aparecen estudios que muestran como ganan peso las keywords en dominio/subdominio con fuerza, aparecen pequeñas paginas (foros y blogs) para Top keywords sustituyendo a los líderes del sector, agregadores y Ecommerce pierden. Y mucho rumorología como siempre.

  • Viernes 12 de Agosto, Google anuncia Panda Update expandido internacionalmente al resto de idiomas

http://googlewebmaster-es.blogspot.com/2011/08/lanzamiento-en-otros-idiomas-del.html

Con este nuevo algoritmo pretende limpiar sus resultados de páginas web de mala calidad, para mejorar la experiencia de usuario. Los principales damnificados se espera que sean los agregadores, sitios con mucha cantidad de contenido duplicado interno y externo, etc

  • Viernes 12 de Agosto (poco después), Google anuncia una actualización de Google Analytics que modifica la definición de sesión.

En resumen lo que hace es que ahora si un usuario accede desde diferentes orígenes a la misma página en el mismo dia, contará cada vez como una nueva visita. Bonita decisión por su parte lanzar a la vez una actualización del algoritmo y cambiar como mide todos los datos verdad? (Don´t be evil eh? :D)

http://central-de-conversiones.blogspot.com/2011/08/actualizacion-las-sesiones-de-google.html

Después de esto ninguna nueva comunicación, y empiezan los problemas. La mayoría detectamos extraños datos en Analytics, demasiados sitios con incrementos entre el 30% y 50% de visitas, tasas de rebolte mas altas, disminución de paginas por visita, etc también hay gente que detecta perdidas importantes de tráfico.

Continuar leyendo «Panda Update 2.4 España y Fallo Analytics»

Principales tecnicas de webspam

Principales tecnicas de WebSpam

Voy a enumerar las principales técnicas de webspam que se están utilizando hoy dia en la red.

  • Spamdexing / Spining: Mediante diferentes técnicas se generan contenidos artificialmente y de manera automática, con lo que se consigue una gran cantidad de contenidos y páginas indexadas en poco tiempo y sin esfuerzo.

Existen diferentes tipos de software que de manera mas o menos avanzada succiona contenidos a través de las SERPs de buscadores, feed RSS, diversos grupos de noticias, wikis, foros, etc Estos contenidos son alterados mediante diferentes técnicas para intentar evitar los algoritmos de detección de contenido duplicado que han implementado los buscadores.

¿Como se camufla este contenido duplicado?

  1. Mezcla de Contenido de diferentes fuentes
  2. Cambio de orden en frases y párrafos
  3. Cacheo de consultas a buscadores internos con contenido aleatorio
  4. Mezcla de frases al azar, o selectivamente mediante afinidad de palabras clave.
  5. Traducción de contenios a diferentes idiomas
  6. «Find and Replace» mediante diccionarios de sinónimos, y términos relacionados
  7. etc

Continuar leyendo «Principales tecnicas de webspam»

¿Que es el Webspam?

Mi colaboración en el Search Congress de Barcelona trataba sobre el Webspam. Me podían encontrar en el Google Corner, junto a Judith Garcia – AdWords Account Strategist – de Google España, y el viernes también gozamos con la presencia de Eva Visiers – Google Analytics Specialist -.

Los Corners no funcionaron todo lo bien que nos hubiera gustado, pero aprovecharé mi presentación para ir publicando una serie de post sobre Webspam, analizando este tema desde dos puntos de vista:

  • Webspammers «Los Malos»: Nuevas amenazas, Quienes Son, Como Actuan, Que técnicas utilizan, Como aprovechan la Web 2.0, Porque son «Los Malos», etc
  • Buscadores «Los Buenos»: Que consideran Webspam, Como lo detectan, Que miden, Herramientas y Algoritmos que usan, o usarán en el futuro para combatir estas amenazas para la calidad de sus resultados. Y por supuesto una valoración y crítica final sobre la efectividad de estas medidas de Lucha Anti-Spam.

El SPAM ha sido relacionado históricamente con el spam por correo electrónico, pero con la evolución de la red han aparecido nuevas amenazas como el Web-SPAM, o el mas reciente Mobile-SPAM relacionados por la intención de los atacantes, pero diferente en los métodos y medios utilizados.

Empezamos con una definición generalista, ¿Que es el webspam?:

Continuar leyendo «¿Que es el Webspam?»