SEO en China y nuevos cambios

Desde hace tiempo me he interesado por los motores de búsqueda en China y el enorme potencial para profesionales SEO que tiene este pais. Globalmente ya he contado alguna vez que los usuarios chinos prefieren navegar por grandes directorios de enlaces que son ordenados y actualizados frecuentemente.

Una de las cosas que suele sorprender, es que Google tenga una cuota de uso tan baja. Siendo Baidu el motor de búsqueda lider en China.

Me suelo dar una vueltecita por los buscadores, y me he quedado sorprendido de la agresiva política de Google en los paises asiáticos. Tienen un vertical de empleo, una tienda con música en streaming (sólo funciona con IP China), comentarios de discos y canciones, reserva de billetes de tren, etc servicios que acabaran llegando a USA y Europa pero que se prueban como beta y como impulso del buscador en los paises asiáticos.

Recientemente un buen amigo y gran profesional como es Nuño Valenzuela, ha dejado Muchoviaje para encargarse de comandar el equipo de marketing online de Panda Antivirus en China. Y como primer paso de colaboración y buena fé (siguiendo el Guanxi, que Nuño explico perfectamente) dejo esta pequeña ayuda 防病毒 espero que te vaya todo bien en esta nueva etapa compañero.

Y como novedades, el anuncio de Matt Cutts echando por tierra uno de los fundamentos SEO que el propio buscador defendía hace tan sólo un año. A partir de ahora el atributo «nofollow» seguirá sirviendo para inmunizarse al enlazar páginas que puedan estar penalizadas, o no entregar link juice a páginas de la competencia o que no deseemos apoyar. Pero ahora contarán en el computo de enlaces salientes para repartir el link juice, por lo que si tenemos muchos enlaces en la página ya no servirá «caparlos» con nofollow para redistribuir el potencial hacia las páginas importantes de tu sitio.

Por otro lado se ha lanzado Bing el nuevo buscador de Microsoft, aunque prometía bastante tan sólo oso panda en Chinaofrece una integración directa de las opiniones de Ciao, y poco más de momento. Según tenía entendido el motor en realidad era el mismo que Live, pero según las pruebas que he estado viendo no es exactamente cierto. Han implementado algunas modificaciones, probablemente sacadas del buscador HAKIA que adquirieron hace un tiempo, e implementa semántica y proceso del lenguaje. Algunos de mis sitios están recibiendo bastante tráfico del nuevo buscador, aunque probablemente sea por el impacto publicitario que ha tenido estos días.

Nofollow no pasa PageRank no indexa

Los enlaces nofollow no sirven para posicionar, ni tampoco indexa el enlace de ninguna forma. Se creó para indicar a Google que NO debe seguir ese enlace, como explícitamente ya explica su nombre «nofollow» (no seguir). Ya escribí un post hace tiempo para aclarar esto, para lo que realicé varias pruebas para estar fuera de toda duda (aunque no era necesario).

Pero como todavía leo por ahí muchas historietas de maquiavelo, y este mes ya mas de dos personas me han discutido esto. Voy a enumerar las diferentes fuentes donde se ha tratado esto incluso de forma oficial por parte de Google. Porque pocas cosas ha explicado Google tan clara, como para que sirve nofollow, como lo interpreta el buscador, y como se considera que se está realizando un buen uso.

Nofollow
Nofollow

Creo que queda bastante claro, los enlaces «nofollow» NO SIRVEN PARA NADA. Al menos para Google, no transfieren pagerank, no indexan, no toma en cuenta el texto del ancla, ni ninguna pájara extraña que se quiera hacer el personal porque directamente salen de la base de datos del buscador. Para otros buscadores como Yahoo y MSN si tienen valor (no creo que por mucho tiempo), así como para herramientas como los ranking Alexa y similares.

Posicionamiento de mi blog

Leyendo un post de otro SEO preocupado por el posicionamiento de su blog, me ha dado la curiosidad y he hecho un par de búsquedas a ver que tal andaba el mio. Aunque la verdad poco me preocupo de posicionar este blog, ya que no es su función de hecho el «title» es tan escueto como «Carlos Redondo» para servirles ;).

SERP de consultoria de marketing online
SERP de consultor de marketing online

Curioso que sin hacer mención en el Title de mi blog, ni haber buscado enlaces con este anchor, ni darle un especial énfasis en la página esté en el 10º puesto para «consultor de marketing online». No es que sea una keyword muy complicada, eso está claro, pero si hay varios sitios poniendo énfasis en esta keyword. Tal vez debería editar las metas y encabezados de este blog, aunque ya no trabajo como freelance siempre pueden salir cositas interesantes tal vez lo haga.

Y una bonita captura:

serp para webspam
serp para webspam

Me ha gustado por el resultado, el blog de Matt Cutts, el blog de Google Webmaster en español, la pagina oficial del Webspam Challenge, la universal de videos, y mi blog. Con un detallito en el resultado relacionado. El plugin All-in-One SEO, coge el texto que wordpress utiliza para ubicar las imágenes, como si fuera texto normal cuando la imagen está al principio del post para generar la «meta description». Tal vez actualizando el plugin se solucione, ya le echaré un ojo porque no queda nada bien.

TrustRank

TrustRank es un algoritmo desarrollado para terminar con el elevado crecimiento de paginas spam que explotan los fallos del algoritmo pagerank.
Algoritmo Trustrank Atenuacion
Algoritmo Trustrank Atenuacion
Funcionamiento:
  • Se definen “Nodos” para cada temática. Los Nodos son páginas en un principio definidas por humanos, muy relevantes para la temática buscada y con contenidos de alta calidad.
  • A estos “Nodos” o semillas, se le asigna una cantidad de “Trust” (confianza) que se transmite a través de los enlaces hacia páginas externas. Esto dota de credibilidad a las páginas enlazadas.
  • Para evitar la propagación de Trustrank a toda la red. El Trustrank transferido es cada vez menor gracias a un coeficiente de atenuación.

Principales tecnicas de webspam

Principales tecnicas de WebSpam

Voy a enumerar las principales técnicas de webspam que se están utilizando hoy dia en la red.

  • Spamdexing / Spining: Mediante diferentes técnicas se generan contenidos artificialmente y de manera automática, con lo que se consigue una gran cantidad de contenidos y páginas indexadas en poco tiempo y sin esfuerzo.

Existen diferentes tipos de software que de manera mas o menos avanzada succiona contenidos a través de las SERPs de buscadores, feed RSS, diversos grupos de noticias, wikis, foros, etc Estos contenidos son alterados mediante diferentes técnicas para intentar evitar los algoritmos de detección de contenido duplicado que han implementado los buscadores.

¿Como se camufla este contenido duplicado?

  1. Mezcla de Contenido de diferentes fuentes
  2. Cambio de orden en frases y párrafos
  3. Cacheo de consultas a buscadores internos con contenido aleatorio
  4. Mezcla de frases al azar, o selectivamente mediante afinidad de palabras clave.
  5. Traducción de contenios a diferentes idiomas
  6. «Find and Replace» mediante diccionarios de sinónimos, y términos relacionados
  7. etc

Continuar leyendo «Principales tecnicas de webspam»

¿Que es el Webspam?

Mi colaboración en el Search Congress de Barcelona trataba sobre el Webspam. Me podían encontrar en el Google Corner, junto a Judith Garcia – AdWords Account Strategist – de Google España, y el viernes también gozamos con la presencia de Eva Visiers – Google Analytics Specialist -.

Los Corners no funcionaron todo lo bien que nos hubiera gustado, pero aprovecharé mi presentación para ir publicando una serie de post sobre Webspam, analizando este tema desde dos puntos de vista:

  • Webspammers «Los Malos»: Nuevas amenazas, Quienes Son, Como Actuan, Que técnicas utilizan, Como aprovechan la Web 2.0, Porque son «Los Malos», etc
  • Buscadores «Los Buenos»: Que consideran Webspam, Como lo detectan, Que miden, Herramientas y Algoritmos que usan, o usarán en el futuro para combatir estas amenazas para la calidad de sus resultados. Y por supuesto una valoración y crítica final sobre la efectividad de estas medidas de Lucha Anti-Spam.

El SPAM ha sido relacionado históricamente con el spam por correo electrónico, pero con la evolución de la red han aparecido nuevas amenazas como el Web-SPAM, o el mas reciente Mobile-SPAM relacionados por la intención de los atacantes, pero diferente en los métodos y medios utilizados.

Empezamos con una definición generalista, ¿Que es el webspam?:

Continuar leyendo «¿Que es el Webspam?»

265.com Directorio de Google

¿Que es 265 .com? Pues como reza el titulo es un portal/directorio de enlaces a otras webs que fué adquirido por Google China. El mundo de internet chino, resulta ser un desconocido para la gran mayoría de internautas occidentales, debido a la dificultad de no utilizar nuestro alfabeto.

Como la mayoría sabreis el número de internautas chinos es altísimo, un bloque gigantesco en la tarta de la red. Pero lo que no deja de sorprender, es que los usuarios de China todavía están muy verdes en comparación con los occidentales. Y no acaban de acostumbrarse a los buscadores, por lo que los directorios de enlaces organizados por temáticas son muy populares. Para haceros una idea 265.com está entre las 3.000 páginas mas vistas del mundo.

En la portada de Google China (mucho mas bonita que la occidental), tenemos unas bolitas de colores que al pasar el ratón por encima despliegan una animación con el icono del servicio al que enlazan. Aqui tenemos Google Video, Google Maps, Google Images, Google Translator, Google Finance, Google Shenghuo (el servicio de venta de billetes para viajar) y el ultimo enlace (bolita naranja) es el enlace a 265.com.

Una curiosidad del gran gigante oriental, ¿realmente son usuarios inmaduros, o forma parte de su originalidad? ¿navegan de una manera diferente? ¿Cambiarán a nuestro modelo basado en buscadores, o mantendran su estilo de navegación?. Creo que es un caso muy interesante, y un nicho brutal para los más avispados 😉

En China el buscador mas importante es Baidu, contra el que Google todavía no ha conseguido hacer mella. Este buscador ya había comprado anteriormente hao123.com por 6 millones de dolares, una web muy parecida a 265.com.

WebSpam en el Search Congress

Webspam Search Congress
Webspam Search Congress

Esta semana asisto como «Padrino Experto» del Google Corner en el Search Congress de Barcelona. Allí hablaré sobre WebSpam, que es, evolución de las técnicas que emplean los webspammers, y como los motores de búsqueda luchan contra este problema.

La realidad es que mucha gente confunde Webspam, con SEO. Para una persona no familizarizada con este trabajo puede parecer lo mismo, pero existen diferencias muy significativas entre la optimización para motores de búsqueda y el WebSpam.

Hablaré sobre lo que ha supuesto la evolución de la Web 2.0 en el webspam:

  • Técnicas de hijacking
  • Generación automática de contenidos
  • Splogs
  • etc.

Así como los últimos trabajos realizados por los buscadores en matería de lucha contra el spam. Los nuevos algoritmos que intentan mejorar la detección, y eliminación de los rankings de estas páginas creadas mediante técnicas de webspam (Trustrank, Anti-Trustrank, WITH, etc).

Explicaré como estos algoritmos, algunos ya implementados total, o parcialmente, y otros en proceso de incorporación filtran los resultados basándose en diferentes análisis complejos de enlaces y contenido.

Y un nuevo problema:

  • Spam en redes sociales
  • Agregadores de noticias
  • Sistemas de valoracion de productos
  • Ranking por Votación de usuarios
  • etc

De momento quien quiera saber algo más de todo esto, tendrá que acercarse por el Google Corner (Jueves y Viernes) del Search Congress. Los Corners serán zonas distendidas, donde se podrá charlar tranquilamente de todos estos temas, tomar un café, y descansar en los intermedios de las ponencias.

El próximo fin de semana colgaré la presentación, y publicaré un artículo explicando algunas cosas de esta mala práctica que cada vez se convierte en un problema mayor para los buscadores, y usarios de la red.