Mira mama,…. ¡Sin herramientas!

Mira mama,…. ¡Sin herramientas!

Y después de estar dando el coñazo con herramientas, durante muchos post los últimos meses, hoy voy a contar cosas que son obvias o básicas, pero que podemos hacer sin usar ninguna herramienta.
Analicemos una web cualquiera y veamos todo lo que podemos detectar sin tener que usar herramientas, solo navegando, observando, haciendo alguna búsqueda en Google y, como mucho, mirando un poco el código fuente.
El ejemplo que voy a usar es totalmente random: la web que esté top 1 para la búsqueda «comprar arcade».

Tecnología

Viendo el código fuente muchas veces podemos «alpistear» y dar con la tecnología que utiliza la web.
La web que el azar ha querido traer a este post divagación nos muestra lo siguiente si entramos al código fuente:
codigo fuente web
 
Ya vemos que la web tira en WordPress.
Para chequear el codigo fuente, haciendo clic en botón derecho suele existir una opción de Ver Código Fuente, atajos de teclado Control+U, o directamente desde el navegador que estemos.
En entorno Mac, alt+cmd+u o cmd+u.
Si quieres usar herramientas para esto, Builtwith te sirve.
URLs Canónicas
Primera cosa que podemos observar simplemente navegando, si tienen establecida la url preferida o no.
Esto es importante para evitar que se dupliquen distintas versiones de la web, vaya, lo usual es que se redirijan las versiones no preferidas a la preferida.
Por tanto, simplemente entramos a la versión con www y vemos esto:

version con www

Si nos vamos a la versión sin www, sin embargo, encontramos esto:

version sin www

A pesar de hacer la comprobación en Safari, nos costaría muy poco chequearlo con Chrome o Firefox, para confirmar que sigue el mismo comportamiento o que afecta de otro modo, ¡quién sabe!

Sin duda, aquí ya podríamos tirar del hilo un poco más, buscando otras versiones de la «home», extensiones como index.html y otras, probando si hay más indicios sobre los que hacer conjeturas.

Más info sobre urls canónicas, te la da Google aquí

Indexación

Vamos a cacharrear con varias cosas.
Primero vemos que tiene un robots.txt en la raíz, lo normal, capa el rastreo a esas carpetas de wordpress

robots txt

Ok. Sitemap no tiene subido.

Las etiquetas <meta name=»robots»> para bloquear o permitir la indexación, no aparecen en el código fuente de las páginas, recordemos los 4 escenarios generales que existen con un ejemplo friki de los míos:

meta robots love

Dado que no tienen estas etiquetas en las páginas, vamos a ver qué nivel de indexación tienen buscándolo en Google:

comando site google

Pues a mi me sorprende que tenga tantos resultados, porque tanto el menú como las secciones y el propio contenido, no auguraban mucha profundidad, ¡aquí hay algo más!

¿No es curioso que la sección «tienda» esté por delante de la homepage haciendo «site:»? Aunque ya tiene unos años este vídeo de tito Matt hablando sobre el orden que sigue esa info, este debate, para otro día.

Lo que tiene esta web es una tienda en Prestashop, en la sección «Tienda Virtual» (la que aparece primera indexada en el listado, el path /tienda).

El código fuente de esta ya nos lo dice:

html lang="es">
	<head>
		<meta charset="utf-8" />
		<title>Factory Arcade</title>
		<meta name="description" content="Shop powered by PrestaShop" />
		<meta name="keywords" content="tienda, prestashop" />
		<meta name="generator" content="PrestaShop" />
		<meta name="robots" content="index,follow" />
		<meta name="viewport" content="width=device-width, minimum-scale=0.25, maximum-scale=1.6, initial-scale=1.0" />
		<meta name="apple-mobile-web-app-capable" content="yes" />
		<link rel="icon" type="image/vnd.microsoft.icon" href="/tienda/img/favicon.jpg?1421100469" />

Aquí ya vemos meta robots, y hasta meta keywords 🙂
Su propio robots.txt en su path http://www.factoryarcade.es/tienda/robots.txt
De aquí por ejemplo, ya que la tienda virtual tiene buscador interno, podríamos jugar a ver si tienen bien puesto el robots.txt y las urls que generan búsquedas internas, ver cómo se comporta, si se indexan, etc.
«?controller=search&orderby=position&orderway=desc&search_query=ola+k+ase»

Disallow: /*controller=search

 
El aspecto de esta carpeta, incluso parece una web distinta, aunque tengan el mismo logo e imagen, ya veis como faltan elementos para volver a ese inicio donde empezamos

tienda presta

De hecho el logo apunta a /tienda y no a la home «normal», que sería /.

Si usamos «site:factoryarcade.es/tienda/» ya vemos que 2.200 son de esta tienda prestashop.

¡¡Pero ojo!! Que me he equivocado al teclear y he puesto .com, y ¡tachan!

arcade punto com

¿No se parece mucho a la versión .es?

Habría que conocer un poco más a fondo los motivos para hacer esto, reservar distintas extensiones para el dominio, está bien, ahora que tener lo mismo en distintos dominios,…. Puede ser peligroso.

Para nuestra tranquilidad, el sitio .com enlaza al contenido del sitio .es, por eso tiene tan poquitos resultados indexados, y no está duplicando más de 2 mil urls, ¡algo es algo!

Esto como veis, simplemente navegando y observando, se saca, aunque con un Screaming Frog, Urivalet y otras, podríamos haber agilizado ciertas consultas.

Estructura de la web

Sigue navegando, sigue navegando….
La estructura la podemos medio intuir viendo las urls y como se relacionan las distintas páginas entre si.
El menú ya nos da la pista, 3 productos principales, la tienda y las secciones típicas de contacto y quienes somos.
Lo curioso es ver estas 3 fichas, que dan info general de características, a modo de ficha, para posicionar genéricos tal vez, alguna búsqueda en google nos daría pistas de «keywords importantes» para ver si las usan en etiquetas, textos, anchor text internos…

bartop google arcade google

En los 3 casos, las fotos no se muestran sin hacer click en ellas.
Luego los distintos tipos de producto, no tienen url propia en este punto, habrá que ver si tienen presencia en la tienda virtual, que ya ha quedado claro que es una web prestashop dentro de una carpeta.
El menú lateral de la tienda virtual ya nos indica qué páginas actúan como categorías superiores, las que cuelgan de ellas, y dónde están ubicadas las fichas finales de productos.

categorias y fichas

  • Url de nivel «categoría» –> /tienda/11-muebles-arcade
  • Url de nivel «subcategoría» –> /tienda/22-puertas-y-cerraduras
  • Url de nivel «ficha de producto» –> /tienda/muebles-arcade/40-cerradura-camlock.html

¿Qué observamos?

Que Categoría y Subcategoría no anidan en las urls, tienen el mismo nivel de profundidad.

Que la ficha de producto anida con un nivel semejante a la categoría, sería interesante tocar esa url y ver qué pasa si entramos en /tienda/muebles-arcade/

404 prestashop

Lo realmente positivo es encontrar el breadcrumb en la ficha, que replica la estructura y el sentido jerárquico que le da ese valor estructural que las urls no reflejan:

breadcrumb ficha

 

Otras cosas (que hay miles)

Podemos ver qué criterio se sigue con enlaces y ver si usan atributos «nofollow», desde el código fuente, control+F o cmd+F, «nofollow», y nos localizará si existen dichos elementos.

buscando nofollow

Podemos ver dónde mencionan esta web, sin contar todas sus redes sociales, imaginando que tienen twitter y facebook nada más, podemos buscar en google algo así:

  • Factory Arcade -site:factoryarcade.es -site:facebook.com -site:twitter.com
  • factoryarcade.es -site:factoryarcade.es -site:facebook.com -site:twitter.com

Y quizás ya tratar de ir a por los enlaces entrantes, esto es difícil de acertar 🙂

  • «www.factoryarcade.es» -site:factoryarcade.es
  • link:www.factoryarcade.es

Estas dos ultimas cosas con Majestic y URLProfiler, pues agilizas, las cosas como son.
Buscar en Google los términos top, no solo nos daría una pista de si la web tiene su hueco en este nicho, también nos daría pistas sobre competidores orgánicos y de negocio, y si quisieramos, volver a empezar estos análisis con sus webs
Si se te ocurre algo más para mirar, déjanos un comentario, ¡por hoy, nada más!


2 comentarios sobre “Mira mama,…. ¡Sin herramientas!

  1. Lo del problema de con y sin www es seguramente por no configurar en el hosting compartido de OVH, el dominio adicional con y sin www.

  2. Excelente post!
    Un SEO debería poder realizar un análisis básico de cualquier web usando nada más que un navegador, Google y algunos comandos.
    Como leí hace poco en el blog de JB Moreno, que dijo Señor Muñoz: «En España hay mucho SEO porque hay mucho WP». Yo diría que ahora igual hay mucho SEO que en realidad solo ‘es’ gracias a las herramientas que utiliza, si se las quitas ya no sabría que hacer.
    Esto lo veo un poco como aprender primero a sumar y multiplicar antes de usar una calculadora. Si todo lo hacemos con la calculadora desde el inicio podemos hacer el trabajo, pero necesitamos las bases para comprender qué está pasando ahí. Y si no tenemos esas bases y algún día se nos olvida la calcu… pues se verá lo (in)eficientes que somos.
    Un Saludo!

Los comentarios están cerrados.