{"id":4008,"date":"2017-07-13T17:17:27","date_gmt":"2017-07-13T17:17:27","guid":{"rendered":"https:\/\/www.mjcachon.com\/?p=4008"},"modified":"2021-05-31T16:00:05","modified_gmt":"2021-05-31T14:00:05","slug":"sitebulb-crawler-seo","status":"publish","type":"post","link":"https:\/\/laikateam.com\/blog\/sitebulb-crawler-seo\/","title":{"rendered":"Sitebulb: qu\u00e9 es y c\u00f3mo funciona este crawler SEO"},"content":{"rendered":"<p>De los creadores de <strong>URLProfiler<\/strong>, llega a nuestras vidas SEO otro software que dar\u00e1 mucho que hablar, se trata del crawler de escritorio <strong>SiteBulb (revisada la versi\u00f3n 1.0.11)<\/strong><br \/>\nEn su web&nbsp;<a href=\"https:\/\/sitebulb.com\/\">sitebulb.com<\/a>, enumera lo que para mi ya es una gran declaraci\u00f3n de intenciones:<\/p>\n<ul>\n<li><strong>Performance:&nbsp;<\/strong>auditor\u00eda de rendimiento y velocidad de carga, tanto desktop como mobile, con m\u00e9tricas de mucho valor (TTFB, Latencia, crawl depth, renderizado, y todo junto a recomendaciones de mejora&#8230;)<\/li>\n<li><strong>Indexaci\u00f3n:&nbsp;<\/strong>estado de la indexaci\u00f3n del sitio para detectar problem\u00e1ticas o zonas indexables con dificultades, manejo de robots.txt, detecci\u00f3n de errores en canonicals y meta robots,&#8230;<\/li>\n<li><strong>Internacional:&nbsp;<\/strong>podr\u00e1s validar el marcado hreflang para detectar si existen etiquetas que no cumplen los requisitos de reciprocidad o tiene c\u00f3digos inconsistentes, incluidos los sitemaps \ud83d\ude00&nbsp;Esta opci\u00f3n se ver\u00e1 en otro post \ud83d\ude42<\/li>\n<li><strong>Crawl:&nbsp;<\/strong>el crawler friendly que te ayuda a detectar problemas de rastreo, profundidad, cuellos de botella y dem\u00e1s aspectos ineficientes que pueden estar perjudicando tu proyecto (crawl map y uncrawled urls, son 2 de sus funciones top)<\/li>\n<li><strong>Internal urls:&nbsp;<\/strong>descubre todas&nbsp;las p\u00e1ginas y recursos del site a lo largo de la estructura web y podr\u00e1s obtener una lectura completa de c\u00f3mo se distribuyen las tipolog\u00edas de contenidos, a qu\u00e9 nivel de profundidad y con qu\u00e9 otros elementos, como paginaci\u00f3n.<\/li>\n<li><strong>Links<\/strong>:&nbsp;optimizar el flujo de enlazado interno, asegur\u00e1ndonos que potenciamos las p\u00e1ginas m\u00e1s importantes de nuestro proyecto, es el mantra de esta secci\u00f3n. Podr\u00e1s analizar enlaces rotos, con nofollow, redirigidos, por nivel de profundidad e incluso por tipolog\u00eda de p\u00e1gina&#8230;. muy potente!<\/li>\n<li><strong>On Page:&nbsp;<\/strong>en esta secci\u00f3n podr\u00e1s ahondar en toda la parte de contenidos y de etiquetados m\u00e1s conocidos en SEO, identificar errores o duplicidades, thin content y con otra feature chula, como es el grado de legibilidad de los contenidos y el an\u00e1lisis de sentimiento.<\/li>\n<li><strong>XML Sitemaps:&nbsp;<\/strong>mantener sitemaps limpios y ordenados, chequear el grado de indexaci\u00f3n de los sitemaps integrando Google Search Console.<\/li>\n<li><strong>Resources:&nbsp;<\/strong>todos los recursos y sus c\u00f3digos de respuesta o situaci\u00f3n en la que se encuentran, radiograf\u00eda de la salud del sitio.<\/li>\n<li><strong>AMP:&nbsp;<\/strong>otra novedad que les diferencia de otros crawlers, validar que las p\u00e1ginas AMP est\u00e1n funcionando correctamente o no, que son accesibles, rastreables e indexables, entre otras cosas. Esta opci\u00f3n se ver\u00e1 en otro post \ud83d\ude42<\/li>\n<li><strong>Search Traffic:&nbsp;<\/strong>\u00bfqu\u00e9 pasa cuando mezclas datos de crawleo con datos de tr\u00e1fico? Pues que sacas insights de mucho valor, como detectar p\u00e1ginas indexadas sin tr\u00e1fico.<\/li>\n<\/ul>\n<p>BOOM!<br \/>\nBueno, no me enrollo m\u00e1s por aqu\u00ed porque vamos a ver paso a paso qu\u00e9 funcionalidades trae consigo, usando la beta a la que hemos tenido acceso.<br \/>\nHere we go!<\/p>\n<h2>Configurando la auditor\u00eda del sitio con Sitebulb<\/h2>\n<p>Lo primero es lo primero, elegimos el nombre del proyecto y la url que queremos analizar.<br \/>\nCada vez que hagamos un crawleo, se guardar\u00e1 en nuestro proyecto, con la tremenda utilidad que tiene esto si tenemos proyectos recurrentes o trabajamos el SEO de alguna web mes a mes.<br \/>\nTambi\u00e9n es \u00fatil en el caso de migraciones, para controlar el antes y el despu\u00e9s.<br \/>\n<img class=\"alignnone wp-image-4009\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/crear-proyecto-sitebulb.png\" alt=\"crear proyecto sitebulb\" width=\"801\" height=\"243\"><br \/>\nUna vez le demos a \u00abSave and Continue\u00bb, la herramienta proceder\u00e1 a hacer un pre-audit y nos habilitar\u00e1 el tipo de audit que queremos realizar, pudiendo elegir entre:<\/p>\n<ul>\n<li><strong>Standard<\/strong>: para la mayor\u00eda de sitios<\/li>\n<li><strong>Sample<\/strong>: para sitios muy grandes, crawlear una muestra, o bien, la primera vez que crawleas un sitio y quieres echar un vistazo r\u00e1pido a los datos.<\/li>\n<\/ul>\n<p><img class=\"alignnone wp-image-4011\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/tipo-de-audit-sitebulb.png\" alt=\"tipo de audit sitebulb\" width=\"809\" height=\"460\"><br \/>\n<img class=\"alignnone wp-image-4012\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/conectar-gsc-sitebulb.png\" alt=\"conectar gsc sitebulb\" width=\"812\" height=\"337\"><br \/>\nY aqu\u00ed ya podemos hacer varias configuraciones b\u00e1sicas:<\/p>\n<ul>\n<li><strong>An\u00e1lisis de Site Speed<\/strong>, para obtener info de Performance (necesita tirar del Page Resource, tambi\u00e9n).<\/li>\n<li><strong>Mobile Friendly<\/strong>, para ver si las urls son bien renderizadas y obtener si son friendlys o no&nbsp;(necesita tirar del Site Speed y del Page Resource, tambi\u00e9n). Esto requiere elegir Javascript Crawl \ud83d\ude42<\/li>\n<li><strong>Page Resource<\/strong>: crawleo de todo, html, css, im\u00e1genes&#8230;<\/li>\n<li><strong>Amp Analysis<\/strong>: si sabes que no tienes AMP, pues no la marques \ud83d\ude42<\/li>\n<li><strong>International<\/strong>: \u00eddem que lo anterior, chequea implementaciones hreflang<\/li>\n<li><strong>XML Sitemaps<\/strong>: al marcarlo, la herramienta auto-detecta las urls correspondientes (por ejemplo del robots.txt) y te deja a\u00f1adir las que quieras de forma manual.<\/li>\n<li>De manera opcional puedes vincular <strong>Google Analytics y\/o Google Search Console<\/strong><\/li>\n<li><strong>Settings del crawler:<\/strong> tipo, tiempo del render, url por segundo y respetar (o no) las directivas meta robots.<\/li>\n<\/ul>\n<p>Con esto hecho, podemos pasar a configurar las opciones avanzadas:<br \/>\n<img class=\"alignnone wp-image-4013\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/configuracion-avanzada-sitebulb.png\" alt=\"configuracion avanzada sitebulb\" width=\"737\" height=\"400\"><br \/>\n<span style=\"text-decoration: underline;\">Pesta\u00f1a Crawler<\/span><\/p>\n<ul>\n<li>Limits:\n<ul>\n<li><strong>Maximum urls<\/strong>: limitamos al n\u00famero que queramos, o ponemos el n\u00famero cero, para indicar \u00abilimitadas\u00bb<\/li>\n<li><strong>Maximun Download size<\/strong>: tama\u00f1o m\u00e1ximo de descarga.<\/li>\n<li><strong>Maximum Crawl Depth<\/strong>: la profundidad m\u00e1xima de niveles a crawlear<\/li>\n<li><strong>Http Response Timout<\/strong>: antes de que un recurso solicitado responda timeout, el crawler esperar\u00e1 este tiempo.<\/li>\n<li><strong>Redirects to follow<\/strong>: n\u00famero m\u00e1ximo de redirecciones que el crawler seguir\u00e1<\/li>\n<li><strong>Analyse links<\/strong>: analizar\u00e1 enlaces internos de entrada y salida y sus textos ancla.<\/li>\n<li><strong>Check Subdomains Urls<\/strong>: chequear\u00e1 el status de urls de subdominios encontrados<\/li>\n<li><strong>Check External Urls<\/strong>: chequear\u00e1 el status de los links externos<\/li>\n<li><strong>Enable Cookies<\/strong>: se puede emular rastreo con cookies.<\/li>\n<\/ul>\n<\/li>\n<li>Included \/ Excluded Urls: para incluir o excluir patrones de urls, usando las mismas reglas que el robots.txt, sin tener que a\u00f1adir Disallow ni Allow, tan solo los path o patrones con wildcards que quieras restringir o permitir.<\/li>\n<li>Parameters: podemos excluir todas las urls con par\u00e1metros desde esta opci\u00f3n o indicar cu\u00e1les espec\u00edficamente no rastrear. Lo suyo es que si, por ejemplo, la paginaci\u00f3n se monta con par\u00e1metros, los rastreemos.<\/li>\n<li>Languages: para sitios internacionales que puedan redirigir por locale del navegador o por accept language, puede configurarse espec\u00edficamente esta opci\u00f3n.<\/li>\n<li>Proxy: si queremos hacer el rastreo con un proxy, pues podremos configurar en este punto los datos<\/li>\n<\/ul>\n<p><span style=\"text-decoration: underline;\">Pesta\u00f1a&nbsp;Authorization<\/span><\/p>\n<ul>\n<li>Http Authentication: para rastrear sitios protegidos con contrase\u00f1a, por ejemplo entornos de pre-prod<\/li>\n<\/ul>\n<p><span style=\"text-decoration: underline;\">Pesta\u00f1a&nbsp;Robots<\/span><\/p>\n<ul>\n<li>Respect Robots Directives: para respetar las etiquetas meta robots y canonical o no<\/li>\n<li>User Agent: para elegir qu\u00e9 user agent hace el rastreo<\/li>\n<li>Virtual Robots.txt: podemos usar el robots.txt actual del sitio a analizar o crear un robots.txt personalizado virtual contra el que lanzar el rastreo.<\/li>\n<\/ul>\n<h2>Resultados: View Audit<\/h2>\n<p>Tenemos un primer <strong>overview<\/strong> que ya act\u00faa de atajo para ir a otras secciones, con los datos de urls rastreadas, internas y externas, recursos y las urls no crawleadas, as\u00ed como los detalles de la configuraci\u00f3n usada. Clicando en \u00abView\u00bb, nos lleva a una tabla donde analizar esa informaci\u00f3n filtrada<br \/>\nTambi\u00e9n vemos 3 aspectos que solemos mirar en todos los proyectos SEO,&nbsp;si se hace una correcta devoluci\u00f3n de c\u00f3digos de error antes urls que no existen, la canonizaci\u00f3n de www y sin www, y de http y https.<br \/>\nLos datos acumulados<br \/>\n<img class=\"alignnone wp-image-4014\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/overview-sitebulb.png\" alt=\"overview sitebulb\" width=\"711\" height=\"354\"><br \/>\nEn esta misma pantalla de Overview tenemos otras subsecciones muy interesantes, con gr\u00e1ficos clicables que te llevan a la info filtrada en cada caso:<\/p>\n<ul>\n<li><strong>Crawled Urls by Depth<\/strong>: las urls crawleadas por nivel de navegaci\u00f3n, pasando el rat\u00f3n por encima de cualquier punto, nos da los datos acumulados por status code. Muy \u00fatil para ver de un vistazo si tenemos un buen flujo de enlazado interno para facilitar el rastreo.<\/li>\n<li><strong>Http Status Code<\/strong>: distribuci\u00f3n de status code total.<\/li>\n<li><strong>Urls Segments<\/strong>: tipolog\u00edas de p\u00e1ginas, internas, externas, recurso, amp, internacional&#8230;<\/li>\n<li><strong>Url Type by Depth<\/strong>: esta gr\u00e1fica me parece de mucho valor, pues tienes un desglose de tipo de contenido por nivel, ya que en otras herramientas \u00fanicamente arrastras el n\u00famero total de urls<\/li>\n<\/ul>\n<p><img class=\"alignnone wp-image-4019\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/url-type-depth-sitebulb.png\" alt=\"url type depth sitebulb\" width=\"718\" height=\"192\"><\/p>\n<ul>\n<li><strong>Html Url Source<\/strong>: este gr\u00e1fico tambi\u00e9n tiene valor de inter\u00e9s, pues te indica si las urls rastreadas est\u00e1n en sitemaps, en Analytics y en Search Console. De un vistazo \ud83d\ude42<\/li>\n<li><strong>Content Types<\/strong>: la distribuci\u00f3n de tipos de contenido que responden 200 OK, html, javascript, css, etc.<\/li>\n<\/ul>\n<p>Como estos m\u00f3dulos van a estar presentes en muchas de las secciones del dashboard, lo ilustraremos con im\u00e1genes seg\u00fan avancemos el post.<\/p>\n<h2>Internal<\/h2>\n<p>Tenemos summary y hints, siendo el primero el panel de uso de los datos y los gr\u00e1ficos, y Hints, los atajos con recomendaciones.<br \/>\nAs\u00ed, por ejemplo, estos son los hints sobre el an\u00e1lisis de mi propia web<br \/>\n<img class=\"alignnone wp-image-4015\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/internal-hints-sitebulb.png\" alt=\"internal hints sitebulb\" width=\"722\" height=\"175\"><br \/>\n38 enlaces rotos, si pincho en esa l\u00ednea me llevar\u00e1 a la tabla de links, con la url desde donde se enlazan para que los pueda corregir.<br \/>\nEn esta secci\u00f3n nos podemos detener en el Crawl Depth por Status Code, que es muy visual y podemos clicar en cualquier parte del gr\u00e1fico que nos llevar\u00e1 a la informaci\u00f3n filtrada, para consultar o descargar.<br \/>\n<img class=\"alignnone wp-image-4016\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/crawls-depth-sitebulb.png\" alt=\"crawls depth sitebulb\" width=\"728\" height=\"229\"><br \/>\nSe ven unas cuantas redirecciones en niveles algo m\u00e1s profundos, esto puede ser seguro por la doble migraci\u00f3n que hice de .es a .com y de http a https. Por lo que esto puede ser solo el principio de las cosas que faltan por pulir.<br \/>\nUn dato interesante aqu\u00ed tambi\u00e9n es el de las <strong>Orphaned Pages,&nbsp;<\/strong>p\u00e1ginas que no ha encontrado el crawler pero que existen dentro de la estructura.<br \/>\nEn el caso de mi web, con el nuevo dise\u00f1o, se generan muchas paginaciones que en algunos casos quedan muy profundas, y por otro lado, a la categorizaci\u00f3n del blog, que el redise\u00f1o ha provocado que no est\u00e9n enlazadas desde ninguna parte l\u00f3gica \ud83d\ude42<br \/>\n<img class=\"alignnone wp-image-4017\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/orphaned-pages-sitebulb.png\" alt=\"orphaned pages sitebulb\" width=\"738\" height=\"424\"><br \/>\nComentar tambi\u00e9n que los gr\u00e1ficos de Sitebulb pueden convertirse en tablas desde el bot\u00f3n \u00abMore\u00bb, o descargarlo en formato png, jpg, svg, desde el men\u00fa hamburguesa.<br \/>\nTambi\u00e9n muy interesante ver de d\u00f3nde ha obtenido el crawler las urls y la distribuci\u00f3n de la paginaci\u00f3n.<br \/>\n<img class=\"alignnone wp-image-4018\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/crawl-source-y-pagination-sitebulb.png\" alt=\"crawl source y pagination sitebulb\" width=\"452\" height=\"383\"><br \/>\nComo veis, hay p\u00e1ginas con tr\u00e1fico seg\u00fan Google Search Console, a las que el crawler no llega en su rastreo, raz\u00f3n m\u00e1s que suficiente como para analizar qu\u00e9 mejoras se pueden implementar.<br \/>\nPor otro lado, para un sitio de contenido con no muchas p\u00e1ginas, existe un % de paginaci\u00f3n excesivo. As\u00ed que el dise\u00f1o y el SEO, como veis, han de ir de la mano siempre.<br \/>\nAdicionalmente agrega la parte de HTTPs, algo tremendamente \u00fatil en estos tiempos que corren<br \/>\n<img class=\"alignnone  wp-image-4064\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/https-sitebulbe.png\" alt=\"https sitebulbe\" width=\"452\" height=\"214\"><\/p>\n<h2>Links<\/h2>\n<p>Aqu\u00ed tenemos&nbsp;el equivalente de Screaming Frog a <strong>\u00abInternal All\u00bb<\/strong>.<br \/>\nTenemos un \u00abOverview\u00bb con varias visualizaciones de la informaci\u00f3n, destacan<\/p>\n<ul>\n<li><strong>Incoming Internal Following Links<\/strong>: que muestra n\u00ba de enlaces y n\u00ba de p\u00e1ginas que enlazan, en rangos de menos a m\u00e1s. Por ejemplo, hay 9 urls que no reciben enlaces, que corresponden a secciones nuevas que a\u00fan no tengo muy desarrolladas en el sitio y no las hemos potenciado mucho con enlaces.<\/li>\n<\/ul>\n<p><img class=\"alignnone wp-image-4020\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/incoming-internal-sitebulb.png\" alt=\"incoming internal sitebulb\" width=\"781\" height=\"243\"><br \/>\n<img class=\"alignnone wp-image-4021\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/paginas-sin-enlazar-sitebulb.png\" alt=\"paginas sin enlazar sitebulb\" width=\"789\" height=\"322\"><\/p>\n<ul>\n<li><strong>Average Incoming Unique Internal Links<\/strong>: la media de enlaces internos que reciben las p\u00e1ginas por nivel de profundidad. Esto nos da un dato de mucho valor para entender nuestra arquitectura, desde el punto de vista de c\u00f3mo de lejos o cerca est\u00e1n los contenidos&nbsp;entre s\u00ed y si realmente estamos creando un flujo consistente de enlazado interno para facilitar el rastreo entre niveles.<\/li>\n<\/ul>\n<p><img class=\"alignnone wp-image-4022\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/average-internal-link-sitebulb.png\" alt=\"average internal link sitebulb\" width=\"793\" height=\"245\"><br \/>\nSin duda otra de las partes en las que hay mejoras muy evidentes, partiendo de la base que la web ahora no tiene ni Breadcrumb \ud83d\ude42<\/p>\n<ul>\n<li><strong>Non HTML Content Types Receiving Internal Followed Links<\/strong>: si tienes formatos no HTML que reciben enlaces, puedes estar potencialmente perdiendo esa distribuci\u00f3n interna del flujo de autoridad, page rank, filostros o como lo quieras llamar \ud83d\ude00<\/li>\n<\/ul>\n<p><img class=\"alignnone  wp-image-4065\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/non-html-follow-sitebulb.png\" alt=\"non html follow sitebulb\" width=\"791\" height=\"349\"><\/p>\n<ul>\n<li><strong>Unique Incoming Internal Links to HTML Pages:&nbsp;<\/strong>unido a la anterior, en esta gr\u00e1fica podemos tambi\u00e9n observar la distribuci\u00f3n de links internos por nivel, con datos de m\u00ednimo, m\u00e1ximo y la mediana. Ambas gr\u00e1ficas nos puede dar pistas de mucho valor para detectar carencias de enlazado y de estructura.<\/li>\n<\/ul>\n<p><img class=\"alignnone wp-image-4023\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/Unique-Incoming-Internal-Links-to-HTML-Pages-sitebulb.png\" alt=\"Unique Incoming Internal Links to HTML Pages sitebulb\" width=\"795\" height=\"244\"><br \/>\nY m\u00e1s all\u00e1 del Overview tenemos otras secciones como son Hints, Anchor Text y Top Pages, todo a nivel interno, se entiende.<br \/>\nLos <strong>Internal Hints<\/strong>, son los errores detectados que te los indica con colores de sem\u00e1foro, tal y como hacen otras tools en sus crawleos y proyectos (Semrush y Sistrix, por ejemplo).<br \/>\n<img class=\"alignnone wp-image-4024\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/internal-links-hints-sitebulb.png\" alt=\"internal links hints sitebulb\" width=\"559\" height=\"337\"><br \/>\nComo se puede observar, en esta lista hay acciones muy concretas para mejorar aspectos clave, como pueden ser:<\/p>\n<ul>\n<li>Links a urls no https: arrastrado de la migraci\u00f3n<\/li>\n<li>Links sin anchor text y no alt text<\/li>\n<li>Urls con pocos enlaces internos o ninguno<\/li>\n<li>Errores en los href<\/li>\n<\/ul>\n<p>Y las otras dos secciones, <strong>Anchor Text<\/strong> y Top Pages, pues son las secciones m\u00e1s enlazadas, por anchor y url. Sobra decir que una de las p\u00e1ginas m\u00e1s enlazadas en muchos sites es&#8230;..\u00a1el contacto!<br \/>\n<img class=\"alignnone wp-image-4025\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/anchortext-sitebulbs.png\" alt=\"anchortext sitebulbs\" width=\"425\" height=\"320\"><\/p>\n<h2>Redirects<\/h2>\n<p>En esta parte, tambi\u00e9n podemos observar el crawleo por niveles, con las tipolog\u00edas de redirecci\u00f3n que existen.<br \/>\nLa mayor\u00eda de redirecciones que se producen en los primeros niveles corresponden a recursos y a p\u00e1ginas externas.<br \/>\n<img class=\"alignnone wp-image-4026\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/redirects-sitebulb.png\" alt=\"redirects sitebulb\" width=\"726\" height=\"225\"><br \/>\n<img class=\"alignnone wp-image-4046\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/redirects-source-status-sitebulbs.png\" alt=\"redirects source status sitebulbs\" width=\"725\" height=\"152\"><br \/>\nSin duda esta secci\u00f3n puede ser muy interesante para hacer el seguimiento de una migraci\u00f3n, guardando los crawleos antes y despu\u00e9s.<br \/>\nSi nos detenemos en los \u00abHints\u00bb que ofrece la herramienta, vemos los problemas m\u00e1s urgentes o evidentes a los que meter mano<br \/>\n<img class=\"alignnone wp-image-4047\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/hints-redirection.png\" alt=\"hints redirection\" width=\"725\" height=\"255\"><br \/>\nEl segundo punto nos&nbsp;indica que tenemos unas cuantas urls redirigiendo a un 404, un big fail que solemos ver en muchos proyectos (incluso en nuestra propia web, como este caso).<\/p>\n<h2>Indexation<\/h2>\n<p>Una de las partes que m\u00e1s amigables pueden resultar, con un interfaz tan limpio y agrupando datos, podemos ver de un vistazo que tenemos una serie de p\u00e1ginas indexables y cu\u00e1les son no indexables.<br \/>\nEl check de rastreo para confirmar si la web es accesible para los distintos user agent, respetando la configuraci\u00f3n que hayamos establecido en los settings de robots.txt y la visualizaci\u00f3n del status de los canonical.<br \/>\nEn mi web, no se ha hecho mucho SEO y pr\u00e1cticamente no hay p\u00e1ginas no indexables, por ahora, aprovechando el an\u00e1lisis, podemos tomar decisiones para indexar solo aquello que realmente genere demanda org\u00e1nica.<br \/>\n<img class=\"alignnone wp-image-4027\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/indexation-overview-sitebulb.png\" alt=\"indexation overview sitebulb\" width=\"723\" height=\"356\"><br \/>\n<img class=\"alignnone wp-image-4028\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/indexation-status-sitebulb.png\" alt=\"indexation status sitebulb\" width=\"729\" height=\"195\"><br \/>\nPara seguir profundizando en gr\u00e1ficos \u00fatiles, tambi\u00e9n a\u00f1ade estas otras distribuciones por nivel:<\/p>\n<ul>\n<li><strong>Noindex by depth<\/strong><\/li>\n<\/ul>\n<p><img class=\"alignnone  wp-image-4067\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/noindex-sitebulb-visual.png\" alt=\"noindex sitebulb visual\" width=\"721\" height=\"214\"><\/p>\n<ul>\n<li><strong>Disallowed by depth<\/strong><\/li>\n<\/ul>\n<p><img class=\"alignnone  wp-image-4066\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/disallow-index-sitebulb.png\" alt=\"disallow index sitebulb\" width=\"724\" height=\"218\"><\/p>\n<ul>\n<li><strong>Canonicalization by depth<\/strong><\/li>\n<\/ul>\n<p><img class=\"alignnone  wp-image-4068\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/canonical-index-sitebulb.png\" alt=\"canonical index sitebulb\" width=\"722\" height=\"216\"><br \/>\nTambi\u00e9n podemos observar la indexaci\u00f3n por nivel de profundidad del rastreo, quiz\u00e1s ser\u00eda interesante tambi\u00e9n tenerlo por tipo de contenido<br \/>\n<img class=\"alignnone wp-image-4029\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/canonical-hints-sitebulb.png\" alt=\"canonical hints sitebulb\" width=\"734\" height=\"222\"><br \/>\nComo en el resto de secciones, tenemos los Hints agrupados en este caso por Robots y por Canonical, donde se ve que no hay discrepancias ni errores actualmente.<br \/>\nSalvo algunas p\u00e1ginas que est\u00e1n recibiendo enlaces follow y no follow, algo que es contradictorio para las se\u00f1ales que le indicamos a Google, que podremos analizar m\u00e1s a fondo pulsando en View<br \/>\n<img class=\"alignnone wp-image-4030\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/robots-hints-sitebulb.png\" alt=\"robots hints sitebulb\" width=\"737\" height=\"185\"><br \/>\nNos mostrar\u00e1 la tabla de los 183 casos en los que se enlazan con follow y nofollow internamente, y esto me viene perfecto para mostrar otra funcionalidad m\u00e1s concreta, pulsando a nivel de url, nos habilita la informaci\u00f3n individual de esa url.<br \/>\n<img class=\"alignnone wp-image-4055\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/veiw-nofollow-sitebulb.png\" alt=\"veiw nofollow sitebulb\" width=\"738\" height=\"187\"><br \/>\nComo veis en este ejemplo, el contenido ha sido encontrado por el crawler gracias a la paginaci\u00f3n, un punto interesante a tener en cuenta para un blog, donde los contenidos van qued\u00e1ndose lejos o profundos, respecto a la home.<br \/>\nLas pesta\u00f1as que se ven arriba del todo de la imagen, son las que nos van a permitir saber desde qu\u00e9 lugares nos han enlazado con nofollow y sin \u00e9l.<br \/>\n<img class=\"alignnone wp-image-4056\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/analisis-url-individual.png\" alt=\"analisis url individual\" width=\"740\" height=\"481\"><br \/>\nEn este caso, los nofollow est\u00e1n ubicados en los links de \u00abresponder\u00bb en la zona de comentarios, que se montan con un par\u00e1metro ?repyto y un #respond.<br \/>\n<img class=\"alignnone wp-image-4057\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/incoming-links-url-sitebulb.png\" alt=\"incoming links url sitebulb\" width=\"736\" height=\"200\"><\/p>\n<h2>On Page<\/h2>\n<p>El m\u00f3dulo on page est\u00e1 centrado en contenidos, el an\u00e1lisis de legibilidad y sentimiento de los mismos, y por otro lado, en la parte m\u00e1s de relevancia y visibilidad, es decir, lo que tiene que ver con titles y description y su status.<br \/>\n<img class=\"alignnone wp-image-4033\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/overview-content-on-page-sitebulb.png\" alt=\"overview content on page sitebulb\" width=\"736\" height=\"426\"><br \/>\nEste primer overview de Word Count nos indica el volumen de urls que tienen entre 1 y 25 palabras, entre 26-50, etc.<br \/>\nCon este gr\u00e1fico, de un vistazo, observamos la extensi\u00f3n de contenidos del proyecto,&nbsp;dependiendo de la web que analic\u00e9is y su naturaleza de contenidos, pues los tramos ser\u00e1n m\u00e1s o menos relevantes.<br \/>\nProyectos de contenidos, quiz\u00e1s tendr\u00e1n los \u00faltimos tramos con mayor concentraci\u00f3n de urls, sin embargo si pensamos en webs de clasificados, con textos cortos en los listados, quiz\u00e1s est\u00e9n m\u00e1s concentrados en los tramos del centro.<br \/>\nTambi\u00e9n de un solo vistazo podemos ver el diagn\u00f3stico general en lo que a etiquetas se refiere, si tenemos duplicados o no.<br \/>\n<img class=\"alignnone wp-image-4032\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/sentiment-sitebulb.png\" alt=\"sentiment sitebulb\" width=\"737\" height=\"157\"><br \/>\nProfundizando m\u00e1s en la legibilidad , nos indica el grado de dificultad del texto, bas\u00e1ndose en <a href=\"https:\/\/yoast.com\/flesch-reading-ease-score\/\" target=\"_blank\" rel=\"noopener noreferrer\">el mismo test que usa Yoast<\/a>. Para el lado de sentimiento, se basa en&nbsp;AFINN-111, clasifica las palabras de un texto contra el index de palabras en ingl\u00e9s del lexicon, para determinar el tono o sentimiento, entre -5 y 5, de muy negativo a muy positivo, pasando por negativo, neutral y positivo.<br \/>\nPeeeeeero lamentablemente solo aplica a ingl\u00e9s todav\u00eda, as\u00ed que esperemos que en pr\u00f3ximas versiones, pueda tener aplicaci\u00f3n para el mercado e idioma hispano.<br \/>\n<img class=\"alignnone wp-image-4031\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/html-hints-sitebulbs.png\" alt=\"html hints sitebulbs\" width=\"730\" height=\"185\"><br \/>\nComo a lo largo de toda la herramienta, siempre tenemos la secci\u00f3n Hints, para tener quick wins o atajos para resolver lo m\u00e1s prioritario, como por ejemplo, alertas sobre el c\u00f3digo de Analytics o urls en iframes.<br \/>\nMuy TOP que divida los hints ente urls Indexables y No Indexables, para priorizar los cambios en las landings de valor SEO<\/p>\n<h2>Site Speed<\/h2>\n<p>Otra de las joyas de la corona es el informe de rendimiento o performance. Ya con ver todo rojo, me queda muy clara cu\u00e1l es la asignatura pendiente de mi humilde web.<br \/>\nA pesar de obtener score digno de Speed, el resto de m\u00e9tricas dan un poco de miedo, pero hay que fijarse que son los peores datos de todo el crawleo.<br \/>\nEl gr\u00e1fico de TTFB y de Download Time, ya te dan el agregado y en los tramos, sigue habiendo drama pero hay un peque\u00f1o remanso de esperanza, con ciertos contenidos que si se descargan de forma veloz.<br \/>\n<img class=\"alignnone wp-image-4034\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/site-speed-overview-sitebulb.png\" alt=\"site speed overview sitebulb\" width=\"731\" height=\"475\"><br \/>\n<img class=\"alignnone  wp-image-4069\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/download-time-sitebulb.png\" alt=\"download time sitebulb\" width=\"728\" height=\"217\"><br \/>\nEl gr\u00e1fico por profundidad de niveles, tambi\u00e9n es una gran bofetada de realidad y mal rendimiento, por lo que a grandes rasgos, solo podemos mejorar y la siguiente vez que crawleemos el proyecto, comparar las mejoras.<br \/>\n<img class=\"alignnone wp-image-4035\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/urls-hints-sitebulb.png\" alt=\"urls hints sitebulb\" width=\"733\" height=\"261\"><br \/>\nLos hints a nivel de urls, concreta recomendaciones en masa y nos permite ver qu\u00e9 p\u00e1ginas tienen cada problem\u00e1tica. Por ejemplo muchas peticiones de CSS o JS, cosa a revisar por afectar a 177 urls.<br \/>\n<img class=\"alignnone wp-image-4036\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/resources-hints-sitebulb.png\" alt=\"resources hints sitebulb\" width=\"735\" height=\"191\"><br \/>\nA nivel de recursos, pues tenemos aspectos m\u00e1s globales de compresi\u00f3n u optimizaci\u00f3n generales.<\/p>\n<h2>Search Traffic<\/h2>\n<p>Otro valor diferencial respecto a otras tools, es que podemos sacar el bistur\u00ed y detectar de forma muy r\u00e1pida las p\u00e1ginas que no est\u00e1n recibiendo tr\u00e1fico org\u00e1nico en la franja elegida al conectar GSC o GA.<br \/>\nSe observa un volumen alto de urls que no generan ning\u00fan tr\u00e1fico, concentr\u00e1ndose la mayor\u00eda de tr\u00e1fico en pocas urls, cosa que en muchos proyectos, puede ser normal.<br \/>\nEs muy \u00fatil el gr\u00e1fico de abajo, para saber si no tenemos tr\u00e1fico por cuestiones de tener urls no indexables. Como se ve en este caso, no es as\u00ed, ya que los contenidos est\u00e1n indexados, pero por el motivo que sea, no reciben tr\u00e1fico:<\/p>\n<ul>\n<li>Contenidos antiguos u obsoletos que no hemos reciclado, optimizado ni borrado.<\/li>\n<li>Contenidos no optimizados o no orientados a sus topic objetivo<\/li>\n<\/ul>\n<p><img class=\"alignnone wp-image-4037\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/organic-traficc-sitebulbs.png\" alt=\"organic traficc sitebulbs\" width=\"734\" height=\"471\"><br \/>\nEn esta secci\u00f3n, los Hints son especialmente interesantes, sobre todo porque te distingue entre mobile, desktop y tablet, lo cu\u00e1l mola bastante para orientar correctamente a los distintos dispositivos, en base a nuestra audiencia y objetivo.<br \/>\n(A ponerse las pilas antes de que llegue el mobile first index, que luego a saber \ud83d\ude00 )<br \/>\n<img class=\"alignnone wp-image-4058\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/hints-search-traffic-sitebulb.png\" alt=\"hints search traffic sitebulb\" width=\"734\" height=\"330\"><\/p>\n<h2>Sitemap<\/h2>\n<p>Esta opci\u00f3n tambi\u00e9n la echaba de menos en otras herramientas y es que nos hemos hinchado a cruzar urls del sitemap con urls indexadas y tr\u00e1fico, para analizar qu\u00e9 estaba pasando con la indexaci\u00f3n y la visibilidad final de las p\u00e1ginas top.<br \/>\nEn esta secci\u00f3n por tanto podemos observar que no est\u00e1n agregadas todas las urls indexables al sitemap, principalmente solo se han a\u00f1adido las del sitemap \u00abpage\u00bb, por lo que los post del blog (la mayor\u00eda de urls de este site), no est\u00e1n a\u00f1adidas.<br \/>\nEl paso de .es a .com, nos ha trastocado las mentes y no hemos actualizado ni el robots.txt, \u00a1as\u00ed somos!<br \/>\n<img class=\"alignnone wp-image-4038\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/sitemap-sitebulb.png\" alt=\"sitemap sitebulb\" width=\"738\" height=\"415\"><br \/>\nSi vemos el resto de opciones del panel, nos indica el status de los sitemaps, si tienen o no errores, y la info que cruza con GSC, todo en la misma pantalla, facilita bastante, la verdad \ud83d\ude42<br \/>\n<img class=\"alignnone wp-image-4059\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/sitemaps-sitebulb.png\" alt=\"sitemaps sitebulb\" width=\"732\" height=\"243\"><br \/>\nLo dicho, no hemos enlazado los sitemaps bien en robots.txt y el sitemap de post, tiene errores en su construcci\u00f3n, la mejora m\u00e1s f\u00e1cil de implementar, \u00a1gracias Sitebulb!<\/p>\n<h2>External<\/h2>\n<p>Llegando al final \ud83d\ude00<br \/>\nLos enlaces y recursos externos, nos lo resume en el t\u00edpico gr\u00e1fico de niveles de profundidad, para saber d\u00f3nde hay m\u00e1s contenidos redirigidos o rotos, externos al proyecto analizado.<br \/>\nEn mi caso, sigo arrastrando urls de mi dominio antiguo, as\u00ed que muchos de los 892 redirects, son de mi enlazado interno sin optimizar (otra colleja para mi), en otros casos, se observa que muchos de los sites enlazados en los \u00faltimos a\u00f1os, desaparecieron o han pasado a https, es curioso \ud83d\ude00<br \/>\n<img class=\"alignnone wp-image-4039\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/external-sitebulb.png\" alt=\"external sitebulb\" width=\"737\" height=\"359\"><br \/>\nEn cualquier caso, salvo los casos que vienen de mi propio dominio .es, estos los voy a poner en el \u00faltimo lugar de la lista, hasta que no arregle el resto de cosas que estoy sacando de esta audit.<\/p>\n<h2>All Hints<\/h2>\n<p>Despu\u00e9s de repasar todas las secciones de la herramienta, si quisi\u00e9ramos ir directamente al grano, a las recomendaciones y sugerencias que nos da Sitebulb, podemos acceder al listado completo de Hints, separados por secciones.<br \/>\nComo veis, es una forma r\u00e1pida y \u00e1gil de ir atajando problem\u00e1ticas SEO.<br \/>\n<img class=\"alignnone wp-image-4040\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/all-hints-sitebulbs.png\" alt=\"all hints sitebulbs\" width=\"741\" height=\"465\"><\/p>\n<h2>Crawl Map<\/h2>\n<p>Y para el final dejamos el mapa de rastreo que hace, con todos los nodos representados visualmente, y si nos posamos encima de alguno, nos da info de profundidad, enlaces internos recibidos y las urls que contin\u00faan descendiendo en la jerarqu\u00eda.<br \/>\nEl gr\u00e1fico se puede ampliar o alejar e incluso, puedes ir moviendo los nodos y el resto de nodos acompa\u00f1an y amoldan su posici\u00f3n.<br \/>\n<del>No hay forma de descargar o no la he visto al menos, pero<\/del> puede ser interesante para representar el rastreo de ciertas zonas de un site y justificar mejoras de enlazado interno \ud83d\ude42<br \/>\n<img class=\"alignnone wp-image-4042\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/crawl-map-con-datos.png\" alt=\"crawl map con datos\" width=\"746\" height=\"435\"><br \/>\n&nbsp;<\/p>\n<h2><img class=\"alignnone  wp-image-4070\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/descargar-crawl-map-sitebulb.png\" alt=\"descargar crawl map sitebulb\" width=\"711\" height=\"413\"><\/h2>\n<h2>Otras funcionalidades interesantes para usar Sitebulb<\/h2>\n<ul>\n<li>Gr\u00e1ficos clicables, que filtran la informaci\u00f3n<\/li>\n<li>Informes espec\u00edficos por secci\u00f3n<\/li>\n<li>Hints por secci\u00f3n<\/li>\n<li>Buscador libre<\/li>\n<li>Descargas del crawleo<\/li>\n<\/ul>\n<p><img class=\"alignnone wp-image-4043\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/descargas-de-datos-sitebulb.png\" alt=\"descargas de datos sitebulb\" width=\"328\" height=\"177\"><\/p>\n<ul>\n<li>Filtros en las tablas de datos<\/li>\n<\/ul>\n<p><img class=\"alignnone wp-image-4045\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/filtros-de-datos.png\" alt=\"filtros de datos\" width=\"646\" height=\"326\"><\/p>\n<ul>\n<li>Cambiar el orden por columnas, en las tablas de datos<\/li>\n<\/ul>\n<p><img class=\"alignnone wp-image-4044\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/ordenar-por-clumna.png\" alt=\"ordenar por clumna\" width=\"348\" height=\"49\"><br \/>\nPues con todo esto, podemos dar por MUY BUENA y digna, esta primera versi\u00f3n de Sitebulb, y eso que a\u00fan nos quedar\u00eda un segundo post para analizar la parte Mobile, AMP e Internacional.<br \/>\n\u00a1Espero que este tocho os sea de utilidad!<\/p>\n","protected":false},"excerpt":{"rendered":"<p>De los creadores de URLProfiler, llega a nuestras vidas SEO otro software que dar\u00e1 mucho que hablar, se trata del crawler de escritorio SiteBulb (revisada la versi\u00f3n 1.0.11) En su web&nbsp;sitebulb.com, enumera lo que para mi ya es una gran declaraci\u00f3n de intenciones: Performance:&nbsp;auditor\u00eda de rendimiento y velocidad de carga, tanto desktop como mobile, con<\/p>\n","protected":false},"author":2,"featured_media":6534,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[3],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v16.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Sitebulb: qu\u00e9 es y c\u00f3mo funciona este crawler SEO - MJ Cach\u00f3n SEO<\/title>\n<meta name=\"description\" content=\"Sitebulb, crawler SEO de los creadores de UrlProfiler. Repaso por la herramienta y consejos para interpretar la info que da, para convertirla en mejoras SEO\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/laikateam.com\/blog\/sitebulb-crawler-seo\/\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Sitebulb: qu\u00e9 es y c\u00f3mo funciona este crawler SEO - MJ Cach\u00f3n SEO\" \/>\n<meta property=\"og:description\" content=\"Sitebulb, crawler SEO de los creadores de UrlProfiler. Repaso por la herramienta y consejos para interpretar la info que da, para convertirla en mejoras SEO\" \/>\n<meta property=\"og:url\" content=\"https:\/\/laikateam.com\/blog\/sitebulb-crawler-seo\/\" \/>\n<meta property=\"og:site_name\" content=\"LaikaTeam\" \/>\n<meta property=\"article:published_time\" content=\"2017-07-13T17:17:27+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2021-05-31T14:00:05+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2017\/07\/sitebulb-que-es.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1920\" \/>\n\t<meta property=\"og:image:height\" content=\"1080\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@laikateam_es\" \/>\n<meta name=\"twitter:site\" content=\"@laikateam_es\" \/>\n<meta name=\"twitter:label1\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data1\" content=\"20 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Organization\",\"@id\":\"https:\/\/laikateam.com\/blog\/#organization\",\"name\":\"Laika\",\"url\":\"https:\/\/laikateam.com\/blog\/\",\"sameAs\":[\"https:\/\/www.instagram.com\/laika_team\",\"https:\/\/www.linkedin.com\/company\/laika-team\/\",\"https:\/\/twitter.com\/laikateam_es\"],\"logo\":{\"@type\":\"ImageObject\",\"@id\":\"https:\/\/laikateam.com\/blog\/#logo\",\"inLanguage\":\"es\",\"url\":\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2021\/06\/logo-laika.png\",\"contentUrl\":\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2021\/06\/logo-laika.png\",\"width\":318,\"height\":350,\"caption\":\"Laika\"},\"image\":{\"@id\":\"https:\/\/laikateam.com\/blog\/#logo\"}},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/laikateam.com\/blog\/#website\",\"url\":\"https:\/\/laikateam.com\/blog\/\",\"name\":\"LaikaTeam\",\"description\":\"Strategic &amp; SEO Consulting\",\"publisher\":{\"@id\":\"https:\/\/laikateam.com\/blog\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":\"https:\/\/laikateam.com\/blog\/?s={search_term_string}\",\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"es\"},{\"@type\":\"ImageObject\",\"@id\":\"https:\/\/laikateam.com\/blog\/sitebulb-crawler-seo\/#primaryimage\",\"inLanguage\":\"es\",\"url\":\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2017\/07\/sitebulb-que-es.jpg\",\"contentUrl\":\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2017\/07\/sitebulb-que-es.jpg\",\"width\":1920,\"height\":1080},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/laikateam.com\/blog\/sitebulb-crawler-seo\/#webpage\",\"url\":\"https:\/\/laikateam.com\/blog\/sitebulb-crawler-seo\/\",\"name\":\"Sitebulb: qu\\u00e9 es y c\\u00f3mo funciona este crawler SEO - MJ Cach\\u00f3n SEO\",\"isPartOf\":{\"@id\":\"https:\/\/laikateam.com\/blog\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/laikateam.com\/blog\/sitebulb-crawler-seo\/#primaryimage\"},\"datePublished\":\"2017-07-13T17:17:27+00:00\",\"dateModified\":\"2021-05-31T14:00:05+00:00\",\"description\":\"Sitebulb, crawler SEO de los creadores de UrlProfiler. Repaso por la herramienta y consejos para interpretar la info que da, para convertirla en mejoras SEO\",\"breadcrumb\":{\"@id\":\"https:\/\/laikateam.com\/blog\/sitebulb-crawler-seo\/#breadcrumb\"},\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/laikateam.com\/blog\/sitebulb-crawler-seo\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/laikateam.com\/blog\/sitebulb-crawler-seo\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Portada\",\"item\":\"https:\/\/laikateam.com\/blog\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Sitebulb: qu\\u00e9 es y c\\u00f3mo funciona este crawler SEO\"}]},{\"@type\":\"Article\",\"@id\":\"https:\/\/laikateam.com\/blog\/sitebulb-crawler-seo\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/laikateam.com\/blog\/sitebulb-crawler-seo\/#webpage\"},\"author\":{\"@id\":\"https:\/\/laikateam.com\/blog\/#\/schema\/person\/57bc6c6ac096e3437e2261bf39255923\"},\"headline\":\"Sitebulb: qu\\u00e9 es y c\\u00f3mo funciona este crawler SEO\",\"datePublished\":\"2017-07-13T17:17:27+00:00\",\"dateModified\":\"2021-05-31T14:00:05+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/laikateam.com\/blog\/sitebulb-crawler-seo\/#webpage\"},\"wordCount\":3937,\"commentCount\":9,\"publisher\":{\"@id\":\"https:\/\/laikateam.com\/blog\/#organization\"},\"image\":{\"@id\":\"https:\/\/laikateam.com\/blog\/sitebulb-crawler-seo\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2017\/07\/sitebulb-que-es.jpg\",\"articleSection\":[\"Herramientas\"],\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\/\/laikateam.com\/blog\/sitebulb-crawler-seo\/#respond\"]}]},{\"@type\":\"Person\",\"@id\":\"https:\/\/laikateam.com\/blog\/#\/schema\/person\/57bc6c6ac096e3437e2261bf39255923\",\"name\":\"MJ Cachon\",\"image\":{\"@type\":\"ImageObject\",\"@id\":\"https:\/\/laikateam.com\/blog\/#personlogo\",\"inLanguage\":\"es\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/4f93a22677b533182414d91829674844?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/4f93a22677b533182414d91829674844?s=96&d=mm&r=g\",\"caption\":\"MJ Cachon\"},\"sameAs\":[\"https:\/\/www.laikateam.com\/\"],\"url\":\"https:\/\/laikateam.com\/blog\/author\/mj-cachon\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","_links":{"self":[{"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/posts\/4008"}],"collection":[{"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/comments?post=4008"}],"version-history":[{"count":2,"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/posts\/4008\/revisions"}],"predecessor-version":[{"id":6535,"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/posts\/4008\/revisions\/6535"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/media\/6534"}],"wp:attachment":[{"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/media?parent=4008"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/categories?post=4008"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/tags?post=4008"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}