{"id":2913,"date":"2016-03-29T00:32:08","date_gmt":"2016-03-28T22:32:08","guid":{"rendered":"https:\/\/www.mjcachon.com\/?p=2913"},"modified":"2021-05-31T16:31:47","modified_gmt":"2021-05-31T14:31:47","slug":"indexacion-bulk","status":"publish","type":"post","link":"https:\/\/laikateam.com\/blog\/indexacion-bulk\/","title":{"rendered":"Comprobar la indexaci\u00f3n en bulk"},"content":{"rendered":"<p>Comprobar si est\u00e1n indexadas un mont\u00f3n de urls, de una sola vez, implicaba hace tiempo, tener que replicar comandos como site: o como info:, o bien, tratar de automatizar la tarea con otros m\u00e9todos no del todo r\u00fasticos.<br \/>\nDesde que conocimos una gran herramienta, desde este humilde blog no nos cansamos de contar <a href=\"https:\/\/www.mjcachon.com\/blog\/url-profiler\/\">cosas \u00fatiles que se pueden hacer con URLProfiler<\/a>.<br \/>\nEn esta ocasi\u00f3n, queremos compartir una funcionalidad super \u00fatil, como es la que describe el t\u00edtulo del post: la forma de chequear la indexaci\u00f3n, en masa, o bulk, de un montonazo de urls, de una sola vez.<\/p>\n<h2>Lo que no se indexa, no tiene posibilidad de ser visible<\/h2>\n<p>Lo ideal en cualquier proyecto, es tener un control de la indexaci\u00f3n, para fomentar que los contenidos m\u00e1s importantes o relevantes a nivel org\u00e1nico, est\u00e9n indexados y sean encontrables.<br \/>\nEn este sentido, es muy importante a efectos de hacer m\u00e1s eficiente el proyecto, que aquellos contenidos sin demanda org\u00e1nica, no figuren con las mismas opciones de rastreo e indexaci\u00f3n que los que si tienen dicha demanda org\u00e1nica.<br \/>\nDe formas de indexar nuevas urls o contenidos, habr\u00e9is oido hablar millones de veces y no es el objeto de este post, sin embargo, desde la implantaci\u00f3n de Caffeine, no suele haber demasiado problema en conseguir indexar contenidos, como normal general.<br \/>\nSi bien es cierto, existen muchas casu\u00edsticas que pueden hacer ineficiente este hecho, y que a pesar que Googlebot est\u00e9 rastreando el contenido, no lo est\u00e9 indexando, y aqu\u00ed si mencionamos los m\u00e9todos disponibles para que un contenido se indexe:<\/p>\n<ul>\n<li>Enlaces: tanto internos como externos, de ese modo puede ser descubierto<\/li>\n<li>Instrucciones: tanto en robots.txt como en meta robots y canonical, debe ser accesible por googlebot y abierto a que pueda ser indexado.<\/li>\n<li>Enviar por Google Search Console: esta opci\u00f3n es bastante directa y suele estar indexada pr\u00e1cticamente al momento, en casi todos los casos.<\/li>\n<li>Sitemap: este caso no garantiza que se indexe, pero si es una forma de ayudarle a descubrir nuevas urls y contenidos<\/li>\n<\/ul>\n<p>Dicho todo esto, ahora nos podemos ver en muchas situaciones, yo os comento una que nos ha ocurrido y viene de un hackeo a una web y la consiguiente p\u00e9rdida de \u00abconfianza\u00bb por parte de Google, que cada vez ha ido rastreando menos esta web y sigue con dificultades para \u00abpasar m\u00e1s\u00bb por all\u00ed.<br \/>\nDespu\u00e9s de haber estado rastreando urls \u00abbasura\u00bb durante meses, la generaci\u00f3n de nuevos contenidos y la consecuci\u00f3n de enlaces externos para ganar m\u00e1s autoridad, a\u00fan no est\u00e1 siendo suficiente para devolverle al sitio que estaba antes de ser hackeado.<\/p>\n<h2>Preparar urls antes de comprobar si est\u00e1n indexadas<\/h2>\n<p>Podemos usar Screaming Frog<strong>&nbsp;<\/strong>para tener la informaci\u00f3n que queremos recabar, de todas las urls de los post del blog antes de comprobar si est\u00e1n o no indexados:<\/p>\n<ul>\n<li>URL<\/li>\n<li>Etiqueta Meta Robots<\/li>\n<li>Etiqueta Meta Canonical<\/li>\n<li>Status Code<\/li>\n<\/ul>\n<p>Podemos extraer usando la opci\u00f3n <strong>\u00abInclude\u00bb de Screaming Frog<\/strong>, con el siguiente aspecto:<br \/>\nhttp:\/\/www.<strong>dominio<\/strong>.es\/blog\/.*<br \/>\nCon esta sencilla expresi\u00f3n, estaremos analizando ese path en concreto.<br \/>\n<a href=\"https:\/\/www.mjcachon.com\/wp-content\/uploads\/2016\/03\/include-screaming-frog-mjcachon.png\" rel=\"attachment wp-att-2914\"><img class=\"alignnone wp-image-2914 size-medium\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/include-screaming-frog-mjcachon-300x73.png\" alt=\"include screaming frog - mjcachon\" width=\"300\" height=\"73\"><\/a><br \/>\nO bien, analizando en modo Lista, el sitemap de post de dicho blog.<br \/>\nY una vez analizados los post, vamos a usar el \u00abexport\u00bb para obtener las p\u00e1ginas html en formato csv tal y como se muestra en la imagen<br \/>\n<a href=\"https:\/\/www.mjcachon.com\/wp-content\/uploads\/2016\/03\/exportar-internal-html-csv.png\" rel=\"attachment wp-att-2915\"><img class=\"alignnone wp-image-2915 size-medium\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/exportar-internal-html-csv-300x168.png\" alt=\"exportar internal html csv\" width=\"300\" height=\"168\"><\/a><br \/>\n&nbsp;<\/p>\n<h2>Necesitamos configurar proxies&nbsp;en URLProfiler<\/h2>\n<p>Para hacer una tarea que va a hacer peticiones repetitivas directamente a Google, necesitamos usar Proxies y evitar que nos baneen la IP o que la informaci\u00f3n que recoja URLProfiler sea inconexa.<br \/>\nPor tanto, una vez en el interfaz de la herramienta, desde \u00abSettings\u00bb, la pesta\u00f1a \u00abProxies\u00bb nos dejar\u00e1 configurar r\u00e1pidamente este punto<br \/>\n&nbsp;<\/p>\n<h2><a href=\"https:\/\/www.mjcachon.com\/wp-content\/uploads\/2016\/03\/proxies-urlprofiler.png\" rel=\"attachment wp-att-2916\"><img class=\"alignnone wp-image-2916\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/proxies-urlprofiler-1024x794.png\" alt=\"proxies urlprofiler\" width=\"613\" height=\"475\"><\/a><\/h2>\n<p>El formato a usar es&nbsp;IP:PORT (por ejemplo 123.212.12.124:8008)<br \/>\nComo veis, hay otras opciones que la herramienta te sugiere, para usar con proxies, como son peticiones que pueden ser repetitivas y saturar a Google o a un servidor de una web que est\u00e9s analizando.<\/p>\n<h2>Importar archivo de Screaming en URLProfiler<\/h2>\n<p>Ahora podemos coger nuestro archivo de Screaming, el csv que sacamos con urls del blog y sus etiquetas principales, para poder chequear, con un contexto apropiado, si est\u00e1n o no indexadas.<br \/>\n\u00bfSe nos olvida algo hasta aqu\u00ed? Quiz\u00e1s ser\u00eda \u00fatil tener alg\u00fan dato m\u00e1s:<\/p>\n<ul>\n<li>Enlaces externos<\/li>\n<li>Fecha del \u00faltimo cach\u00e9 de Google<\/li>\n<li>Autoridad<\/li>\n<\/ul>\n<p><a href=\"https:\/\/www.mjcachon.com\/wp-content\/uploads\/2016\/03\/metricas-extra-urlprofiler.png\" rel=\"attachment wp-att-2917\"><img class=\"alignnone wp-image-2917\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/metricas-extra-urlprofiler-1024x878.png\" alt=\"metricas extra urlprofiler\" width=\"542\" height=\"465\"><\/a><br \/>\nComo veis, la herramienta nos va a recopilar informaci\u00f3n de Enlaces Entrantes, usando conexi\u00f3n a&nbsp;Majestic, URLProfiler nos ofrecer\u00e1 500 peticiones al d\u00eda, al igual que el caso de Moz, por tanto, en este caso solo necesitar\u00edamos estar pagando URLProfiler para acceder a las 3 fuentes de datos \ud83d\ude42<br \/>\nY dado que las urls a analizar est\u00e1n bajo el mismo dominio, todas las m\u00e9tricas que vamos a agregar desde Urlprofiler son a nivel de URL (URL Level Data), pero imaginad que hac\u00e9is el an\u00e1lisis de una lista de dominios diferentes, las m\u00e9tricas deber\u00edan ser a nivel de Dominio (Domain Level Data), que es la franja superior.<br \/>\nDespu\u00e9s de todo esto, ya podemos importar el archivo de Screaming Frog, tan solo usando el bot\u00f3n derecho en el panel derecho, nos activar\u00e1 estas opciones<br \/>\n<a href=\"https:\/\/www.mjcachon.com\/wp-content\/uploads\/2016\/03\/url-list-en-urlsprofiler.png\" rel=\"attachment wp-att-2918\"><img class=\"alignnone wp-image-2918 size-medium\" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/url-list-en-urlsprofiler-172x300.png\" alt=\"url list en urlsprofiler\" width=\"172\" height=\"300\"><\/a><br \/>\nComo veis ahora, no har\u00eda falta el formato de Screaming expl\u00edcitamente, sino que podr\u00edamos subir otros archivos e incluso fusionarlos, pero elegiremos la opci\u00f3n de Screaming que ya lo tenemos hecho.<br \/>\nRelax, puesto que si hemos puesto bastantes urls (y otras tantas m\u00e9tricas), le llevar\u00e1 su tiempo reunir todos los datos, y ya sabes, cuantos m\u00e1s proxies mejor \ud83d\ude09<\/p>\n<h2>Interpretar datos de Indexaci\u00f3n de Urlprofiler<\/h2>\n<p>Urlprofiler nos dar\u00e1 un archivo Excel con la pesta\u00f1a de datos de indexaci\u00f3n y con otra de datos combinados con la info que importamos de Screaming, a veces puede resultar \u00abdemasiado\u00bb pero Excel nos permitir\u00e1 ocultar o eliminar las columnas no necesarias.<br \/>\nLos datos que ofrecer\u00e1 Urlprofiler, referentes a indexaci\u00f3n:<\/p>\n<ol>\n<li>Google indexed: valores posibles que arrojar\u00e1&nbsp;Yes, No,&nbsp;o Alternative URL<\/li>\n<li>Google info: indexed: Si el punto anterior no es SI, se chequea este punto, que puede resultar en Yes, No, Not Checked, Alternative URL<\/li>\n<li>Google index: Base, Deep o None. Si tenemos contenidos en el Deep Index, puede deberser a resultados \u00abomitidos\u00bb, bloqueados por robots, de baja calidad, etc.<\/li>\n<li>Google indexed alternative url: se muestra si existe una url indexada, alternativa a la introducida<\/li>\n<li>Google cach\u00e9 date: fecha del \u00faltimo cach\u00e9, si no hay fecha, se indica \u00abNot Catched\u00bb. Si no es posible comprobar la fecha, se indica \u00abCheck Failed\u00bb<\/li>\n<\/ol>\n<p>Si has visto alguna vez esto, ponte a revisar ya mismo&#8230;<br \/>\n<a href=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/resultados-omitidos-google.png\" rel=\"attachment wp-att-2919\"><img class=\"alignnone wp-image-2919 \" src=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2020\/10\/resultados-omitidos-google.png\" alt=\"resultados omitidos google\" width=\"533\" height=\"91\"><\/a><br \/>\nCerramos este post en el que hemos analizado todos los post de un blog, para chequear si est\u00e1n indexados o no, y teniendo la informaci\u00f3n de enlaces internos, externos, domain authority, etiquetas robots y canonical, ver posibles mejoras.<br \/>\nPodemos llevar a cabo alguna cosa m\u00e1s sabiendo usar esta funcionalidad de Urlprofiler, como por ejemplo, cruzar las <a href=\"https:\/\/www.mjcachon.com\/blog\/paginas-indexadas-google\/\">p\u00e1ginas indexadas<\/a>&nbsp;en la actualidad y cruzar con las urls contenidas en sitemap para ver GAPs.<br \/>\nEn este sentido, podemos tirar de Google Search Console para ver el status de los sitemaps y su indexaci\u00f3n, y comprobar de forma pr\u00e1ctica si es real o no dicha info.<br \/>\nTambi\u00e9n podremos hacer ajustes: desindexar lo que no corresponda o a\u00f1adir a sitemap lo apropiado.<br \/>\nCualquier duda, comenta y te echamos un cable, si quieres probar la herramienta, te dejamos el link para <a href=\"http:\/\/urlprofiler.com\/?a_aid=55c87596ca119\" target=\"_blank\" rel=\"noopener noreferrer\">Descargar&nbsp;URProfiler<\/a><br \/>\n&nbsp;<br \/>\n&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Comprobar si est\u00e1n indexadas un mont\u00f3n de urls, de una sola vez, implicaba hace tiempo, tener que replicar comandos como site: o como info:, o bien, tratar de automatizar la tarea con otros m\u00e9todos no del todo r\u00fasticos. Desde que conocimos una gran herramienta, desde este humilde blog no nos cansamos de contar cosas \u00fatiles<\/p>\n","protected":false},"author":2,"featured_media":6557,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[2],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v16.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Comprobar la indexaci\u00f3n en bulk - LaikaTeam<\/title>\n<meta name=\"description\" content=\"Conoce la funcionalidad de Urlprofiler para chequear la indexaci\u00f3n de una lista de urls, en masa o bulk. \u00a1Ahorra tiempo!\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/laikateam.com\/blog\/indexacion-bulk\/\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Comprobar la indexaci\u00f3n en bulk - LaikaTeam\" \/>\n<meta property=\"og:description\" content=\"Conoce la funcionalidad de Urlprofiler para chequear la indexaci\u00f3n de una lista de urls, en masa o bulk. \u00a1Ahorra tiempo!\" \/>\n<meta property=\"og:url\" content=\"https:\/\/laikateam.com\/blog\/indexacion-bulk\/\" \/>\n<meta property=\"og:site_name\" content=\"LaikaTeam\" \/>\n<meta property=\"article:published_time\" content=\"2016-03-28T22:32:08+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2021-05-31T14:31:47+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2016\/03\/indexacion-bulk.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1920\" \/>\n\t<meta property=\"og:image:height\" content=\"1080\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@laikateam_es\" \/>\n<meta name=\"twitter:site\" content=\"@laikateam_es\" \/>\n<meta name=\"twitter:label1\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data1\" content=\"6 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Organization\",\"@id\":\"https:\/\/laikateam.com\/blog\/#organization\",\"name\":\"Laika\",\"url\":\"https:\/\/laikateam.com\/blog\/\",\"sameAs\":[\"https:\/\/www.instagram.com\/laika_team\",\"https:\/\/www.linkedin.com\/company\/laika-team\/\",\"https:\/\/twitter.com\/laikateam_es\"],\"logo\":{\"@type\":\"ImageObject\",\"@id\":\"https:\/\/laikateam.com\/blog\/#logo\",\"inLanguage\":\"es\",\"url\":\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2021\/06\/logo-laika.png\",\"contentUrl\":\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2021\/06\/logo-laika.png\",\"width\":318,\"height\":350,\"caption\":\"Laika\"},\"image\":{\"@id\":\"https:\/\/laikateam.com\/blog\/#logo\"}},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/laikateam.com\/blog\/#website\",\"url\":\"https:\/\/laikateam.com\/blog\/\",\"name\":\"LaikaTeam\",\"description\":\"Strategic &amp; SEO Consulting\",\"publisher\":{\"@id\":\"https:\/\/laikateam.com\/blog\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":\"https:\/\/laikateam.com\/blog\/?s={search_term_string}\",\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"es\"},{\"@type\":\"ImageObject\",\"@id\":\"https:\/\/laikateam.com\/blog\/indexacion-bulk\/#primaryimage\",\"inLanguage\":\"es\",\"url\":\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2016\/03\/indexacion-bulk.jpg\",\"contentUrl\":\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2016\/03\/indexacion-bulk.jpg\",\"width\":1920,\"height\":1080},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/laikateam.com\/blog\/indexacion-bulk\/#webpage\",\"url\":\"https:\/\/laikateam.com\/blog\/indexacion-bulk\/\",\"name\":\"Comprobar la indexaci\\u00f3n en bulk - LaikaTeam\",\"isPartOf\":{\"@id\":\"https:\/\/laikateam.com\/blog\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/laikateam.com\/blog\/indexacion-bulk\/#primaryimage\"},\"datePublished\":\"2016-03-28T22:32:08+00:00\",\"dateModified\":\"2021-05-31T14:31:47+00:00\",\"description\":\"Conoce la funcionalidad de Urlprofiler para chequear la indexaci\\u00f3n de una lista de urls, en masa o bulk. \\u00a1Ahorra tiempo!\",\"breadcrumb\":{\"@id\":\"https:\/\/laikateam.com\/blog\/indexacion-bulk\/#breadcrumb\"},\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/laikateam.com\/blog\/indexacion-bulk\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/laikateam.com\/blog\/indexacion-bulk\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Portada\",\"item\":\"https:\/\/laikateam.com\/blog\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Comprobar la indexaci\\u00f3n en bulk\"}]},{\"@type\":\"Article\",\"@id\":\"https:\/\/laikateam.com\/blog\/indexacion-bulk\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/laikateam.com\/blog\/indexacion-bulk\/#webpage\"},\"author\":{\"@id\":\"https:\/\/laikateam.com\/blog\/#\/schema\/person\/57bc6c6ac096e3437e2261bf39255923\"},\"headline\":\"Comprobar la indexaci\\u00f3n en bulk\",\"datePublished\":\"2016-03-28T22:32:08+00:00\",\"dateModified\":\"2021-05-31T14:31:47+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/laikateam.com\/blog\/indexacion-bulk\/#webpage\"},\"wordCount\":1285,\"commentCount\":3,\"publisher\":{\"@id\":\"https:\/\/laikateam.com\/blog\/#organization\"},\"image\":{\"@id\":\"https:\/\/laikateam.com\/blog\/indexacion-bulk\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/laikateam.com\/blog\/wp-content\/uploads\/2016\/03\/indexacion-bulk.jpg\",\"articleSection\":[\"SEO\"],\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\/\/laikateam.com\/blog\/indexacion-bulk\/#respond\"]}]},{\"@type\":\"Person\",\"@id\":\"https:\/\/laikateam.com\/blog\/#\/schema\/person\/57bc6c6ac096e3437e2261bf39255923\",\"name\":\"MJ Cachon\",\"image\":{\"@type\":\"ImageObject\",\"@id\":\"https:\/\/laikateam.com\/blog\/#personlogo\",\"inLanguage\":\"es\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/4f93a22677b533182414d91829674844?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/4f93a22677b533182414d91829674844?s=96&d=mm&r=g\",\"caption\":\"MJ Cachon\"},\"sameAs\":[\"https:\/\/www.laikateam.com\/\"],\"url\":\"https:\/\/laikateam.com\/blog\/author\/mj-cachon\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","_links":{"self":[{"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/posts\/2913"}],"collection":[{"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/comments?post=2913"}],"version-history":[{"count":2,"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/posts\/2913\/revisions"}],"predecessor-version":[{"id":6558,"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/posts\/2913\/revisions\/6558"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/media\/6557"}],"wp:attachment":[{"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/media?parent=2913"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/categories?post=2913"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/laikateam.com\/blog\/wp-json\/wp\/v2\/tags?post=2913"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}