Página 1 de 1

Resultados en google https diferentes de http

Publicado: 10 Oct 2011, 00:02
por Jorge Jacobo
Hola a todos. Quiero hacer una pregunta...acerca de lo que ví hoy esta mañana.

En google había hecho búsquedas de mi sitio web ¨"site:preguntameaqui.com"

Todos los resultados eran de mi sitio web.. pero ahora veo que salen algunos como "https://preguntameaqui.com/"

Yo no he hecho ningun archivo en https.

Firefox al tratar de visitar ese sitio me dice que ese lugar no será seguro. que si quiero seguir será a mi propio riesgo.

Ahora que es lo que está pasando .. ¿Alguien Sabe? ¿Por qué sale ese sitio así?

Re: Resultados en google https diferentes de http

Publicado: 10 Oct 2011, 14:57
por elQuique
Si tienes abierto (o activo) el https y no lo usas para una zona segura, seguramente muestre lo mismo que la zona publica de tu sitio, por tanto estás generando contenido duplicado.

Siempre debes evitar el contenido duplicado, el más común es dejar indexar lo mismo con y sin www, por ejemplo dejar indexar doblemente todas las paginas:
www.preguntamequi.com (con www)
y
preguntameaqui.com (sin www)
duplicas el home y todas las otras internas. Para evitarlo te recomiendo leer mi artículo Con y sin www redirección 301

Otro caso típico es cuando tienes varios dominios, por ejemplo si reservaste el .com y también el .net, debes evitar en ese caso también duplicar el contenido con ambos dominios, te recomiendo otro de mis artículos Parking de dominios y redirección 301

Y por último, y menos frecuente, pero también sucede es tu caso, donde se agrega el duplicado con y sin https, para esto tienes varias formas de evitarlo:

Utilizar robots.txt para evitar duplicado de contenido http y https
La solución es sencilla, creas un robots.txt y dentro permites todas las urls con http y no permites las https, de la siguiente forma:

En tu carpeta http del servidor, usando FTP, agregas un archivo robots.txt con:

Código: Seleccionar todo

User-agent: *
Allow: /
En tu carpeta https del server, usando FTP, agregas un archivo robots.txt con:

Código: Seleccionar todo

User-agent: *
Disallow: /
el primero es opcional ya que si no lo usas indexará como hasta ahora, pero el segundo en https, es el que le dice al spider de google que no rastree e indexe :)

Si no cuentas con 2 carpetas en tu FTP bien diferenciadas para lo que debe mostrar tu server para http y https, puedes utilizar un archivo htaccess, que filtre por el puerto y dirija el robots al indicado, de la siguiente forma:

Código: Seleccionar todo

RewriteCond %{SERVER_PORT} 443 [NC]
RewriteRule ^robots.txt$ turobotshttps.txt [L]
y obviamente creas un archivo turobotshttps.txt con el contenido Disallow que indique más arriba. Lo que hace este htaccess es filtrar y cuando el puerto es 443 (o sea el de https) use en lugar del robots.txt normal un archivo especial llamado turobotshttps.txt

La otra forma es, si utilizas PHP, .NET y es un CMS tuyo o bien puedes modificarlo y te animas, puedes programar al inicio de la Aplicación un filtro del puerto y redirección, por ejemplo con PHP, filtras el Puerto 443 y haces un redirect a http, o bien le agregas un noindex a tu html para ese puerto.

Re: Resultados en google https diferentes de http

Publicado: 10 Oct 2011, 21:01
por Jorge Jacobo
Gracias por la respuesta.....pero..

los resultados que se muestran por https, NO son mios. Además de ser en Inglés. NUNca los había visto y NO Son míos.

http://preguntameaqui.com/wp-content/up ... ltados.jpg

Esa es una foto que muestra lo que veo en los resultados de google . No sé si hay alguien que creó todo eso...y si lo hizo de donde se están creando esos resultados.

Ningún enlace que se ven dentro de https son mios.

Re: Resultados en google https diferentes de http

Publicado: 10 Oct 2011, 22:05
por Alejandro
Hola Jorge, lo que está en la carpeta https lo puedes eliminar... agrega además el archivo robots.txt en la carpeta https como te indica elQuique para evitar que en el futuro se indexe de nuevo.

Al entrar a https://preguntameaqui.com/robots.txt se debería de ver lo que dice elQuique.

También puedes ir a las Herramientas para Webmasters de Google y solicitar que esas URLs específicas sean eliminadas de los resultados.

Sobre el error al ingresar al sitio con https, aparece porque el dominio no tiene un certificado ssl y cuando el navegador lo intenta comprobar simplemente advierte que no es válido.

Re: Resultados en google https diferentes de http

Publicado: 10 Oct 2011, 23:54
por Jorge Jacobo
El único problema al que me enfrento es que no veo por ningún lado una carpeta de https, yo no sabía que eso estaba habilitado. Y lo peor de todo es que me molesta por nosaber de donde o quien lo creó.

Como veo que son enlaces que se hicieron (que no encuentro por ningún lado) el miedo es que alguien haya accesado en mi directorio raíz.

Estoy tratando en estos momentos de identificar si es acaso un servicio (por medio de mi servicio de hospedaje, hostgator). ¿Ustedes han oído de Atracta?

Voy a considerar lo que ustedes recomiendan (excepto que tengo que encontrar esas carpetas y no las veo por más que trato). public_html y todos los archivos regulares, nada con https.

Re: Resultados en google https diferentes de http

Publicado: 11 Oct 2011, 03:18
por Jorge Jacobo
Ok! Ya regresé. ... Todavía esta por saber si se arregló completamente pero les cuento lo que hice:

Contacté a mi proveedor de hospedaje (hostgator) y les traté de explicar el caso. Me contestaron con algo así:

[Ese es un problema que te enfrentarás cuando estás en un servidor compartido (ssl) ] y luego me preguntaba que si cual realmente era mi problema. (al parecer no me explico bien aveces je je).

Le expliqué no quería que mi sitio enlazara otros lugares sin antes yo aprobarlos (le mostré la foto del enlace).

En el último mensaje me dijeron que NO podía hacer nada que lo único que tenía que hacer es esperar hasta que google volviera a scanear, Pero ....Que había un archivo ahí Y que ahora ya no.

No supe es si ellos lo borraron, era una configuración que hicieron ellos, tenía que ver con lo de servidores compartidos; NO sé.

En fín. .. pude hacer un chequeo del enlace malo con https y ahora ya no está activo. (hasta cierto grado).

Gracias a todos ! ( Nota: se me olvidaba, ellos tambien mencionaron acerca de modificar httaccess, pero creo que no se necesitó al final).

Re: Resultados en google https diferentes de http

Publicado: 11 Oct 2011, 09:58
por Alejandro
Entonces no tienes acceso a esa carpeta, no sé por qué estarían creadas las páginas, son medias raras.

Algo que puedes hacer es entrar a https://preguntameaqui.com y cada una de las URL que aparecen, eliminarlas desde el panel de las Herramientas para Webmasters. La opción aparece sobre el menú izquierdo en "información del sitio" y "acceso de rastreadores", eliminado las URLs específicas en 24 horas más o menos ya no aparecerán en Google.

Después lo voy a leer bien, pero por acá hay información sobre el SSL y Hostgator: http://support.hostgator.com/categories/ssl-certificates/

Re: Resultados en google https diferentes de http

Publicado: 11 Oct 2011, 18:44
por Jorge Jacobo
Gracias por el tip Alejandro. Acabo de hacer eso exactamente en Webmarster tools. Aver que pasa. Como les mencioné arriba.... y tú lo mostraste tambien, el robots.txt de https de mi sitio.. apunta (o apuntaba) a un sitemap de Atracta. Ya los contacté y según digeron que habían borrado mi suscripción. ( que yo ni recuerdo haberme suscrito, solo recuerdo que en mi panel de control de hostgator hay un ícono que te dirige a estos, diciendo que te ayudaran a posicionarte en google y toda la cosa, pero solo hice click, y creo según ellos así es como te suscribes...No Lo sé.).