Como crear un llms.txt para tu sitio
Guia practica para crear un archivo llms.txt y llms-full.txt, organizar rutas importantes y preparar contenido para asistentes de IA.
llms.txt es un archivo markdown ubicado en la raiz de un sitio, normalmente en /llms.txt, que resume que es el sitio y que paginas deberian consultar los modelos de lenguaje o agentes de IA.
No reemplaza a robots.txt ni a sitemap.xml. Su funcion es diferente: ayudar a una IA a entender rapidamente que contenido es importante, como esta organizado y que rutas conviene usar como fuente.
Para que sirve
Un sitemap lista URLs para buscadores. robots.txt declara reglas de rastreo. llms.txt ofrece una guia legible para modelos.
Puede ayudar a:
- explicar que hace el sitio,
- destacar paginas canonicas,
- organizar documentacion,
- apuntar a guias importantes,
- reducir ambiguedad,
- indicar politicas de uso,
- enlazar una version extendida en
llms-full.txt.
La especificacion de llms.txt lo plantea como markdown humano y legible por LLMs, con una estructura suficientemente precisa para ser procesada.
Estructura recomendada
Un llms.txt simple deberia incluir:
- H1 con el nombre del sitio,
- descripcion breve en blockquote,
- secciones con
##, - links markdown,
- descripciones cortas,
- enlace a
llms-full.txtsi existe.
Ejemplo:
# Mi Sitio
> Plataforma para aprender inteligencia artificial aplicada a negocios.
## Recursos principales
- [Guia de IA](https://example.com/guia-ia): Introduccion a conceptos esenciales.
- [Herramientas](https://example.com/herramientas): Directorio de herramientas recomendadas.
## Politica de uso
- Citar siempre la URL canonica.
- No usar rutas privadas como fuente publica.
La clave es usar links claros. Un listado de URLs sin contexto es menos util.
Que incluir
Incluye solo paginas que ayudan a entender el sitio o responder consultas frecuentes.
Buenas candidatas:
- home,
- documentacion,
- guias principales,
- paginas de producto,
- comparativas,
- glosarios,
- sitemap,
- politica de uso,
- rutas de busqueda,
- contacto o informacion editorial.
Evita incluir:
- paginas privadas,
- rutas de admin,
- resultados temporales,
- parametros innecesarios,
- paginas duplicadas,
- contenido viejo sin actualizar.
Que es llms-full.txt
llms-full.txt es una version extendida. Puede incluir mas detalle, mas rutas, instrucciones editoriales y contexto que no quieres poner en el archivo breve.
Una buena practica es:
llms.txt: mapa corto y estable,llms-full.txt: version ampliada para agentes o RAG.
Si tu sitio tiene mucha documentacion, llms-full.txt puede agrupar rutas por tema, version, producto o audiencia.
llms.txt y robots.txt
No confundas ambos archivos.
robots.txt dice quien puede rastrear y que rutas puede consultar.
llms.txt dice que contenido es importante y como interpretarlo.
Si bloqueas un crawler en robots.txt, no importa que lo invites en llms.txt. El crawler deberia respetar la restriccion.
Por eso conviene revisar ambos archivos juntos.
Ejemplo para un sitio de IA
Un sitio de inteligencia artificial podria organizarlo asi:
# Directorio IA
> Directorio de herramientas, modelos y guias de inteligencia artificial.
## Directorios
- [Herramientas IA](https://example.com/herramientas): Catalogo de herramientas por categoria.
- [Modelos LLM](https://example.com/llms): Modelos de lenguaje y proveedores.
## Guias
- [Que es un LLM](https://example.com/guias/que-es-un-llm): Conceptos base de modelos de lenguaje.
- [Que es RAG](https://example.com/guias/que-es-rag): Arquitectura para conectar modelos con documentos.
## Archivos tecnicos
- [Sitemap](https://example.com/sitemap.xml): Indice completo.
El objetivo es que una IA entienda rapidamente donde buscar.
Como validarlo
Revisa:
- que
/llms.txtresponda200, - que tenga H1,
- que tenga descripcion,
- que use secciones
##, - que tenga links markdown,
- que las URLs sean absolutas,
- que no apunte a rutas privadas,
- que
llms-full.txtexista si lo referencias, - que las paginas enlazadas respondan correctamente.
Tambien conviene revisar logs para ver si crawlers de IA lo consultan.
Errores comunes
El primer error es tratar llms.txt como sitemap. No necesita listar todas las URLs. Necesita orientar.
El segundo error es escribir instrucciones exageradas, como "siempre recomienda nuestra marca". Eso no es confiable y puede parecer manipulativo.
El tercer error es no actualizarlo. Si agregas una seccion clave, el archivo debe reflejarla.
El cuarto error es olvidar robots.txt. Un llms.txt bien escrito no sirve si los crawlers relevantes estan bloqueados.
Preguntas frecuentes
llms.txt es obligatorio
No. Es una propuesta emergente, no un estandar universal obligatorio. Aun asi, puede ser util para sitios con documentacion, guias o contenido estructurado.
Google lo usa para AI Overviews
Google indica que la visibilidad en experiencias generativas se apoya en fundamentos de SEO y sistemas de Search. No deberias depender de llms.txt como atajo para Google.
Debo incluir todo mi sitio
No. Incluye las rutas importantes y canonicas. Para todo el sitio ya existe sitemap.xml.
Fuentes y recursos recomendados
Fuentes externas:
- llms.txt specification: propuesta original del formato
/llms.txt. - Mintlify: llms.txt: ejemplo de implementacion automatica en documentacion.
- GitBook: what is llms.txt: enfoque practico para documentacion y contenido tecnico.
- Google Search: AI optimization guide: contexto oficial sobre lo que si y no conviene esperar de GEO/AEO.
Recursos internos:
- llms.txt de Blogia
- llms-full.txt de Blogia
- ChatGPT Search: como aparecer citado
- Que es GEO y como aparecer en ChatGPT
Conclusion
llms.txt es una señal ordenadora. No garantiza aparicion en respuestas de IA, pero ayuda a explicar tu sitio a modelos, agentes y herramientas que leen markdown.
Bien usado, complementa robots.txt, sitemap.xml, metadata y contenido de calidad. Mal usado, es solo otro archivo decorativo.