소개
대규모 언어 모델은 더 이상 단순히 '멋진 챗봇'이 아닙니다. 사람들이 제품에 대한 질문을 하고, 도구를 비교하며, 가격을 확인하고, 결정을 내리기 위해 조사하는 곳이 되었습니다.
이는 이제 웹사이트에 두 가지 주요 대상이 생겼음을 의미합니다:
-
클래식 검색, 소셜, 직접 접속을 통해 접근하는 인간 사용자와
-
크롤러, 커넥터, IDE, AI 검색 기능을 통해 접근하는 AI 시스템
전통적인 SEO는 여전히 중요하지만, AI가 콘텐츠를 쉽게 이해하고 재사용할 수 있도록 하는 병행 분야가 성장하고 있습니다. 바로 제안된 llms.txt 표준이 필요한 이유입니다.
Ranktracker의 경우, llms.txt를 AI 대비 체크리스트의 작지만 유용한 요소로 보고 있습니다. 이는 SEO 작업을 대체하지는 않지만, 사이트를 LLM이 실제로 웹 콘텐츠를 소비하는 방식에 맞추는 데 도움이 될 수 있습니다.
이제 llms.txt가 무엇인지, 어디서 비롯되었는지, 그리고 단순한 실험실 데모가 아닌 실제 비즈니스 사이트에 적합한 방식으로 구현하는 방법을 살펴보겠습니다.
llms.txt란 무엇인가요?
llms.txt는 도메인 루트에 배치하는 일반 텍스트(보통 마크다운) 파일입니다. 예를 들어:
https://yourdomain.com/llms.txt
그 역할은 간단합니다: 대규모 언어 모델에게 사이트 내 '핵심 콘텐츠'가 어디에 있는지 알려주는 것입니다.
AI 에이전트가 중요 페이지를 추측하게 두지 않고, llms.txt는 선별된 핵심 URL 지도를 제공합니다:
-
문서화
-
기능 페이지
-
가격 및 정책
-
중요한 가이드 및 리소스
-
기타 LLM 친화적 마크다운 파일
robots.txt나 sitemap.xml을 대체하지 않습니다:
-
robots.txt = "사이트 크롤링 규칙은 다음과 같습니다."
-
sitemap.xml = "색인할 수 있는 URL 목록입니다."
-
llms.txt = "저희가 누구이며 무엇을 하는지 가장 잘 나타내는 콘텐츠입니다."
이 파일을 다음과 같이 간결하고 주관적인 가이드북으로 생각하세요: "이 사이트를 설명하려는 AI라면 여기서 시작하라."
llms.txt는 어디서 왔으며, 실제로 누가 사용하나요?
llms.txt의 개념은 2024년 제레미 하워드 (fast.ai / Answer.AI)에 의해 공식화되었습니다. 그가 해결하려던 문제는 다음과 같습니다:
-
웹사이트는 복잡합니다: 네비게이션, 광고, 양식, JS, 추적기, 불필요한 레이아웃 요소 등이 존재합니다.
-
LLM은 제한된 컨텍스트 창을 가지고 있으므로 사이트 전체를 한 번에 처리할 수 없습니다.
-
개발자, 도구 및 AI 에이전트는 종종 문서나 제품 정보에 대한 깔끔하고 구조화된 진입점을 원합니다.
제안된 해결책:
/llms.txt 에 표준 파일을 배치하여:
-
프로젝트나 사이트를 인간/AI가 읽기 쉬운 방식으로 간결하게 설명합니다.
-
주요 마크다운 또는 텍스트 친화적 리소스를 나열합니다.
-
컨텍스트가 제한적인 경우 일부 URL을 "선택적"으로 표시할 수 있습니다.
현재 초기 도입 사례가 나타나고 있으며, 특히 개발자 생태계와 문서 중심 프로젝트에서 두드러집니다. 예를 들면:
-
API 및 컴포넌트 라이브러리
-
문서 생성기
-
일부 SaaS 문서 사이트
-
GEO(생성형 엔진 최적화)를 실험 중인 소수의 에이전시 및 SEO 플랫폼
중요한 뉘앙스:
-
주요 LLM 공급자(OpenAI, Anthropic, Google 등)는 검색 엔진이 robots.txt를 준수하는 것과 동일한 방식으로 llms.txt를 준수할 것을 공개적으로 약속하지 않았습니다.
-
Anthropic 및 Nuxt UI와 같은 일부 업체는 타인이 사용할 수 있도록 자체 llms.txt 파일을 공개하지만, 이는 해당 업체의 크롤러가 자체 모델에 이를 적용한다는 보장은 아닙니다.
따라서 현재 llms.txt는:
-
제안된 표준일 뿐, 보장된 순위나 검색 신호가 아님
-
명시적으로 이를 지원하는 도구 및 워크플로우(예: IDE, 에이전트, AI 인식 문서 도구)에 유용함
-
복잡한 사이트를 위한 좋은 "미래 대비" 조치
추가한 당일에 트래픽 급증을 기대해서는 안 됩니다. 하지만 제대로 구현하기 위해 몇 주간의 엔지니어링 시간을 투자할 필요도 없습니다.
llms.txt 사양이 실제로 작동하는 방식
제안된 사양은 의도적으로 마크다운을 사용합니다. 그 이유는 다음과 같습니다:
-
사람이 읽기 쉬움
-
LLM이 파싱하기 쉬움
-
간단한 파서 및 스크립트에 충분한 구조화
유효한 llms.txt는 일반적으로 다음과 같은 구조를 따릅니다:
-
H1헤딩 프로젝트 또는 사이트 이름
-
인용문 사이트 또는 제품에 대한 간략한 설명
-
선택적 세부 설명단락 링크 해석 방법에 대한 추가 설명
-
하나 이상의 H2섹션 각 H2는 파일 또는 URL 목록을 그룹화
-
각 H2 내에는 링크의 글머리 기호 목록 각 목록 항목은 마크다운 링크와 선택적 설명으로 구성:
[링크 제목](https://url): 선택적 설명 -
**선택적
## 선택적섹션 여기 링크는 우선순위가 낮으며 맥락이 부족할 때 생략 가능
일반적인 사이트를 위한 간략한 예시입니다:
# your-website.com
> Your Website는 X, Y, Z를 위한 온라인 플랫폼으로 가이드, 도구, 문서를 제공합니다.
단계별 튜토리얼과 제품 문서를 통해 사용자가 A, B, C 작업을 수행할 수 있도록 지원합니다.
문서
정책
가이드
- 시작하기 가이드: 핵심 기능에 대한 개요 설명.
