소개
2025년, 생성형 검색은 마침내 전환점을 맞이했습니다. 실험 단계에서 벗어나 수억 명의 사람들이 정보와 상호작용하는 주요 수단이 되었습니다.
이러한 변화가 정보 탐색 방식을 어떻게 바꾸는지 이해하기 위해, 우리는 현재까지 진행된 가장 대규모 독립적 GEO 연구 중 하나를 수행했습니다:
4개월 동안 7개 주요 검색 엔진에서 100개 이상의 브랜드를 대상으로 5가지 질의 범주에 걸쳐 10,000개의 생성형 답변을 분석했습니다.
본 글은 가장 중요한 통찰을 요약합니다 — 생성형 엔진의 작동 방식, 정보 출처 선정 기준, 도출된 패턴, 승자와 패자 브랜드, 그리고 최적화 미래에 대한 시사점.
이 보고서는 2025년 '생성형 답변 현황'에 대한 결정판입니다.
1부: 프로젝트 개요 — 테스트 내용
10,000개의 생성형 답변을 통해 다음을 추적했습니다:
-
포함 빈도
-
인용 패턴
-
추론 행동
-
환각 유형
-
시간에 따른 사실 편차
-
생성 편향
-
다중 모드 영향
-
답변 구조
-
엔티티 분류
-
범주 수준 지배력
질문은 5개 그룹에서 수집되었습니다:
1. 정보형
정의, 방법, 설명, 사실.
2. 거래 관련
비교, 제품 선택, 서비스 제공업체.
3. 브랜드 수준
"X란 무엇인가?", "X의 소유주는 누구인가?", "X 대 Y."
4. 다중 모드
이미지, 스크린샷, 차트, 동영상.
5. 에이전트형
다단계 작업 흐름, 연구 지침, 도구 사용 관련 질의.
포함된 엔진:
-
Google SGE
-
빙 코파일럿
-
ChatGPT 검색
-
퍼플렉시티
-
클로드 검색
-
Brave 요약
-
You.com
이 데이터셋은 실제 환경에서 AI 답변이 어떻게 구성되는지에 대한 지금까지 가장 명확한 스냅샷입니다.
2부: 가장 중요한 10가지 발견 사항 (요약)
심층 분석에 앞서 핵심 내용을 정리하면 다음과 같습 니다:
1. 생성형 답변은 극소수의 출처(일반적으로 3~10개)를 활용해 작성됩니다.
2. 명시적 명칭(엔티티)의 명확성이 포함 여부를 예측하는 가장 강력한 지표였습니다.
3. 원본 데이터가 다른 어떤 콘텐츠보다 훨씬 더 자주 인용되었습니다.
4. 오래된 페이지는 거의 예외 없이 제외되었습니다.
5. 표준적 정의가 브랜드 설명 방식을 결정했습니다.
6. 다중 모달 자산은 선택된 브랜드에 영향을 미쳤다.
7. 환각 현상은 감소했으나 오분류는 증가했다.
8. 웹 간 일관성은 신뢰도 평가에 강력한 영향을 미쳤다.
9. 에이전트는 다단계 추론을 기반으로 답변을 수정했습니다.
10. SERP 중심 SEO 요소는 생성형 가시성을 거의 예측하지 못했다.
자세한 내용을 살펴보자.
파트 3: 발견 사항 #1 — 모델이 예상보다 훨씬 적은 출처를 사용함
수십에서 수백 페이지의 정보를 검색함에도 불구하고:
생성형 답변은 일반적으로 3~10개의 선별된 출처로 구성됩니다.
이는 다음과 같은 경우에 일관되게 나타납니다:
-
짧은 답변
-
긴 설명
-
비교
-
다단계 추론
-
에이전트 워크플로
필터링을 통과한 3~10개 출처에 포함되지 않으면, 당신은 보이지 않습니다.
효과적인 SEO를 위한 올인원 플랫폼
모든 성공적인 비즈니스의 배후에는 강력한 SEO 캠페인이 있습니다. 하지만 선택할 수 있는 최적화 도구와 기법이 무수히 많기 때문에 어디서부터 시작해야 할지 알기 어려울 수 있습니다. 이제 걱정하지 마세요. 제가 도와드릴 수 있는 방법이 있으니까요. 효과적인 SEO를 위한 Ranktracker 올인원 플랫폼을 소개합니다.
이는 SERP 시대와 가장 큰 차이점입니다:
가시성 ≠ 순위. 가시성 = 포함 여부.
4부: 발견 사항 #2 — 엔티티 명확성이 가시성의 가장 강력한 예측 변수였습니다
모든 검색 엔진에서 최고의 가시성을 보인 브랜드들은 하나의 공통된 특성을 공유했습니다:
AI가 "이것은 무엇인가?"라는 질문에 완벽한 확신으로 답할 수 있었습니다.
엔티티 명확성은 세 가지 수준으로 관찰되었습니다:
레벨 1 — 매우 명확함 일관되고, 모호함이 없으며, 표준적입니다. 이러한 브랜드들은 생성적 가시성을 지배했습니다.
레벨 2 — 부분적으로명확함 일부 불일치. 이 브랜드들은 가끔씩 노출되었습니다.
레벨 3 —모호함 상충되는 설명. 이 브랜드들은 거의 완전히 배제되었습니다.
엔티티 명확도는 다음을 능가합니다:
-
백링크
-
도메인 등급
-
콘텐츠 길이
-
키워드 밀도
-
도메인 연령
전체 데이터셋에서 가장 중요한 지역적 요소(GEO)입니다.
파트 5: 발견 사항 #3 — 원본 데이터가 다른 모든 콘텐츠 유형을 압도함
생성형 엔진은 압도적으로 선호했습니다:
-
독점 연구
-
통계
-
벤치마크
-
백서
-
연구 보고서
-
설문 조사 결과
다른 어디에도 존재하지 않는 콘텐츠를 압도적으로 선호했습니다.
효과적인 SEO를 위한 올인원 플랫폼
모든 성공적인 비즈니스의 배후에는 강력한 SEO 캠페인이 있습니다. 하지만 선택할 수 있는 최적화 도구와 기법이 무수히 많기 때문에 어디서부터 시작해야 할지 알기 어려울 수 있습니다. 이제 걱정하지 마세요. 제가 도와드릴 수 있는 방법이 있으니까요. 효과적인 SEO를 위한 Ranktracker 올인원 플랫폼을 소개합니다.
원본 데이터를 보유한 브랜드는:
-
포함률 3~4배 향상
-
5배 더 안정적인 인용
-
거의 제로에 가까운 환각 위험
엔진은 재작성된 SEO 콘텐츠가 아닌 최초 출처의 증거를 원합니다.
파트 6: 발견 사항 #4 — 최 신성이 권위보다 더 중요했다
이 결과는 우리에게도 놀라웠다:
검색 엔진은 권위 높은 도메인에서 나온 페이지라도 오래된 콘텐츠를 지속적으로 하위 순위로 밀어냈습니다.
최신성은 매우 중요했습니다.
최근 90일 이내에 업데이트된 페이지가 더 우수한 성과를 보였습니다:
-
DR 경쟁사 대비 높은
-
더 긴 콘텐츠
-
더 많은 연결 페이지
-
오래된 상시적 가이드
모델들은 최신성 = 신뢰성으로 해석합니다.
파트 7: 발견 사항 #5 — 표준 정의가 AI가 당신을 설명하는 방식을 결정한다
다음 요소들 간에 직접적인 상관관계를 관찰했습니다:
-
브랜드의 표준 페이지 형식
-
생성 요약에 사용된 표현
간결하고 구조화된 정의는 답변에 그대로 반영되는 경향이 있었습니다.
이는 다음을 의미합니다:
생성형 웹이 당신을 묘사하는 방식을 형성할 수 있습니다 —
정형화된 정의를 형성함으로써 가능합니다.
이것이 새로운 '스니펫 최적화'입니다.
파트 8: 발견 #6 — 다중 모달 자산이 예상치 못한 역할을 수행하다
생성 엔진들은 점점 더
-
스크린샷
-
UI 예시
-
제품 이미지
-
다이어그램
-
동영상
보조 증거로 활용되었습니다.
다음과 같은 브랜드는:
-
일관된 디자인
-
조명이 밝은 이미지
-
주석이 달린 시각 자료
-
동영상 데모
더 자주 등장했으며 더 정확하게 묘사되었습니다.
시각적 명확성 = 생성적 명확성.
파트 9: 발견 사항 #7 — 환각 현상은 감소했으나 오분류는 증가
모든 검색 엔진에서 환각 검색 결과가 크게 감소했습니다.
그러나 새로운 문제가 발생했습니다:
오분류 — AI가 브랜드를 잘못된 카테고리에 배치하는 현상.
예시:
-
SaaS 플랫폼을 "제품군"이 아닌 "도구"라고 부르는 것
-
제품 등급 오인
-
경쟁사 혼동
-
두 브랜드의 기능을 통합하는 경우
-
모기업과 제품을 혼동하는 경우
이러한 오류는 거의 항상 다음으로 거슬러 올라갔다:
-
불완전한 표준 데이터
-
일관성 없는 제품 명명
-
구식 지원 페이지
매월 정의를 업데이트한 브랜드는 분류 오류율이 현저히 낮았습니다.
파트 10: 발견 사항 #8 — 웹 간 일관성이 선택에 큰 비중을 차지함
검증 대상 엔진:
-
LinkedIn
-
위키백과
-
위키데이터
-
크런치베이스
-
G2
-
GitHub
-
소셜 프로필
-
스키마
-
타사 리뷰
상호 비교되었습니다.
사실이 일치할 경우 → 신뢰도가 증가했습니다. 사실이 상충할 경우 → 제외가 발생했습니다.
웹 간 일관성은 상위 5개 순위 결정 요소 중 하나였습니다.
제11부: 발견 사항 #9 — 행위적 추론은 일부 브랜드를 부각시키고 다른 브랜드를 저해함
주체적 질의는 다단계 지침이다:
"X에 대해 조사하고, 공급자를 비교하며, 옵션을 요약하고, 최상의 것을 추천하라."
관찰 결과:
구조화된 비교 기능이 뛰어난 브랜드가 더 자주 선택되었습니다.
검색 엔진이 원한 것은:
-
장단점
-
투명한 가격 정책
-
명확한 포지셔닝
-
사용 사례 목록
-
기능 분석
약점을 숨기거나 기능을 모호하게 표현한 브랜드는 노출에서 제외되었습니다.
파트 12: 발견 사항 #10 — SEO 강도가 생성적 가시성을 예측하지 못함
이것이 가장 명확한 발견 사항입니다:
SEO 순위가 높은 브랜드들은 생성형 답변에서 종종 저조한 성과를 보였다.
왜일까?
생성형 가시성은 다음에 달려 있기 때문이다:
-
명확성
-
일관성
-
권위
-
최신성
-
독창성
-
신뢰성
-
구조화된 데이터
—키워드 순위가 아닌.
우리는 다음과 같은 브랜드를 목격했습니다:
-
DR 20이 DR 80보다 우수한 성능을 보임
-
100페이지 사이트가 10,000페이지 사이트보다 우수한 성과를 보임
-
집중된 도메인이 광범위한 도메인보다 우수한 성능을 보임
생성형 엔진은 양보다 일관성을 보상합니다.
파트 13: 주목할 만한 부차적 발견 사항
상위 10개 통찰을 넘어 다음과 같은 추가 패턴을 발견했습니다:
1. 엔진은 모호한 제품 생태계를 불이익합니다
중복되는 제품이 너무 많으면 명확성이 무너집니다.
2. 긴 문단은 낮은 성능을 보임
구조화된 콘텐츠가 일관되게 선호되었습니다.
