• Google 검색 업데이트 및 SEO 인사이트

구글의 대규모 검색 문서 유출 사건의 진실을 밝히다

  • Felix Rose-Collins
  • 6 min read
구글의 대규모 검색 문서 유출 사건의 진실을 밝히다

소개

Google 검색 순위 관련 내부 문서가 대규모로 유출되어 SEO 커뮤니티에 충격을 주고 있습니다. 14,000개 이상의 잠재적 순위 기능이 노출된 이번 유출로 인해 전례 없이 보안이 엄격하게 유지되는 Google의 검색 순위 시스템의 내부를 들여다볼 수 있게 되었습니다.

유출 비하인드 스토리

에르판 아지미는 SparkToro의 랜드 피쉬킨에게 Google API 문서 유출 사실을 공유했고, 피쉬킨은 이 정보를 널리 알리기 위해 iPullRank의 마이클 킹에게 도움을 요청했습니다. 유출된 파일은"yoshi-code-bot /elixer-google-api"라는 제목의 Google API 문서 커밋에서 비롯된 것으로, 해킹이나 내부 고발자가 아니라 내부 문서 유출에 의한 것이었습니다.

유출 개요

이번 유출을 통해 Google의 순위 요소에 대한 종합적인 시각을 제공하며, 페이지랭크 변동, 사이트 권한 측정지표 등에 대한 인사이트를 확인할 수 있습니다. 자세한 분석 결과는 다음과 같습니다:

Google 검색 문서 유출의 주요 인사이트

페이지랭크와 그 변형

  • PageRank_NS: 현재 사용되지 않는 이 알고리즘은 문서 이해와 연관되어 있으며 시드 노드를 중심으로 네트워크의 지역화된 하위 집합에 초점을 맞추도록 기존 PageRank를 수정합니다.

  • 페이지랭크의 7가지 유형: Google은 유명한 도구 모음 페이지 순위를 포함하여 7가지 유형의 페이지 순위를 언급합니다. 이러한 변형은 Google이 페이지 중요도를 평가하는 데 여러 가지 방법을 사용한다는 것을 나타냅니다.

비즈니스 모델 식별

Google의 알고리즘은 뉴스 사이트, 개인 블로그, 전자상거래, 동영상 사이트 등 다양한 비즈니스 모델을 식별할 수 있습니다. 개인 블로그를 특별히 필터링하는 이유는 아직 명확하지 않으며 Google의 광범위한 의도에 대한 의문이 제기되고 있습니다.

알고리즘 구성 요소

  • NavBoost: 사용자 행동과 클릭 로그를 기반으로 순위를 재조정하는 메커니즘으로, Chrome 데이터의 영향을 많이 받습니다.

  • NSR(정규화된 사이트 순위): 호스트 수준 사이트 청크에 대한 사이트 순위를 계산하는 데 사용됩니다.

  • 차드스코어: 콘텐츠를 기반으로 사이트/페이지 품질을 예측하는 사이트 수준 점수입니다.

사이트 권한 메트릭

Google은 사이트 전반의 권한 측정지표와 Chrome 브라우저의 트래픽을 비롯한 여러 신호를 사용하여 사이트 권한을 평가합니다. 이는 전반적인 사이트 품질과 신뢰도가 순위 결정에 중요한 역할을 한다는 것을 시사합니다.

임베딩 기법 및 주제별 권위

  • 페이지 및 사이트 임베딩: Google은 웹사이트 콘텐츠의 주제 관련성 및 일관성을 파악하기 위해 페이지 임베딩, 사이트 임베딩, 사이트 포커스 및 사이트 반경을 점수화 기능에 사용합니다.

  • 토픽 테두리 및 토픽 권위: 사이트 포커스 점수, 사이트 반경, 사이트 임베딩 및 페이지 임베딩과 같은 메트릭은 토픽 권위를 측정하는 데 사용되며, 명확한 토픽 초점 유지의 중요성을 강조합니다.

googleapi

데이터 및 사용자 참여를 클릭합니다.

  • NavBoost: NavBoost: 클릭 데이터와 사용자 행동에 의존하여 검색 결과의 순위를 재조정하므로 사용자 참여 지표의 중요성이 강조됩니다.

  • 클릭 지표: Google은 불량 클릭, 양호 클릭, 최장 클릭, 사이트 전체 노출 수 등 다양한 유형의 클릭을 측정합니다.

품질 NSR 데이터 인사이트

NSR 데이터 문서의 주요 채점 요소는 다음과 같습니다:

  • titlematchScore: 제목이 사용자 검색어와 얼마나 잘 일치하는지를 나타내는 사이트 전체 제목 일치 점수입니다.

  • site2vec임베딩: word2vec과 유사한 사이트 전체 벡터로, 포괄적인 사이트 임베딩의 중요성을 강조합니다.

  • pnavClicks: 사용자 클릭 데이터에서 파생된 탐색 정보와 관련이 있을 가능성이 높습니다.

  • 크롬인토탈: 사이트 전반의 크롬 조회수로, 사이트 전반의 신호의 중요성을 강조합니다.

  • chardVariance 및 chardScoreVariance: 일관성이 핵심인 콘텐츠를 기반으로 사이트/페이지 품질을 예측하는 점수입니다.

NSR Data Insights

SEO 전문가를 위한 실용적인 팁

  1. 잘 디자인된 사이트에 투자하세요: 사용자 행동과 클릭 로그에 따라 검색 결과의 순위를 재조정하는 NavBoost에 최적화할 수 있는 직관적인 아키텍처를 사이트에 적용하세요.

  2. 주제와 관련 없는 페이지 제거/차단: 주제와 관련이 없는 페이지를 제거하거나 차단합니다. 목표 주제를 설정하고 각 페이지가 이 영역에서 좋은 점수를 받도록 하세요.

  3. 제목 및 콘텐츠 최적화하기: 검색어를 중심으로 제목을 최적화하고 단락이 해당 검색어에 대한 명확한 답변을 제공하도록 하여 페이지 임베딩과 관련성을 개선하세요.

  4. 클릭 수와 노출 수에 집중하세요: 사용자 참여를 강조하여 더 많은 노출과 클릭을 유도하는 콘텐츠를 작성하세요.

  5. 정기적으로 콘텐츠를 업데이트합니다: 고유한 정보, 새로운 이미지 및 동영상으로 콘텐츠를 정기적으로 업데이트하여 신선함을 유지하고 노력도 계산에서 높은 점수를 받으세요.

  6. 고품질 콘텐츠 유지: 고품질 콘텐츠의 일관성은 매우 중요합니다. Google의 사이트 수준 차드 점수는 콘텐츠를 기반으로 사이트/페이지 품질을 예측합니다.

  7. 가치 노출 수 증가: 노출 수 증가는 사이트 성능의 긍정적인 신호입니다.

  8. 엔티티 중요도 최적화: 유출에 언급된 엔티티 및 상위 엔티티 식별에 대한 중요도 점수를 개선하는 데 집중하세요.

  9. 실적이 저조한 페이지 제거: 사용자 지표가 낮고 백링크가 없는 페이지를 식별하고 제거하여 사이트 전체에서 높은 점수를 유지하세요.

panda

이전 버전의 문서에 대한 Google의 메모리를 제거하는 방법

유출된 정보에 따르면 Google은 웨이백 머신과 유사한 내부 웹 아카이브를 유지하면서 웹페이지의 모든 버전을 기록으로 보관하고 있습니다. 하지만 Google은 문서의 마지막 20개 버전만 사용합니다. 페이지를 업데이트하고 크롤링을 기다린 다음 이 과정을 20번 반복하면 특정 버전의 페이지를 효과적으로 밀어낼 수 있습니다. 이 전략은 이전 버전과 관련된 기록 가중치 및 점수를 개선하는 데 유용할 수 있습니다.

Google 검색 순위 시스템

Google Search Ranking System

이번 정보 유출을 통해 흥미로운 추측 중 하나는 용어 가중치(글자 크기)의 영향입니다. 단어를 굵게 표시하거나 단어의 크기를 조정하면 문서 점수에 영향을 미칠 수 있습니다. 또한 Google의 색인 저장 메커니즘은 콘텐츠의 우선순위를 다르게 지정합니다:

  • 플래시 드라이브: 가장 중요하고 정기적으로 업데이트되는 콘텐츠의 경우.

  • 솔리드 스테이트 드라이브: 덜 중요한 콘텐츠용.

  • 표준 하드 드라이브: 비정기적으로 업데이트되는 콘텐츠의 경우.

Google의 인덱서: 알렉산드리아

Alexandria

Google의 인덱서는 유명한 도서관의 이름을 딴 알렉산드리아라는 이름을 가지고 있습니다. 다른 인덱서로는 문서를 계층별로 배치하는 SegIndexer와 장기 메모리 저장을 처리하는 TeraGoogle이 있습니다.

시드 사이트 및 사이트 전체 권한

유출에는 isElectionAuthority라는 요소가 언급되어 있는데, 이는 시드 사이트 또는 토픽 당국을 나타내는 것으로 보입니다. 페이지 순위가 9/10인 사이트와 같이 높은 권한을 가진 사이트가 상당한 영향력을 가지고 있음을 시사합니다. 그러나 nsrI는 더 이상 사용되지 않는 것으로 간주되어 해석이 다소 모호합니다.

짧은 콘텐츠로 순위를 매길 수 있습니다.

일반적인 생각과는 달리, 짧은 콘텐츠는 얇은 콘텐츠와 같지 않습니다. 이번 유출로 인해 채점 방식이 다르긴 하지만 짧은 콘텐츠도 높은 순위를 차지할 수 있다는 사실이 확인되었습니다.

새 링크와 기존 링크 비교

프레시닥스 링크 가치 승수에 따르면 최신 웹페이지의 링크가 오래된 콘텐츠에 삽입된 링크보다 더 가치가 높습니다. 이는 틈새 편집도 효과적일 수 있지만 새로운 링크가 더 큰 영향을 미친다는 것을 나타냅니다.

즐겨 찾는 발견

페이지 품질(PQ)

Google은 LLM을 사용하여 문서 페이지의 '노력도'를 추정하여 페이지가 쉽게 복제될 수 있는지 여부를 결정합니다. 도구, 이미지, 동영상, 고유 정보 및 정보의 깊이는 노력도 계산에서 높은 점수를 받을 수 있는 방법입니다.

토픽 테두리 및 토픽 권한

사이트포커스스코어, 사이트반경, 사이트임베딩, 페이지임베딩이 지원하는 토픽 권한은 매우 중요합니다. 명확한 주제 집중도를 유지하고 주제에서 벗어나는 것을 최소화하면 순위를 높이는 데 도움이 됩니다.

이미지 품질

이미지 품질 클릭 신호는 클릭 데이터(유용성, 표현력, 매력도, 참여도)를 기반으로 이미지 품질을 측정합니다.

호스트 NSR

호스트 NSR은 호스트 수준 사이트 청크에 대해 계산된 사이트 순위로, 세그먼트 단위로 품질을 측정합니다. 이 청크 시스템은 Google이 사이트 품질을 종합적으로 평가하는 데 도움이 됩니다.

통합 랭킹 이론

이 섹션에서는 유출의 요인을 수학 공식으로 통합하여 다양한 메트릭과 전체 순위 점수에 미치는 영향을 강조합니다.

정의 및 지표

formula

사용자 상호작용 점수(UIS):

formula

  • UgcScore: 사용자 생성 콘텐츠 참여도.

  • 타이틀매치점수: 사용자 쿼리에 대한 제목의 관련성입니다.

  • ChromeInTotal: Chrome을 통해 추적된 총 상호작용 수입니다.

  • 사이트 노출 수: 총 사이트 노출 수입니다.

  • 주제 노출 수: 주제별 페이지에 대한 노출 수입니다.

  • SiteClicks: 사이트의 클릭률입니다.

  • 토픽클릭: 주제별 페이지의 클릭률입니다.

콘텐츠 품질 점수(CQS):

formula

  • 이미지 품질 클릭 신호: 이미지 클릭의 품질 신호입니다.

  • 비디오스코어: 동영상 콘텐츠의 품질과 참여도를 측정합니다.

  • 쇼핑 점수: 쇼핑 관련 콘텐츠에 대한 점수입니다.

  • 페이지 임베딩: 페이지 콘텐츠의 시맨틱 임베딩.

  • 사이트 임베딩: 사이트 콘텐츠의 시맨틱 임베딩.

  • SiteRadius: 사이트 임베딩 내 편차 측정값입니다.

  • SiteFocus: 주제 집중도를 나타내는 메트릭입니다.

  • 텍스트 신뢰도: 텍스트의 관련성 및 품질에 대한 신뢰도입니다.

  • 노력 점수: 콘텐츠 제작의 노력과 품질을 측정합니다.

링크 점수(LS):

Link Scores

  • 트러스티드앵커: 인바운드 링크의 품질 및 신뢰도.

  • SiteLinkIn: 들어오는 링크의 평균값입니다.

  • 페이지랭크: 다양한 페이지 순위 점수(0, 1, 2, 툴바, NR).

연관성 부스트(RB):

Relevance Boost

  • 토픽 임베딩: 시간 경과에 따른 관련성.

  • QnA: 기준 품질 측정.

  • STS: 텍스트 이해도, 중요도 및 엔티티를 기반으로 한 종합 점수입니다.

품질 부스트(QB):

Quality Boost

  • SAS: 신뢰도, 신뢰성 및 링크 권한과 관련된 사이트 권한 점수입니다.

  • EFTS: 텍스트, 멀티미디어 및 댓글을 통합한 노력 점수입니다.

  • FS: 업데이트 및 최초 게시물 날짜를 기준으로 한 신선도 점수입니다.

  • CSA: SERP 및 온페이지 기능에 기반한 콘텐츠별 조정.

CSA

콘텐츠별 조정(CSA):

  • CDS: 사이트 전체의 노출 수와 클릭 수에 초점을 맞춘 Chrome 데이터 점수입니다.

  • SDS: SERP 경험 측정에 따른 SERP 강등 점수입니다.

  • EQSS: 실험 변수에 대한 실험 Q스타 점수입니다.

전체 공식

R=(∑i=17wi⋅UISi)+(∑i=19vi⋅CQSi)+(∑i=13xi⋅LSi)×(RB+QB+X)-

R=((w1​⋅UgcScore+w2​⋅TitleMatchScore+w3​⋅ChromeInTotal+w4​⋅SiteImpressions+w5​⋅TopicImpressions+w6​⋅SiteClicks+w7​⋅TopicClicks)+(v1​⋅ImageQualityClickSignals+v2​⋅VideoScore+v3​⋅ShoppingScore+v4​⋅PageEmbedding+v5​⋅SiteEmbedding+v6​⋅SiteRadius+v7​⋅SiteFocus+v8​⋅TextConfidence+v9​⋅EffortScore)+(x1​⋅TrustedAnchors+x2​⋅SiteLinkIn+x3​⋅PageRank))×(TopicEmbedding+QnA+STS+SAS+EFTS+FS)+(y1​⋅CDS+y2​⋅SDS+y3​⋅EQSS)

일반화된 채점 개요

1. 사용자 참여:

  • UgcScore, 타이틀매치스코어, 크롬인토탈, 사이트 노출 수, 토픽 노출 수, 사이트 클릭 수, 토픽 클릭 수

2. 멀티미디어 점수:

  • 이미지품질클릭신호, 비디오스코어, 쇼핑스코어

3. 링크:

  • TrustedAnchors, SiteLinkIn(들어오는 링크의 평균값), PageRank(0, 1, 2, ToolBar, NR)

4. 콘텐츠 이해:

  • 페이지 임베딩, 사이트 임베딩, 사이트 반경, 사이트 포커스, 텍스트 신뢰도, 노력 점수

결론

이번 문서 유출은 Google의 순위 메커니즘에 대한 귀중한 인사이트를 제공하며, 몇 가지 잘못된 통념을 폭로하고 검색 결과에 영향을 미치는 복잡한 요인을 밝혀냈습니다. SEO 전문가는 이러한 지식을 활용하여 사용자 참여, 주제 관련성, 일관된 콘텐츠 품질에 중점을 두고 전략을 개선할 수 있습니다. SEO 커뮤니티가 이러한 새로운 정보를 소화함에 따라 많은 사람들이 새로운 정보에 비추어 접근 방식을 재고할 것입니다.

SEO 실무자는 이러한 인사이트를 이해하고 적용함으로써 복잡한 Google 순위 시스템을 더 잘 탐색하여 궁극적으로 검색 결과에서 웹사이트의 가시성과 실적을 향상시킬 수 있습니다.

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

랭크트래커 사용 시작하기... 무료로!

웹사이트의 순위를 떨어뜨리는 요인이 무엇인지 알아보세요.

무료 계정 만들기

또는 자격 증명을 사용하여 로그인

Different views of Ranktracker app