
소개
전 세계 시장 점유율 기준으로 4번째로 큰 검색 엔진 인 Yandex에 대해 들어보셨을 것입니다. 어제 Yandex의 독점 소스 코드가 유출되었습니다.
SEO 커뮤니티에서 가장 흥미로운 부분은 검색 알고리즘에 사용되는 1922개의 모든 순위 요소 목록입니다.
코드를 다운로드하고 분석하여 여기에 유용한 방식으로 제시했습니다.
![]()
Yandex나 그 제품은 종종 사이버 공격을 받아왔기 때문에 이번 사건은 놀랄 일이 아닙니다. 2016년에는 한 다크웹 판매업체가 630만 개의 Yandex 사용자 계정 데이터를 판매한 사실을 Hackread.com이 단독 보도한 바 있습니다.
2021년 9월, 러시아의 거대 검색 엔진 업체는 20만 대의 손상된 IoT 디바이스를 이용한 대규모 디도스 공격에 시달렸습니다.
효과적인 SEO를 위한 올인원 플랫폼
모든 성공적인 비즈니스의 배후에는 강력한 SEO 캠페인이 있습니다. 하지만 선택할 수 있는 최적화 도구와 기법이 무수히 많기 때문에 어디서부터 시작해야 할지 알기 어려울 수 있습니다. 이제 걱정하지 마세요. 제가 도와드릴 수 있는 방법이 있으니까요. 효과적인 SEO를 위한 Ranktracker 올인원 플랫폼을 소개합니다.
![]()
왜 이렇게 큰가요?
Yandex는 러시아에서 가장 큰 IT 회사 중 하나입니다. 러시아 내에서 구글보다 더 광범위한 서비스를 제공합니다. 구글, 우버, 아마존, 넷플릭스, 스포티파이를 대체하는 회사가 하나 있다고 상상해 보세요.
이 유출이 진짜인가요?
저는 개인적으로 Yandex에서 일한 적은 없지만, 다른 시기에 그곳에서 일했거나 지금도 그곳에서 일하는 여러 사람을 알고 있습니다. 적어도 일부 아카이브에는 회사 서비스에 대한 최신 소스 코드와 실제 인트라넷 URL을 가리키는 문서가 포함되어 있음을 확인했습니다.
내부 내용
유출자는 44.7GB의 파일이 포함된 마그넷 링크를 공유했으며, 이 마그넷 링크는 Yandex git 소스에 연결되어 있습니다. 이 파일은 2022년 7월에 Yandex에서 도난당한 것으로 추정됩니다. 이 코드 저장소에는 스팸 방지 가이드라인이 포함되어 있을 뿐만 아니라 Yandex의 소스 코드가 있는 것으로 추정됩니다.
이 유출로 인해 검색 엔진이 검색 알고리즘에 사용하는 약 1,922개의 순위 요소가 공개되었습니다. 이 코드는 토렌트로 유출되었습니다. 트위터 사용자 Alex Buraks가 게시한 분석에 따르면, 유출된 데이터에는 텍스트 관련성, 페이지랭크, 콘텐츠 연령, 최신성 등 다양한 순위 요소가 포함되어 있습니다.
전 세계 시장 점유율 기준으로 4번째로 큰 검색 엔진인 Yandex에 대해 들어보셨을 것입니다. 어제 Yandex의 독점 소스 코드가 유출되었습니다.
- 알렉스 부락스 (@alex_buraks) 1월 27일, 2023
SEO 커뮤니티에서 가장 흥미로운 부분은 검색 알고리즘에 사용되는 1922개의 모든 순위 요소 목록입니다.
[🧵THREAD] pic.twitter.com/6x82AAmbON
또한 최종 사용자 행동 요인, 링크 관련 요인, 호스트 신뢰도 등 여러 가지 요소가 존재합니다. SEO는 순 방문자 수, 쿼리별 평균 도메인 순위, 오가닉 트래픽 비율 등 몇 가지 특이한 순위 요소를 찾습니다.
적어도 얀덱스의 모든 주요 서비스에 대한 소스 코드가 유출된 것으로 보입니다:
- 검색 엔진 및 인덱싱 봇
- 지도 - Google 지도 및 거리 뷰처럼
- Alice - Siri / Alexa와 같은 AI 비서
- 택시 - 우버와 유사한 택시 서비스
- 다이렉트 - 구글 애즈/애드워즈와 같은 광고 서비스
- 메일 - GMail과 같은 메일 서비스
- 디스크 - Google 드라이브와 같은 파일 저장 서비스
- 마켓 - Amazon과 같은 마켓플레이스
- 여행 - Booking.com과 비행기, 기차, 버스 티켓처럼
- Yandex360 - 내 도메인의 서비스를 위한 Google 워크스페이스와 같은 서비스
- 클라우드 - 모든 인프라 코드가 유출된 것은 아닐 수 있습니다.
- Pay - Stripe와 같은 결제 처리이지만 기능이 제한되어 있습니다.
- Metrika - 구글 애널리틱스처럼
- 그리고 적어도 대부분의 다른 회사 서비스의 백엔드 부분은 있습니다. "프론트엔드"라고 불리는 가장 큰 아카이브는 아직 탐색되지 않았습니다.
셰스타코프는 또한 배포를 테스트하는 데 사용되었을 가능성이 높은 몇 가지 API 키에 대해서도 언급했습니다.
이번 유출에 대한 자세한 내용은 여기에서 확인할 수 있습니다:
https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/
Yandex, 해킹 시도 부인
Yandex는 유출 사실을 인지하고 있으며 소스 코드 '조각'이 어떻게 대중에게 노출되었는지 확인하기 위해 이미 조사를 시작했다고 주장합니다. 이번 유출에는 사용자 또는 직원의 개인 데이터는 포함되지 않았다는 점은 주목할 가치가 있습니다.
그러나 러시아의 IT 인프라에서 얀덱스가 차지하는 중요성과 유출된 데이터를 고려할 때, 이번 공격은 러시아의 우크라이나 침공이 동기가 된 것으로 추정할 수 있습니다. 따라서 친우크라이나 해커가 연루되었을 가능성이 있습니다.
