티스토리 뷰

sitemap.xml은 웹사이트의 구조를 검색 엔진에 효율적으로 전달하기 위해 사용되는 XML 형식의 파일입니다. 이 파일은 검색 엔진 크롤러(예: Googlebot)가 사이트의 페이지를 더 잘 이해하고 인덱싱할 수 있도록 돕는 역할을합니다. 아래에서 sitemap.xml에 대한 주요 개념과 작성 방법을 설명하겠습니다.

 

1. Sitemap이란?

  • Sitemap은 웹사이트의 페이지 목록을 제공하는 파일로, 검색 엔진 크롤러가 사이트의 컨텐츠를 쉽게 탐색하고 인덱싱할 수 있게 합니다.
  • 보통 sitemap.xml이라는 이름으로 저장되며, 사이트의 루트 디렉토리에 위치합니다.

 

2. Sitemap이 중요한 이유

  1. 효율적인 크롤링
    • 검색 엔진은 사이트의 모든 페이지를 자동으로 발견하지 못할 수 있습니다. sitemap.xml은 이러한 문제를 해결해 크롤러가 중요한 페이지를 빠르게 찾도록 돕습니다.
  2. 검색 노출 개선
    • 중요한 페이지(예: 제품 페이지, 블로그 글 등)를 검색 엔진에 명확히 알릴 수 있습니다.
    • 동적으로 생성되거나 URL이 복잡한 페이지는 크롤러가 발견하기 어려운데, 이를 보완합니다.
  3. 새로운 컨텐츠 전달
    • 새롭게 추가되거나 업데이트된 페이지를 검색 엔진에 빠르게 전달할 수 있습니다.
  4. SEO 강화
    • 검색 엔진이 사이트를 더 잘 이해하게 함으로써 검색 순위 개선에 기여할 수 있습니다.

 

3. Sitemap 파일의 구조

sitemap.xml 파일은 다음과 같은 기본 구조의 XML 형식으로 작성됩니다.

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/</loc>
    <lastmod>2024-11-13</lastmod>
    <changefreq>daily</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>https://example.com/blog/</loc>
    <lastmod>2024-11-10</lastmod>
    <changefreq>weekly</changefreq>
    <priority>0.8</priority>
  </url>
</urlset>

태그 설명

  • <urlset>: Sitemap의 루트 요소로, 여러 <url> 태그를 포함합니다.
  • <url>: 각 URL을 정의하는 요소
    • <loc>: 페이지의 URL
    • <lastmod>: 페이지가 마지막으로 수정된 날짜 (ISO 8601 형식, YYYY-MM-DD)
    • <changefreq>: 페이지 변경 빈도를 나타냄 (always, hourly, daily, weekly, monthly, yearly, never 중 하나)
    • <priority>: 검색 엔진에 페이지의 상대적 중요도를 알림 (범위: 0.0 ~ 1.0)

 

4. Sitemap 작성 및 관리 방법

  1. 수동 작성
    • 소규모 웹사이트라면, 위 예시처럼 직접 XML 파일을 작성하여 서버에 업로드합니다.
  2. 자동 생성
    • 워드프레스, Wix 등의 플랫폼은 자동으로 Sitemap을 생성합니다.
    • CMS나 프레임워크(예: Django, Laravel)에서도 플러그인 또는 모듈로 쉽게 생성 가능
  3. 도구 활용
    • Google Search Console: 사이트맵 업로드 및 상태 확인
    • Sitemap Generator: 온라인 도구를 사용하여 사이트맵을 생성
  4. 업데이트 관리
    • 새 페이지를 추가하거나 기존 페이지를 수정한 경우, Sitemap을 주기적으로 업데이트하고 다시 제출해야 합니다.

 

5. Sitemap 제출 방법

1. Google Search Console에서 제출

  • Google Search Console에 로그인 후, 색인(Index) > Sitemaps로 이동
  • sitemap.xml 파일 경로 입력 후 제출

2. robots.txt에 포함

  • robots.txt 파일에 Sitemap의 위치를 명시합니다.
User-agent: *
Disallow:
Sitemap: https://example.com/sitemap.xml

3. Ping 요청

  • 검색 엔진에 직접 Sitemap을 알릴 수도 있습니다.
https://www.google.com/ping?sitemap=https://example.com/sitemap.xml

 

728x90