目次
- このページで分かること
- それぞれの役割
- sitemapに入れるURLと入れないURL
- 注意点
- Codex指示文例
- 確認チェックリスト
- 関連ページ
このページで分かること
sitemap.xmlは重要URLを伝えるためのファイル、robots.txtはクロールに関する入口の制御、canonicalは正規URLを示す要素として使われます。どれも小さく見えて影響が大きいため、Codexにはまず確認だけを頼むのが安全です。
それぞれの役割
- sitemap.xml: index対象として見せたいURLを整理する
- robots.txt: クロールに関する基本的な案内を置く
- canonical: 同じ内容に近いURLの正規URLを示す
- robots meta: index/noindexなどページ単位の扱いを見る
sitemapに入れるURLと入れないURL
sitemapには、基本的にHTTP 200で表示でき、index対象で、canonicalが自己URLのページを入れます。query付きURL、2ページ目以降、noindexページ、未作成URL、404 URLは、意図がない限り入れない方が安全です。
注意点
- robotsで雑に塞がない
- canonicalを勝手に変えない
- query付きURLを安易にsitemapへ入れない
- 2ページ目以降に同じguideを出しすぎない
- Search Consoleの結果保証をしない
- 判断が必要なら確認結果で止める
Codex指示文例
対象URLがsitemap.xmlに掲載されているか確認してください。対象URLのHTTP 200、canonical、robots index,follow、noindex有無も確認してください。sitemapやcanonicalは勝手に変更せず、まず確認結果を報告してください。確認チェックリスト
- sitemap.xmlが200 OK
- 対象URLが掲載されている
- 対象URLが200 OK
- canonicalを確認した
- robotsを確認した
- noindexがない
- query付きURLではない
- 未作成URLを入れていない
- 変更前に判断を止めた

