Codex work log
Codexでsitemap内404を分類し、do_not_touchだけ残した実践ログ
このページは、codexguide.jp の sitemap 内404を、確認、分類、内部リンク修正、sitemap整理、最終確認の順に扱った実践ログです。404が見つかったからといって、すぐ新規ページを作るのではなく、まず「作るべきURLか」「消してよいURLか」「触らないURLか」を分けました。
公開してよい範囲だけに一般化しています。サーバーの絶対パス、ローカルPCのパス、バックアップ詳細、広告タグや所有権確認タグの値、認証情報、内部スクリプト名は載せていません。
今回の出発点
最初に確認した時点で、sitemap内には404が25件ありました。ただし、そのすべてを新規ページとして作る判断には進みませんでした。
- sitemap内404を一覧化した
- 内部リンク元があるかを確認した
- 既存受け皿があるかを確認した
- 過去の作成予定や保留理由があるかを分けた
- do_not_touchとして残すべきURLを分けた
結果として、最終的なsitemap内404は1件だけになり、その1件は意図的に残す do_not_touch として扱いました。
404をすぐ新規作成しなかった理由
sitemapに404があると、つい「ページを作って埋める」方向に行きたくなります。しかし、未作成URLには、古い予定、重複テーマ、内部リンクの残骸、削除候補、保留対象が混ざります。
薄い新規ページを増やすより、まず分類して、作る価値があるものと整理すべきものを分ける方が安全です。
| 確認すること | 判断の意味 |
|---|---|
| 内部リンク元 | リンク元がある404は、sitemapより先にリンク元の文脈を確認します。 |
| 既存受け皿 | 近い公開ページがある場合、新規作成より既存ページへの整理が自然なことがあります。 |
| 作成価値 | 検索意図やサイト構成上の意味が弱いURLは、作らない判断もあります。 |
| 保留理由 | manual_review や do_not_touch は、理由を残して急がず扱います。 |
A/B/F/Gに分類した
今回の404整理では、URLを一律に削除せず、作業単位ごとに分類しました。
| 分類 | 扱い | 今回の意味 |
|---|---|---|
| A | sitemap削除候補 | 内部リンク元や作成価値を確認し、sitemapから外す対象です。 |
| B | 内部リンク修正候補 | リンク元があるため、先にリンク元ページの文脈を確認します。 |
| F | manual_review | 判断を急がず、個別確認してからsitemap整理へ進めます。 |
| G | do_not_touch | 意図的に残す理由があるため、新規作成、削除、リンク修正、リダイレクトをしません。 |
内部リンク元あり404を先に処理した
内部リンク元がある404は、sitemapだけを見て削除すると、ページ本文側に壊れた導線が残ることがあります。そこで、まずリンク元ページを確認しました。
- リンク元がある404を先に確認した
- 正しい受け皿が不明なものは、新規ページ化せずテキスト化した
- do_not_touchに分類したURLはリンク化しなかった
- header、footer、common nav由来の404ではないことを確認した
この段階で、通常リンクとして残すべきではない404への導線を減らし、後続のsitemap整理に進める状態にしました。
sitemapだけに残った404を削除した
内部リンク元や保留理由を分けたあと、sitemapだけに残っていた404を段階的に整理しました。
- A分類のsitemap削除候補21件をsitemapから外した
- manual_reviewだった1件は、確認後にsitemapから外した
- B分類の2件は、内部リンク修正後に条件一致としてsitemapから外した
- 新規ページ作成やリダイレクトは行わなかった
この流れにより、sitemapは609URLになり、重複なし、500/403なし、canonical差分候補なし、noindex混入なしの状態まで確認しました。
最後に残した404
最後に残った404は、/claude-code-latest-workflow/ です。このURLは do_not_touch として扱い、削除、作成、リダイレクト、リンク修正を行いませんでした。
- sitemapには掲載されたまま
- 内部リンク元は関連ブロック由来で、共通ナビ由来ではない
- header、footer、common navからの導線ではない
- 意図的に残す理由を記録した
do_not_touchは「放置」ではなく、「今は触らない理由を明示して残す」扱いです。
最終確認で見たこと
XMLパース、URL数、重複、残存404、500/403、noindex、canonical差分候補を確認しました。
トップ、実践ログ一覧、関連ログ、内部リンク元ページが200であることを確認しました。
robots.txt、ads.txt、既存SEOタグ、広告タグ、所有権確認タグを不要に変更しない方針にしました。
スマホ幅でも横スクロールが出ないよう、表とカードは折り返し前提にしています。
次回同じ作業をするときのチェック
- sitemap内404を一覧化する
- 内部リンク元を確認する
- 既存受け皿ページを探す
- A/B/F/Gのように分類する
- manual_reviewは個別確認後に判断する
- do_not_touchは理由を残して触らない
- sitemap削除候補だけをsitemapから外す
- 最後にsitemap、robots、ads、主要URL、内部リンクを確認する
関連ページ
FAQ
sitemapに404があるとき、すぐページを作るべきですか?
まず内部リンク元、既存受け皿、Search Console反応、過去の作成予定を確認します。作成価値がないURLは、新規ページ作成ではなくsitemap整理が安全な場合があります。
do_not_touchの404は残してよいですか?
意図的に残す理由があり、共通ナビや重要導線から飛んでいない場合は、無理に削除・作成しない判断もあります。理由を記録しておくことが重要です。
sitemap整理で触らない方がよいものは何ですか?
robots.txt、.htaccess、canonical、noindex、AdSenseやSearch Consoleのタグ、共通ナビなどは、明確な理由がない限り触らない方が安全です。
