Codex work log

Codexでsitemap内404を分類し、do_not_touchだけ残した実践ログ

このページは、codexguide.jp の sitemap 内404を、確認、分類、内部リンク修正、sitemap整理、最終確認の順に扱った実践ログです。404が見つかったからといって、すぐ新規ページを作るのではなく、まず「作るべきURLか」「消してよいURLか」「触らないURLか」を分けました。

公開してよい範囲だけに一般化しています。サーバーの絶対パス、ローカルPCのパス、バックアップ詳細、広告タグや所有権確認タグの値、認証情報、内部スクリプト名は載せていません。

今回の出発点

最初に確認した時点で、sitemap内には404が25件ありました。ただし、そのすべてを新規ページとして作る判断には進みませんでした。

  • sitemap内404を一覧化した
  • 内部リンク元があるかを確認した
  • 既存受け皿があるかを確認した
  • 過去の作成予定や保留理由があるかを分けた
  • do_not_touchとして残すべきURLを分けた

結果として、最終的なsitemap内404は1件だけになり、その1件は意図的に残す do_not_touch として扱いました。

404をすぐ新規作成しなかった理由

sitemapに404があると、つい「ページを作って埋める」方向に行きたくなります。しかし、未作成URLには、古い予定、重複テーマ、内部リンクの残骸、削除候補、保留対象が混ざります。

薄い新規ページを増やすより、まず分類して、作る価値があるものと整理すべきものを分ける方が安全です。

確認すること判断の意味
内部リンク元リンク元がある404は、sitemapより先にリンク元の文脈を確認します。
既存受け皿近い公開ページがある場合、新規作成より既存ページへの整理が自然なことがあります。
作成価値検索意図やサイト構成上の意味が弱いURLは、作らない判断もあります。
保留理由manual_review や do_not_touch は、理由を残して急がず扱います。

A/B/F/Gに分類した

今回の404整理では、URLを一律に削除せず、作業単位ごとに分類しました。

分類扱い今回の意味
Asitemap削除候補内部リンク元や作成価値を確認し、sitemapから外す対象です。
B内部リンク修正候補リンク元があるため、先にリンク元ページの文脈を確認します。
Fmanual_review判断を急がず、個別確認してからsitemap整理へ進めます。
Gdo_not_touch意図的に残す理由があるため、新規作成、削除、リンク修正、リダイレクトをしません。

内部リンク元あり404を先に処理した

内部リンク元がある404は、sitemapだけを見て削除すると、ページ本文側に壊れた導線が残ることがあります。そこで、まずリンク元ページを確認しました。

  • リンク元がある404を先に確認した
  • 正しい受け皿が不明なものは、新規ページ化せずテキスト化した
  • do_not_touchに分類したURLはリンク化しなかった
  • header、footer、common nav由来の404ではないことを確認した

この段階で、通常リンクとして残すべきではない404への導線を減らし、後続のsitemap整理に進める状態にしました。

sitemapだけに残った404を削除した

内部リンク元や保留理由を分けたあと、sitemapだけに残っていた404を段階的に整理しました。

  • A分類のsitemap削除候補21件をsitemapから外した
  • manual_reviewだった1件は、確認後にsitemapから外した
  • B分類の2件は、内部リンク修正後に条件一致としてsitemapから外した
  • 新規ページ作成やリダイレクトは行わなかった

この流れにより、sitemapは609URLになり、重複なし、500/403なし、canonical差分候補なし、noindex混入なしの状態まで確認しました。

最後に残した404

最後に残った404は、/claude-code-latest-workflow/ です。このURLは do_not_touch として扱い、削除、作成、リダイレクト、リンク修正を行いませんでした。

  • sitemapには掲載されたまま
  • 内部リンク元は関連ブロック由来で、共通ナビ由来ではない
  • header、footer、common navからの導線ではない
  • 意図的に残す理由を記録した

do_not_touchは「放置」ではなく、「今は触らない理由を明示して残す」扱いです。

最終確認で見たこと

sitemap

XMLパース、URL数、重複、残存404、500/403、noindex、canonical差分候補を確認しました。

主要URL

トップ、実践ログ一覧、関連ログ、内部リンク元ページが200であることを確認しました。

安全面

robots.txt、ads.txt、既存SEOタグ、広告タグ、所有権確認タグを不要に変更しない方針にしました。

表示

スマホ幅でも横スクロールが出ないよう、表とカードは折り返し前提にしています。

次回同じ作業をするときのチェック

  1. sitemap内404を一覧化する
  2. 内部リンク元を確認する
  3. 既存受け皿ページを探す
  4. A/B/F/Gのように分類する
  5. manual_reviewは個別確認後に判断する
  6. do_not_touchは理由を残して触らない
  7. sitemap削除候補だけをsitemapから外す
  8. 最後にsitemap、robots、ads、主要URL、内部リンクを確認する

関連ページ

FAQ

sitemapに404があるとき、すぐページを作るべきですか?

まず内部リンク元、既存受け皿、Search Console反応、過去の作成予定を確認します。作成価値がないURLは、新規ページ作成ではなくsitemap整理が安全な場合があります。

do_not_touchの404は残してよいですか?

意図的に残す理由があり、共通ナビや重要導線から飛んでいない場合は、無理に削除・作成しない判断もあります。理由を記録しておくことが重要です。

sitemap整理で触らない方がよいものは何ですか?

robots.txt、.htaccess、canonical、noindex、AdSenseやSearch Consoleのタグ、共通ナビなどは、明確な理由がない限り触らない方が安全です。