PR

Googleのインデックスに登録されていないページを簡単に探す方法

スポンサーリンク
インデックスに登録されていないページを探す SEO対策
インデックスに登録されていないページを探す
SEO対策
記事内に広告が含まれています。

ブログの訪問者を増やすためには、検索サイトへ登録されていることが前提になります。読者は検索サイトを使って情報を探そうとするので、登録されていなければ目につかないのです。WEB上の検索サイトで見えなければ誰も訪問しません。

検索サイトは、Google、Yahoo、Bingなど多数ありますが、日本で最も使われている検索サイトはGoogleです。そこでGoogleにインデックス登録されていることが訪問者を増やすための最低条件になります。

ところが、力を込めて一生懸命に書いた記事でも、ときどきGoogleのインデックス登録から除外されてしまうことがあります。インデックスに登録されない原因は、Googleの複雑なアルゴリズムによる評価の結果なのですが、一般的に言われていることは、低品質なコンテンツ、読者が求めていない情報、すでに同様の記事が登録されているような場合です。

そこで、Googleのインデックスに登録されてないページを探して、ときどきリライトする必要があるわけです。この解説では、Googleのインデックスに登録されてないページを簡単に探す方法を解説します。

スポンサーリンク

インデックスに登録されてないページを探す手順

この解説では、WordPressでブログを公開しており、すでにGoogle Search Console へ登録済であることを前提にしています。

Googleのインデックスに登録されてないページを探す方法は、次の手順になります。

1.Google Search Console から「クロール済み – インデックス未登録」のデータをGoogle スプレッドシートへダウンロードする。

2.余計なデータ(feedやtagなど、Googlebotが機械的に取り込んだデータ)を削除する。

3.インデックスに登録されてない記事のURLだけ抽出する。

スポンサーリンク

インデックスに登録されてないページを探す具体例

最初にGoogle Search Consoleの「ページ」を選択します。

Google Search Consoleの「ページ」を選択

次に、「クロール済み – インデックス未登録」を選びます。

クロール済み - インデックス未登録を選びます。

このページが、Googleのインデックスに登録されてないページになります。巡回ロボットGooglebotが、サイトのページを見たけど、何かの理由でインデックス登録不要と判断したものです。低品質あるいは類似のページがあるのかも知れません。登録されない原因はひとつではなく、Googleの複雑なアルゴリズムで判断されています。また、一度登録されても、後から未登録になることもあります。

「クロール済み – インデックス未登録」のデータをダウンロードします。「エクスポート」を選びます。

「エクスポート」を選びます。

エクスポートのGoogle スプレッドシートを選びます。

Google スプレッドシートを選びます。

Google スプレッドシートを開いて、タブの「表」を選択します。

タブの「表」を選択します。

URLが見やすいように、幅を広げておきます。

A列全体を選択します。

A列全体を選択します。

A列にフィルターをかけます。「メニュー」の「データ」から「フィルタを作成」を選びます。

フィルターの三角部分を選びます。

フィルターの三角部分を選びます。

「条件でフィルタ」の「カスタム数式」を選びます。

「条件でフィルタ」の「カスタム数式」を選びます。

入力ボックスへ次の関数を入力し、OKボタンを押してください。こちらから関数のテキストファイルをダウンロードできます。下記赤字の関数をコピーすると、ダブルクォーテーションが全角になってしまうので、半角へ変換する必要があります。関数は、すべて半角文字です。

=OR(REGEXMATCH(A:A, “/feed”), REGEXMATCH(A:A, “/page/”), REGEXMATCH(A:A, “/tag/”), REGEXMATCH(A:A, “/?amp”), REGEXMATCH(A:A, “/?cat”), REGEXMATCH(A:A, “/wp-content/”))

フィルタをかけると、次のように記事URLではない、タグ /tag/ やRSS配信データ /feed/などの様々なデータが抽出されます。これらを全て削除すると記事のURLが抽出できます。

抽出されたデータを選択します。最初の行の左端の行番号をクリックし、次に最下行までスクロールし、最下行の左端の行番号を「SHIFTキー」を押しながらクリックすると、すべて選択できます。

右クリックでメニューを開き、「選択した行を削除」を選びます。これで余計なデータが削除できます。

最後に、「メニュー」の「データ」から「フィルタを削除」します。

すると、Googleのインデックスに登録されてないページのURLだけが抽出されます。このURLを基にして記事をリライトして、再度インデックス登録のリクエストすることをおすすめします。数か月に一度くらいリストを作成しておき、順番にリライトしていきましょう。

スポンサーリンク

フィルタの関数を変更する場合

この解説では、次のいずれかのテキスト文字が含まれるURLを抽出する関数になっています。

/feed  RSS配信用データ

/page/  リストページ

/tag/  タグ

/?amp  AMPページ

/?cat  リストページ

/wp-content/  テーマなどのシステムデータ

この解説で使っている関数

=OR(REGEXMATCH(A:A, “/feed“), REGEXMATCH(A:A, “/page/“), REGEXMATCH(A:A, “/tag/“), REGEXMATCH(A:A, “/?amp“), REGEXMATCH(A:A, “/?cat“), REGEXMATCH(A:A, “/wp-content/“))

これらの赤文字部分を修正すれば、他の条件で抽出できます。追加したり削除するときは、REGEXMATCH(A:A, “〇〇“) の関数単位で変えてください。増やすときはカンマで区切ります。

タイトルとURLをコピーしました