サイト内検索はこれだけある!簡単便利な5つの方法をご紹介(リンク検索・全文検索・商品検索)

サイト内検索はこれだけある!簡単便利な5つの方法をご紹介(リンク検索・全文検索・商品検索)

サイト内検索はこれだけある!簡単便利な5つの方法をご紹介(リンク検索・全文検索・商品検索)

サイト内検索にはサイト全体を対象にした検索方法が豊富にあります。

Googleカスタム検索(Chromeプラグイン)、siteコマンド検索、リンク切れチェックツール(Wordpressプラグイン)、独自検索エンジン登録などです。

Googleのインデックス情報をもとにした検索は生データの検索ではないので注意しましょう。

様々なサイト内検索の仕方がある

WEBサイトで文字テキストやリンク、あるいは商品などのコンテンツの位置を検索する事ってよくありますよね。

基本的に、特定された1ページ内でテキストや単語の検索をする場合は非常に簡単です。

そのページを開いて「Ctrl+F」を押すだけですね。

検索語句をハイライト表示

検索ボックスが出てくるので、検索したい単語を入力してEnterをするとその該当箇所をハイライト表示してくれます。

ハイライト表示の状態

複数ある場合は矢印で「前の部分」「次の部分」とハイライト箇所が移っていくので、すぐに該当箇所が探せますよね。

よく使われる5つの検索方法

本記事では特にサイト全体において、目的の文字列やURL・リンクを探す方法をピックアップしてご紹介します。

サイト内にあるのはわかっているけど、どのページにあるのかがわからない場合ですね。

他にも方法はたくさんありますが、本記事では簡単便利を念頭に主な5つの方法を取り上げてみました。

Googleカスタム検索

そもそもそのWEBサイト内にGoogleの検索ボックスがついていれば、検索は非常に簡単です。

Googleのインデックス情報をもとに検索された文字列を探してくれる、いわゆる「Googleカスタム検索」ですね。

Googleカスタム検索
Googleカスタム検索ボックスの例

これはかなり前から一般的に知られている機能だと思います。

Googleカスタム検索の設置方法

Googleアカウントでログインをし、検索ボックスを付けるWEBサイトを登録してコードを出力します。

Googleカスタム検索設定

コードをWEBサイト内に設置すれば、カスタム検索ボックスが表示されます。

コードの設置方法の詳細はここでは割愛します。

当然の事ですが、Googleカスタム検索ボックスはサイト管理者でなければサイト内に設置ができません。

あなたが調べようとしている対象のWEBサイトにこのGoogleカスタム検索が付いていない場合は、この検索は使えないのです。

ChromeプラグインによるGoogleカスタム検索

上記でカスタム検索ボックスが無いと使えないと言いましたが、今は違います。

GoogleChromeのプラグインの中に、Googleカスタム検索と同じ機能があります。

それが「Search the current site」プラグインです。

Search the current site

このプラグインを使う事により、Googleカスタム検索のボックスが用意されていないWEBサイトでもサイト内検索が可能です。

インストール

「Chromeウェブストア」を開きます。

https://chrome.google.com/webstore/category/extensions?hl=ja

左上の「ストア検索」ボックス内に「current site」などと検索すると、プラグインが表示されますのでインストールしましょう。

Search the current siteプラグイン

使い方

対象のWEBページをChromeで開いて、右上の「拡張機能」のアイコンから「Search the current site」を選択します。

Search the current siteプラグインの使い方

検索ボックスが表示されますので、キーワードを入力すればGoogleによるサイト検索一覧リストが表示されます。

検索ボックス

このプラグインを入れておけばどんなWEBサイトでも、Googleがインデックスしている情報範囲であれば検索が可能です。

siteコマンドを使ったサイト内検索

サイト調査に使う様々なツールの中でシンプルなのが、Googleの「site:」コマンドですね。

例えば「site:example.com」と検索すると、検索対象のWEBサイトでインデックスされているページ数をGoogleが概算で返してくれます。

lpegのインデックス検索

「site:example.com/xxx」とすれば特定ディレクトリ内のインデックス状況なども確認できます。

サイト内の全文検索

ここでサイト内の全ページのコンテンツを対象に検索するためには「site:example.com テキスト」と検索します。

site:ドメイン名(半角スペース)文字列

この場合検索テキストの内容にもよりますが、Googleは全ての可能性を拾うので、正常に検索できない場合もあります。

そこでより確実にテキスト検索したい場合は「site:example.com "テキスト"」とします。

site:ドメイン名(半角スペース)"文字列"

XSS完全一致によるサイト内検索
「XSS」完全一致によるサイト内検索の例

この様に引用符で囲む事で、完全一致するページの一覧を検索する事ができます。

URL検索の場合

余談ですが、WEBサイト内のURL検索に使うのが「site:example.com inurl:〇〇」です。

これはURLの中に「〇〇」の単語を含む(或いは含まない)アドレスを検索してくれます。

含まない命令は「-inurl」と表現します。

例えば「site:example.com -inurl:○○ -inurl:△△ -inurl:××」とすると、○○と△△と××を含まないURL検索になります。

特定ディレクトリを除外したサイト内ディレクトリ検索
特定ディレクトリを除外したサイト内ディレクトリ検索の例

この検索をすると、表に出ていないURLやサブドメインなどがわかります。

site:コマンドは他にもたくさん種類があります。

リンク切れ(そのリンク元)を探すなら

テキスト検索ではなく、リンクエラーやそのリンクを設置しているリンク元を探すなら、下記のツールが一番です。

リンクチェッカー

リンクチェッカー

リンクチェッカー(https://www.dead-link-checker.com/ja/)

上記サイトの上部ボックスに検索したいWEBサイトURLを入れて「チェック」を押します。

そうするとリンク切れしているリンクURLを調査してくれます。

リンクエラーなし

調査完了後にリンク切れが発見されると、そのリンク切れしたURLが設定してあるページ、いわゆる「リンク元」のURLが下に表示されます。

リンク切れしたリンクを貼っているWEBページを探し出せるので大変便利です。

ページのボリュームがあると調査に時間が掛かります。

Wordpressプラグイン「Broken Link Checker」

Wordpressでリンク切れをチェックするなら「Broken Link Checker」などがあります。

URLリンクだけでなく画像のリンクエラーなども発見してくれますし、リンクの定期チェック機能やリンク切れを通知してくれる機能もあります。

Broken Link Checker

ただこのプラグインはリンク切れしていても、専用の404ページへ飛ばす設定がされていると正常に検出できない場合がある様です。

ですので先ほどの「リンクチェッカー」等と併用して利用した方が良いと思います。

もちろん他にも優秀なプラグインはたくさんあるでしょうから、探してみて下さい。

検索エンジン登録

これは今までのサイト内検索とは毛色が違いますが、オリジナルの検索機能が付いているWEBサイトを活用する際に便利な機能です。

よく使うページ検索を「独自の検索エンジン」としてGoogleChromeに登録できるものです。

例えばAmazonで商品を探すことが多いのであれば、わざわざAmazonのサイトに行かなくても、検索環境をすぐに表示させる事ができるのです。

具体的な手順(PCでの場合)

GoogleChromeの「3点マーク」から「設定」をクリックします。

3点マークから設定をクリック

左のメニューから「検索エンジン」をクリックし、上部にある「検索エンジンの管理」をクリックします。

検索エンジンから検索エンジンの管理をクリック

検索エンジンサイトが並んでいるので「その他の検索エンジン」の欄にある「追加」をクリックします。

追加をクリック

ポップアップウィンドウが開きます。

検索エンジンの編集(設定)の仕方

検索エンジンの編集

・検索エンジン

この項目には「検索エンジンの名称」を入れれます。この名前は自由です。

例えばAmazonの電化製品の検索であれば、わかりやすい様に「Amazon電化製品」と付けます。

他の種類も検索する様であれば、複数登録できるのでまた別の名前にします。

・キーワード

GoogleChromeの検索ボックスでこの機能を発動させる際の入力キーワードです。

Amazonの電化製品の検索をする場合は、「ama_e」など簡単な単語に設定しておきましょう。

そうすればGoogleChromeの検索ボックスに「ama_e」と入れるだけでAmazonの電化製品の検索が始まります。

・URL

ここに正式なURL+検索状態(=%s)を入れます。末尾が=%sとなる様に書き換えましょう。

例えばAmazonの電化製品であれば以下の様に設定しておきます。

https://www.amazon.co.jp/s?k=%s

これによりいつでも商品名を検索する準備が整った状態になります。

あとはURLに続けて電化製品名の単語を入れれば、すぐにAmazonサイトの検索結果が表示される訳です。

検索エンジンは複数登録・編集が可能

ここで登録された検索エンジンは、「その他の検索エンジン」の一覧に表示されています。

対象の検索エンジン欄右端にある「3点マーク」をクリックすると、その設定を削除したり修正する事ができます。

検索の仕方

GoogleChromeのアドレスバーに上記で設定した「キーワード」(例えばama_e)を入れて「Tab」キーを押しましょう。

ama_eと入力してTabキー

するとアドレスバー内の表記が先ほど設定した「検索エンジンの名称」に変わり、キーワード語句を検索できるようになります。

検索エンジンの名称に変わった状態

キーワードを入力すると、ダイレクトに対象サイトの検索一覧が表示されます。

アマゾンのポットを検索した状態

サイト内検索時の注意

表面上に見えている文字列

「Ctrl+F」で検索です。これで何の問題もありません。

表示面上に見えていない文字列

WEBページの余白で右クリックして「ページのソースを表示」をクリックします。

ページソースを表示した上で「Ctrl+F」で検索します。

表面上には見えているが、ソース上には映らないものもある

XMLhttpRequestなどページをリロードせずに送受信したコンテンツの場合、表面上には見えますがソース上には映りません。

何でもソース上に表示される訳ではありませんので、注意しましょう。

XMLhttpRequestオブジェクトについて

Googleインデックス内容を元にした検索について

Googleのカスタム検索やsite:コマンドは、あくまでGoogleがインデックスしたページ状態をもとに検索結果を表示します。

生のWEBデータをもとに検索をしている訳ではありませんので、まだインデックスされていない情報はヒットしません。

ですので仮にGoogleインデックス系のサイト内検索でヒットしなくても、あきらめずに別の方法を試してみましょう。

まとめ

以上様々なサイト内検索の方法をご紹介しました。

サイト内検索は全ページが対象となる訳ですから、まずは該当ページを特定する作業になります。

該当ページが特定できたら、あらためてページ内を検索してハイライト表示させる必要がありますね。

探している文字列によってはなかなかうまく拾えない事もありますので、様々な方法で多角的に検索してみる事をお勧めします。

この記事をシェアする

一押し人気コーナー紹介

Webworks関連記事