URLの正規化は、SEO内部施策の中で重要だと知っているけど、「具体的に何をチェックしたらいいのかな…」「どうやって正規化の対応したらいいかわからない」とお困りではありませんか?
そんな方のために、URLの正規化のために最低限チェックしたほうがいいポイントをまとめました。
具体的には、
- 「www有無」「https/httpのリダイレクト」「index.html(index.php)有無」などの基本的な正規化
- 404エラーの正規化やcanonical設定について
の内容になります。
現状サイト(ホームページ)の改善や新規サイトの要件定義及び公開前のチェックに使えます。
URLの正規化とは
重複コンテンツ(コンテンツが同じなのにURLが異なる状態のこと)を1つにまとめることです。
URLの正規化が必要な理由
同じコンテンツのページのURLが複数あると
・良質な外部からのリンクが分散(評価が分散)
・検索エンジンの非効率なクロールが行われる可能性がある(検索順位に悪影響)
・意図的に低品質なコンテンツを増やそうとしていると判断され、サイト全体の評価が下がる可能性ある
のような問題が発生するかもしれません。
新規でWebサイト構築もしくはリニューアルを検討されている方は、URLの正規化をしっかりチェックすることをおすすめします。
URLの正規化リスト
www有無の正規化
www有無どちらにもアクセス可能にし、どちらか片方に301リダイレクトを設定する。
システムの仕様上リダイレクトが不可能な場合は、canonical設定を行う。
(例)www無をメインにする場合
https://www.hoge.jp ← こちらをアクセスしたときにhttps://hoge.jpにリダイレクトをかける
https/httpの正規化
「http~」から「https~」へ301リダイレクトさせる。
※ HTTPS (SSL/TLS)は、検索順位を決めるアルゴリズムとして利用しているのでhttps/httpの正規化はマスト
参考:Google ウェブマスター向け公式ブログ: HTTPSをランキングシグナルに使用します
SSL対応(https)の注意点
- サイト内リンク、canonical、画像などのURLを書き換える(「http://」→「https://」に修正)
- 301リダイレクト設定(「http://」→「https://」にリダイレクト)
- HSTSやプリロードHSTS設定
参考:HTTPSを使うなら“HSTS”と“HSTSプリロード”でセキュリティを高めよう など10+4記事 - Google analyticsの設定もhttpsのURLに修正
- Search Consoleは新規登録を設定する必要があります。XMLサイトマップも再送信
(例)httpsが表示させる場合
http://hoge.jp ← こちらをアクセスしたときには、https://hoge.jpにリダイレクトをかける。
index.html(index.php)有無の正規化
index.html(index.php)有無両方アクセスできるようし、どちらか片方にに301リダイレクトを設定する。
(例)index.html(index.php)無で統一している場合
https://hoge.jp/index.htmlにアクセスした場合、https://hoge.jpに301リダイレクトをかける。
システムの仕様上リダイレクトが不可能な場合は、canonical設定を行う。
PC用URL・スマホ用URLの正規化(URLが別々の場合)
ユーザーエージェントで該当するデバイスにリダイレクトはマストで行なっていると思いますが、 タグ、rel属性(canonical,alternate,media)設定などのアノテーション設定のやっときましょう。
rel=canonical
スマートフォン版に、rel=canonical属性を利用する。
インデックスおよびランク付けのシグナル(外部のリンク等)を統合して、重複コンテンツと判断されないようにするため
<link rel=”canonical" href="対応するPC用ページのURL">
rel=alternate media
この属性を利用すると、パソコン版とスマートフォン版のURLをマッピングすることが出来るようになる。
パソコン版のページのみにこのタグを使って、スマートフォン版を特定する。
※max-widthは下記は640pxをいれているが、対応する値に変更可能
<link rel="alternate" media="only screen and (max-width: 640px)" href="対応するSP用ページのURL">
サイトマップに追加することも可能です。
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xhtml="http://www.w3.org/1999/xhtml">
<url>
<loc>http://対応するPC用ページのURL</loc>
<xhtml:link
rel="alternate"
media="only screen and (max-width: 640px)"
href="http://対応するSP用ページのURL" />
</url>
</urlset>
詳細は、別々の URL | 検索 | Google Developersをご確認ください。
今後は特別な理由がない場合は、レスポンシブWebデザインを選択するべき
Googleのゲーリーさん曰く動的配信・別々URLはもはや非推奨と言っています。
レスポンシブWebデザインを選ぶべき理由
- コンテンツの欠如
PC 向けページにあるコンテンツ(テキスト、画像、動画)がモバイル向けページにない場合、検索エンジンのランキングに影響します。
※ユーザビリティやパフォーマンスを考えた設計が必要になる。 - 構造化データの欠如
PC向けページにあるコンテンツがモバイル向けページにない場合、MFIが始まったらリッチスニペットが適用されなくなる。 - メタデータの欠如
代表例は、多言語・多地域サイトで用いるhreflangです。MFIではhreflangもモバイル向けへのマークアップが必要になる。
参考:Googleモバイルファーストインデックス後はレスポンシブが唯一の選択肢か? #inhouseseo | 海外SEO情報ブログ
404エラーの正規化
ファイルの存在しないページは、404ページをだす。
404ページにきてしまったユーザの離脱を減らすために、ページのカスタマイズ
その他の重複対策
設計次第のところがありますが、下記ケースは、大体はcanonical設定で対応可能です。
ECなどで、一覧のソートページがある場合
canonical設定で対応
カテゴリやタグページ
基本は、重複しないように設計するべき、どーしようもない場合はcanonical設定で対応
トラッキングIDがついたページ
canonical設定
プリント用のページ
canonical設定+インデックスさせる必要もないのでnoindex設定
参考:正規 URL を使用する – Search Console ヘルプ
URLの正規化で困ったときのメモ
さくらのレンタルサーバでhttps→httpに勝手にリダイレクトされるのを解決する方法
さくらのレンタルサーバ(共有サーバ)での独自SSL(SNI SSL)を設定しようとすると、https→httpに勝手にリダイレクトされるという謎の現象が起きてしまいます。
これを解決するには、.htaccessとwp-config.phpを修正する必要があります。下記サイトが、うまくまとめてくれているので、お困りの方はぜひ参考にしてみてください。
参考:さくらのレンタルサーバでHTTPS(SNI SSL)な独自ドメインのWordpressサイトを構築する際の注意点 – Qiita