robots.txtの書き方

robots.txtとは？

robots.txtは、検索エンジンのクローラーに対して、ウェブサイト内のどのページをクロールし、インデックス化するかを指示するためのシンプルなテキストファイルです。

主な役割

robots.txtファイルは、非常にシンプルな構文で記述します。

基本的な構文

User-agent: クローラーの名前
Disallow: アクセスを禁止するディレクトリまたはファイルのパス
Allow: アクセスを許可するディレクトリまたはファイルのパス
Sitemap: サイトマップのURL

例

User-agent: Googlebot
Disallow: /admin/
Disallow: /cgi-bin/
Sitemap: https://example.com/sitemap.xml

解説

正確なパス: DisallowやAllowで指定するパスは、正確に記述する必要があります。誤ったパスを指定すると、意図しないページがクロールされない可能性があります。
相対パスと絶対パス: 相対パスと絶対パスのどちらを使用しても構いませんが、一貫して使用するようにしましょう。
大文字小文字: DisallowやAllowは、大文字小文字を区別しません。
ワイルドカード: アスタリスク（*）を使用することで、複数のページを一括で指定できます。
複数のルール: 複数のUser-agentに対して異なるルールを指定できます。
優先順位: robots.txtファイル内のルールは、上から順に処理されます。

robots.txtファイルは、ウェブサイトのルートディレクトリに配置します。

robots.txtが正しく機能しているか確認するために、Google Search Consoleなどのツールを利用してテストすることができます。

robots.txtは、ウェブサイトのSEO対策において重要な役割を果たします。適切に設定することで、検索エンジンのクローラーを効率的に誘導し、ウェブサイトの評価向上に繋げることができます。

より詳しい情報を知りたい場合は、以下のリンクも参考にしてください。

【ズライム】
このズラらしいスライムに収益を！