facebookexternalhitとは
facebookexternalhit は、Metaファミリー(Facebook、Instagram、Messengerなど)のアプリで共有されたリンクに関する情報を収集するためのクローラーです。
このクローラーは、共有されたアプリやウェブサイトのコンテンツをクロールし、リンクプレビューを生成します。
主な目的
facebookexternalhit の主な目的は次の通りです:
- Facebook、Instagram、Messenger などで共有されたリンクをクロール
- アプリやウェブサイトの情報(タイトル、説明、サムネイル画像など)を収集
- 収集したデータをキャッシュに保存し、プレビューとして表示
動作の仕組み
- ユーザーがリンクをFacebookやMetaのソーシャルプラグインを使って共有
- facebookexternalhitクローラーがリンク先のウェブページにアクセス
- ページ内のメタデータ(例: Open Graph タグ)を解析
- タイトル、説明、画像などを取得してプレビューを生成
収集する情報
以下の情報が主に収集されます:
- タイトル(
<title>
タグやog:title
) - 説明文(
og:description
) - 画像(
og:image
) - URL(
og:url
)
リンク共有の方法
facebookexternalhitクローラーが動作するリンク共有の主な方法は次の通りです:
- リンクをコピー&ペーストして共有
- Facebookのソーシャルプラグインを使用して共有
最適化のための設定
以下の設定を行うことで、リンクプレビューの表示を最適化できます:
- Open Graph メタタグを使用して、プレビュー内容を明示的に指定する
- メタデータに適切なタイトル、説明、画像を設定する
- Facebookデバッガーツールを使ってプレビューを確認する
サーバのアクセスログ例
2024-01-22 18:31:23 - 69.171.250.250 - fwdproxy-ldc-000.fbsv.net - facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)
拒否したい場合、robots.txtの設定
facebookexternalhit
-
robots.txt
ファイルに `facebookexternalhit` のアクセスを拒否する記述がないことを確認します。 - デフォルトでは、`facebookexternalhit` はアクセスが許可されていますが、特定のディレクトリやページをブロックしていないか確認が必要です。
例: robots.txtで許可する設定
以下は、`facebookexternalhit`を許可する基本的な設定例です:
User-agent: * Disallow:
この設定はすべてのクローラーのアクセスを許可します。
特定のクローラーのみ許可したい場合は、次のように指定します:
User-agent: facebookexternalhit Disallow:
Facebookデバッガーの使用
Facebookはリンクプレビューを生成する際にキャッシュを使用します。そのため、ページ内容を更新した場合、新しい情報が正しく反映されないことがあります。
キャッシュをクリアし、最新のデータを反映するには、Facebook Debugger を使用してください。
Facebook Debuggerの使い方:
- 以下のリンクからデバッガーツールにアクセスします: Facebook Debugger
- 更新したいリンクを入力して「Debug」ボタンをクリックします。
- 「Scrape Again」を選択すると、キャッシュがクリアされ、新しいデータが取得されます。
公式ドキュメント
詳しい情報は、Meta公式のドキュメントをご参照ください: