「facebookexternalhit」タグアーカイブ

facebookexternalhit

facebookexternalhitとは

facebookexternalhit は、Metaファミリー(Facebook、Instagram、Messengerなど)のアプリで共有されたリンクに関する情報を収集するためのクローラーです。
このクローラーは、共有されたアプリやウェブサイトのコンテンツをクロールし、リンクプレビューを生成します。

主な目的

facebookexternalhit の主な目的は次の通りです:

  • Facebook、Instagram、Messenger などで共有されたリンクをクロール
  • アプリやウェブサイトの情報(タイトル、説明、サムネイル画像など)を収集
  • 収集したデータをキャッシュに保存し、プレビューとして表示

動作の仕組み

  1. ユーザーがリンクをFacebookやMetaのソーシャルプラグインを使って共有
  2. facebookexternalhitクローラーがリンク先のウェブページにアクセス
  3. ページ内のメタデータ(例: Open Graph タグ)を解析
  4. タイトル、説明、画像などを取得してプレビューを生成

収集する情報

以下の情報が主に収集されます:

  • タイトル(<title>タグやog:title
  • 説明文(og:description
  • 画像(og:image
  • URL(og:url

リンク共有の方法

facebookexternalhitクローラーが動作するリンク共有の主な方法は次の通りです:

  • リンクをコピー&ペーストして共有
  • Facebookのソーシャルプラグインを使用して共有

最適化のための設定

以下の設定を行うことで、リンクプレビューの表示を最適化できます:

  • Open Graph メタタグを使用して、プレビュー内容を明示的に指定する
  • メタデータに適切なタイトル、説明、画像を設定する
  • Facebookデバッガーツールを使ってプレビューを確認する

サーバのアクセスログ例

2024-01-22 18:31:23 - 69.171.250.250 - fwdproxy-ldc-000.fbsv.net - facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)
    

拒否したい場合、robots.txtの設定

facebookexternalhit

  • robots.txt ファイルに `facebookexternalhit` のアクセスを拒否する記述がないことを確認します。
  • デフォルトでは、`facebookexternalhit` はアクセスが許可されていますが、特定のディレクトリやページをブロックしていないか確認が必要です。

例: robots.txtで許可する設定

以下は、`facebookexternalhit`を許可する基本的な設定例です:

User-agent: *
Disallow:
    

この設定はすべてのクローラーのアクセスを許可します。

特定のクローラーのみ許可したい場合は、次のように指定します:

User-agent: facebookexternalhit
Disallow:
    

Facebookデバッガーの使用

Facebookはリンクプレビューを生成する際にキャッシュを使用します。そのため、ページ内容を更新した場合、新しい情報が正しく反映されないことがあります。

キャッシュをクリアし、最新のデータを反映するには、Facebook Debugger を使用してください。

Facebook Debuggerの使い方:

  1. 以下のリンクからデバッガーツールにアクセスします: Facebook Debugger
  2. 更新したいリンクを入力して「Debug」ボタンをクリックします。
  3. 「Scrape Again」を選択すると、キャッシュがクリアされ、新しいデータが取得されます。

公式ドキュメント

詳しい情報は、Meta公式のドキュメントをご参照ください:

Facebook Crawler – Developer Documentation