SEO

هل تقوم Google بفهرسة ملفات ومحتوى PDF؟

سؤال: لا يمكنني الحصول على الكثير من ملفات PDF الخاصة بي مفهرسة على صفحات المنتج الخاص بي. هل يجب علي إضافة المحتوى في علامة تبويب المنتج الخاص بي أيضًا ، بحيث يكون في كلا المكانين؟ هل سيؤدي ذلك إلى حدوث مشكلات في التكرار وأي فكرة عن سبب عدم فهرستها؟

جون مولر : بشكل عام نقوم بفهرسة ملفات PDF مثلما نود الصفحات العادية الأخرى على موقع الويب. ما سيحدث على الأرجح مع ملفات PDF هو أننا لا نقوم بتحديثها كثيرًا بنفس سرعة صفحات HTML العادية لأننا نفترض أن ملفات PDF تظل مستقرة. لكن هذا لا يبدو أنه مشكلتك. فيما يتعلق بفهرسة ملفات PDF ، إذا رأينا روابط لهذه الصفحات ، فسنحاول فهرسة تلك الصفحات لإدراجها في نتائج البحث.

جون مولر : إذا لم نتمكن من فهرسة هذه الصفحات ، فإما أننا نواجه مشكلة في العثور على الروابط لملفات PDF هذه ، والتي قد تكون بسبب صعوبة العثور عليها على موقع الويب أو ربما لم تكن بتنسيق HTML ثابت أو لديهم رابط nofollow أو شيء من هذا القبيل. أو ربما نقول أننا لدينا محتوى كافٍ مفهرس من موقع الويب الخاص بك بالفعل.

لسنا مستعدين بعد لإضافة مجموعة كبيرة من المزيد من المحتوى. لذلك لا يمكننا ضمان قيامنا بفهرسة كل المحتوى الموجود على موقع الويب مما يعني أنه بالنسبة لبعض مواقع الويب ، في بعض الحالات ، قد يكون لدينا قطع ونقول أننا قمنا بالفعل بفهرسة الكثير من المحتوى من هذا الموقع.

سنستمر في الزحف إلى المزيد من المحتوى من موقع الويب هذا ، وإذا وجدنا شيئًا مقنعًا حقًا ، فسنقوم بتضمينه في الفهرس أيضًا. ربما تكون ملفات PDF هذه عبارة عن محتوى اطلعنا عليه أو محتوى لم يتح لنا الوقت لإلقاء نظرة عليه من موقع الويب.

جون مولر : إذا كان هناك محتوى مهم في ملفات PDF تلك تحتاج إلى فهرسته ، فقد يكون من المفيد تضمينه في صفحة المنتج مباشرة. بهذه الطريقة لا يتعين على الأشخاص تنزيل ملف PDF بالفعل لمشاهدة هذا المحتوى. لذلك إذا كان الأمر مهمًا ، فربما يمكنك وضعه مباشرة على الصفحة. إذا كان محتوى إضافيًا ، مثل المواد المرجعية التي قد يرغب الأشخاص في الاطلاع عليها ولكن لا يحتاجون إلى التصنيف بشكل منفصل ، فربما يكون من الجيد مجرد الارتباط من صفحات المنتج.

الأسئلة الشائعة حول فهرسة ملفات PDF

هذه ليست المرة الأولى التي تظهر فيها مشكلة فهرسة ملفات PDF. في مدونة Webmaster Central Blog Post في سبتمبر 2011 ، أجاب Gary Illyes من Google على بعض الأسئلة حول فهرسة PDF ، والتي سنلخصها أدناه:

هل تستطيع Google فهرسة ملفات PDF؟

بشكل عام ، نعم ، تقوم Google بالزحف إلى ملفات PDF ما لم تكن محمية بكلمة مرور أو مشفرة. إذا تم تضمين النص كصور ، فقد تقوم Google بمعالجة هذه الصور لاستخراج النص. القاعدة العامة هي أنه إذا كان بإمكانك نسخ / لصق نص من مستند PDF ، فيجب أن يكون Google قادرًا على البحث في محتوى pdf وفهرسة المحتوى.

ماذا يحدث للصور في ملفات PDF؟

الصور الموجودة في ملفات PDF غير مفهرسة (كما في 2011).

يتم التعامل مع الروابط مثل الروابط الموجودة في صفحات الويب. تتجاوز نظام ترتيب الصفحات وإشارات الفهرسة الأخرى وسيتم اتباعها عند الزحف إليها. لا يمكن “nofollow” الروابط في ملف PDF.
كيف يمكنني منع ملفات PDF الخاصة بي من الظهور في نتائج البحث ؛ أو إذا فعلوا ذلك بالفعل ، كيف يمكنني إزالتها؟
يجب عليك إضافة “X-Robots-Tag: noindex” في رأس HTTP المستخدم لخدمة الملف. إذا تم فهرستها بالفعل ، فسيؤدي تنفيذ الرأس إلى تركها مع مرور الوقت. بدلاً من ذلك ، يمكنك استخدام أداة إزالة عناوين URL .
هل يمكن أن تحتل ملفات PDF مرتبة عالية في نتائج البحث؟

يمكن أن يتم تصنيف ملفات PDF بشكل مشابه لصفحات الويب.

هل يعتبر محتوى مكررًا إذا كانت لدي نسخة من صفحاتي بتنسيق HTML و PDF؟

نعم. إذا كنت بحاجة إلى تقديم كلا النسختين ، فعليك تحديد نسخة مطابقة من نسخة إلى أخرى .

كيف يمكنني التأثير على العنوان الذي يظهر في نتائج البحث لمستند PDF الخاص بي؟
يستخدم Google بيانات العنوان الوصفية داخل الملف والنص الأساسي للروابط التي تشير إلى ملف PDF. توصي Google بتعيين كليهما.

كيفية البحث عن ملفات PDF في جوجل

استخدم عامل تشغيل نوع الملف للبحث عن ملفات PDF

إذا كنت ترغب في البحث عن ملفات PDF في Google ، فيمكنك استخدام عامل التشغيل “filetype:”.

للبحث في ملفات PDF عن مصطلح البحث “SEO PDF” اكتب ما يلي:

  • filetype:pdf SEO PDF
  • ثم اضغط على “بحث Google”.

تعرض صفحة نتائج SERP ملف PDF بخط مرتفع إلى يسار كل نتيجة

يمكنك رؤية لقطة شاشة للنتائج في لقطة الشاشة.

في 17 كانون الثاني (يناير) 2019 ، أفاد Kevin Indig على Twitter أن Google تسحب الآن مقتطفات مميزة من ملفات PDF.

لقد جربت المثال المذكور ، وما زال يعمل حتى 26 يناير. يمكنك مشاهدة لقطة الشاشة أدناه:

يمكنك أن تراهن بحياتك على أن العديد من المتخصصين في تحسين محركات البحث سيعملون الآن على تحسين ملفات PDF الخاصة بهم لمحركات البحث.

أنواع الملفات الأخرى القابلة للفهرسة بواسطة Google

تعد ملفات PDF واحدة فقط من عدد كبير من أنواع الملفات التي يمكن فهرستها بواسطة Google.

يمكن لـ Google فهرسة محتوى معظم أنواع الصفحات والملفات ، بما في ذلك Adobe Flash ومستندات Microsoft مثل Excel و Docs و Rich Text Format ومستندات OpenOffice و PowerPoint ولغات البرمجة المختلفة.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى
error: Content is protected !!