القائمة الرئيسية

الصفحات

كيف يعمل محرك البحث جوجل Google وخوارزمياته | كل ماتريد معرفته حول كيفية عمل خوارزميات جوجل

 اكتشف بالضبط كيف يعمل محرك البحث حتى تتمكن من تحسين تصنيفاتك وجذب المزيد من الزيارات إلى الصفحة. تابع القراءة لمعرفة المزيد.

محتويات

هل أنت مهتم في جانب معين من كيفية عمل محركات البحث؟ استخدم الروابط أدناه للتخطي إلى قسم معين داخل المقالة. إذا كنت تريد أن تعرف على وجه التحديد عن الكلمات الرئيسية ، تحقق من هذه المقالة حول كيفية استخدام محركات البحث للكلمات الرئيسية.

كيف يعثر محرك بحث مثل Google على المحتوى


الفهرسة


خوارزميات الترتيب


فهم خوارزمية جوجل


- ملاءمة


- السلطة


- ثقة


- سهولة الاستخدام


نوع النتائج والتخصيص


كيف يعثر محرك بحث مثل Google على المحتوى

 يزحف محرك بحث Google إلى الويب باستخدام رمز يسمى "العنكبوت". هذا برنامج صغير يتبع الروابط من صفحة إلى أخرى وكل صفحة تهبط عليها يتم نسخها ونقلها إلى الخوادم. الويب (ومن ثم العنكبوت) ضخم ، وبالتالي إذا احتفظت Google بسجل لجميع المحتوى الذي وجدته ، فلن يكون من الممكن إدارته. هذا هو السبب في أن Google يسجل رمز الصفحة فقط ويقوم بتفريغ الصفحات التي لا يعتقد أنها مفيدة (مكررة ، قيمة منخفضة ، إلخ).

تعمل العناكب بطريقة محددة للغاية ، وتتنقل من رابط إلى رابط لاكتشاف صفحات جديدة. هذا هو السبب في عدم فهرسة المحتوى الخاص بك إذا لم يكن مرتبطًا به. عند مصادفة مجال جديد ، سيبحث العنكبوت أولاً عن هذه الصفحة:

domain.com/robots.txt

يمكن ترك أي رسائل لديك عن العنكبوت ، مثل المحتوى الذي تريد فهرسته أو مكان العثور على ملف Sitemap الخاص بك ، في هذه الصفحة. يجب على العنكبوت بعد ذلك اتباع هذه التعليمات. ومع ذلك ، لا داعي لذلك. تتصرف عناكب Google بشكل جيد بشكل عام وستحترم الأوامر المتبقية هنا.

يمكنك معرفة المزيد حول كيفية عمل ملف robots.txt هنا ، حيث نغطي بعض الجوانب التقنية لتحسين محركات البحث.

العنكبوت نفسه هو برنامج صغير وبسيط. هناك الكثير من الإصدارات مفتوحة المصدر التي يمكنك تنزيلها وإطلاقها على الويب بنفسك مجانًا. على الرغم من أنه أمر حيوي بالنسبة لـ Google ، فإن العثور على المحتوى ليس بالشيء الذكي. هذا يأتي بعد ذلك.


الفهرسة

عندما يكون لديك قدر كبير من المحتوى ، فأنت بحاجة إلى طريقة لاختصار هذا المحتوى. لا يمكن أن يكون لدى Google قاعدة بيانات كبيرة واحدة تحتوي على جميع الصفحات ، والتي يتم فرزها في كل مرة يتم فيها إدخال استعلام. سيكون الطريق بطيئا للغاية. بدلاً من ذلك ، يقومون بإنشاء فهرس يختصر هذه العملية بشكل أساسي. تستخدم محركات البحث تقنية مثل Hadoop لإدارة كميات كبيرة من البيانات والاستعلام عنها بسرعة كبيرة. البحث في الفهرس أسرع بكثير من البحث في قاعدة البيانات بأكملها في كل مرة.

لم يتم تخزين الكلمات الشائعة مثل "و" و "في" و "إذا". هذه معروفة باسم كلمات التوقف. لا تضيف بشكل عام إلى تفسير محرك البحث للمحتوى (على الرغم من وجود استثناءات: تتكون عبارة "أكون أو لا أكون" من كلمات توقف) ، لذا تتم إزالتها لتوفير مساحة. قد تكون مساحة صغيرة جدًا لكل صفحة ، ولكن عند التعامل مع مليارات الصفحات ، يصبح اعتبارًا مهمًا. هذا النوع من التفكير يستحق أن يؤخذ في الاعتبار عند محاولة فهم Google والقرارات التي يتخذها. يمكن أن يكون التغيير الصغير لكل صفحة مختلفًا جدًا على نطاق واسع.


خوارزميات الترتيب

تم الآن فهرسة المحتوى. لذا فقد أخذ Google نسخة منه ووضع اختصارًا للصفحة في الفهرس. رائع ، يمكن الآن العثور عليه وعرضه عند مطابقة استعلام بحث ذي صلة. من المحتمل أن تحتوي كل عملية بحث تجريها في Google على آلاف النتائج ، لذلك تحتاج Google الآن إلى تحديد الترتيب الذي ستعرض فيه النتائج. هذا حقًا في قلب تحسين محركات البحث - تعديل العوامل للتلاعب بترتيب النتائج.


يقرر Google الاستعلام الذي يمر عبر الخوارزمية. الخوارزمية هي مصطلح عام يعني عملية أو مجموعة قواعد يتم اتباعها لحل مشكلة ما. بالإشارة إلى Google ، هذه هي مجموعة المقاييس الموزونة التي تحدد الترتيب الذي يتم ترتيب الصفحة به.


فهم خوارزمية جوجل

خوارزمية Google ليست اللغز الذي كانت عليه من قبل ، والعوامل الفردية والمقاييس التي تتكون منها موثقة جيدًا إلى حد ما. نحن نعلم ما هي جميع المقاييس الرئيسية على الصفحة وخارج الصفحة. الجزء الصعب هو فهم الترجيح أو الارتباط بينهما.


إذا بحثت عن "وصفات كعكة الشوكولاتة" ، فستقوم الخوارزمية بعد ذلك بتقييم الصفحات مقابل مصطلح البحث هذا.

دعونا نلقي نظرة مبسطة على مقياسين وكيف يمكن أن يؤثر كل منهما على الآخر.


المقياس 1 هو عنوان URL. قد تظهر الكلمات الرئيسية في عنوان URL ، مثل: www.recipes.com/chiffon-cake

يمكن لـ Google رؤية الكلمتين الرئيسيتين "كعكة الشوكولاتة" و "الوصفات" في عنوان URL حتى يتمكن من تطبيق الترجيح وفقًا لذلك.


الآن إلى Metric 2 ، الروابط الخلفية للصفحة. قد تحتوي الكثير من هذه الكلمات الرئيسية على "كعكة الشوكولاتة" و "الوصفات". ومع ذلك ، ستقوم Google بعد ذلك بتخفيض وزن هذا المقياس لأنه إذا ظهرت الكلمات الرئيسية في عنوان URL ، فستتوقع ظهورها في الروابط الخلفية ، سواء أكانت ذات صلة أم لا. على العكس من ذلك ، قد تختار Google تطبيق وزن أكبر على Metric 2 إذا لم تظهر الكلمات الرئيسية في أي مكان في عنوان URL.

تؤثر جميع العوامل المختلفة التي تنظر إليها Google في بعضها البعض. قد يكون كل واحد أكثر أو أقل (في الترجيح) والعلاقة بينهما تتغير باستمرار. تصدر Google مئات التحديثات كل عام ، وتعدل هذا باستمرار. الأكثر شيوعًا أن هذه العلاقة والوزن هو الذي تغير أكثر من المقاييس نفسها. عندما يحدث هذا ، يكون عادةً في تحديث رئيسي ، مثل Penguin أو Panda.


يمكن تقسيم المقاييس المختلفة إلى أربعة أقسام رئيسية:

ملاءمة

ما مدى صلة المحتوى بالاستعلام؟ المفهرس هو الاختبار الأول في هذا الأمر ، حيث يحدد ما إذا كان يجب أن يظهر في النتائج على الإطلاق. ومع ذلك ، يتم اتخاذ خطوة أخرى إلى الأمام من أجل ترتيب الكلمات الرئيسية. من المنطقي أنه عند البحث عن شيء ما ، فأنت تريد رؤية أكثر النتائج ذات الصلة الممكنة.

يتم تحديد الملاءمة من خلال مزيج من العوامل على الصفحة وخارج الصفحة. يركز كلاهما على وضع الكلمات الرئيسية ، كما هو الحال في عناوين الصفحات ونص الرابط. بعض المقاييس هي مزيج من هؤلاء. على سبيل المثال ، إذا كان المجال ككل يعتبر ذا صلة بمصطلح البحث ، فسيؤدي ذلك إلى تعزيز درجة ملاءمة الصفحة الفردية التي يتم تسجيلها. إذا كنت ترغب في معرفة المزيد عن هذا ، أوصي بقراءة مقالتي "كيف تستخدم محركات البحث الكلمات الرئيسية".


السلطة

تعود جذور السلطة إلى نظام ترتيب الصفحات ، الذي اخترعه لاري بيدج (ومن هنا جاء الاسم). إنه العمود الفقري لكيفية ترتيب Google للمحتوى. يعد فهم نظام ترتيب الصفحات جزءًا من المفتاح لفهم كيفية عمل Google ، ولكن يجدر بنا أن نتذكر أن هناك مئات من العوامل الإضافية التي يمكن أن تؤثر أيضًا في الترتيب ، كما أن نظام ترتيب الصفحات أقل أهمية مما كان عليه في الماضي.

غالبًا ما يتم شرح نظام ترتيب الصفحات من حيث التصويت. كل رابط للصفحة هو تصويت ، فكلما زاد عدد الأصوات التي حصلت عليها ، كان من الأفضل تصنيفها. إذا كانت الصفحة التي تحتوي على الكثير من الأصوات مرتبطة بصفحة أخرى ، فسيتم أيضًا نقل جزء من قوة التصويت هذه. لذلك حتى إذا كانت الصفحة تحتوي على رابط واحد فقط ، إذا كان هذا الرابط من صفحة بها الكثير من الأصوات ، فقد تظل مرتبة جيدًا وستستفيد الصفحات التي ترتبط بها أيضًا من ذلك. تُعرف القيمة التي يتم تمريرها من صفحة إلى صفحة عبر الروابط باسم عصير الارتباط أو عصير الصفحة.

الصلة مهمة أيضًا في سياق السلطة. قد يكون للرابط الذي يحتوي على نص رابط ذي صلة أهمية أكبر من ارتباط ليس من موقع ذي صلة ولا يحتوي على نص رابط ذي صلة ، والذي من المرجح أن يتجاهله Google في سياق نتيجة البحث هذه.


ثقة

هذه خوارزمية لمكافحة البريد العشوائي ، تركز على زيادة صعوبة التلاعب بنتائج البحث بشكل مصطنع. تتمتع Google بعلاقة حب وكراهية مع مُحسنات محركات البحث وآلية الثقة جزء منها. من ناحية أخرى ، يتعلق الكثير من تحسين محركات البحث بإنشاء محتوى رائع وتجربة مستخدم. من ناحية أخرى ، يتعلق الأمر أيضًا بمحاولة التلاعب بشكل مصطنع بما حددته Google على أنه الترتيب الطبيعي للنتائج.

من الصعب جدًا التلاعب بمقاييس الثقة وهي تمنح Google ثقة أكبر في المقاييس الأخرى. أشياء مثل عمر المحتوى أو المجال هي مقاييس الثقة. إذا كان لديك الكثير من الروابط من "الأحياء السيئة" (فكر في منطقة الضوء الأحمر) ، فلن تكون هذه الروابط عديمة القيمة فحسب ، بل ستجعل Google أيضًا تفكر مليًا في ترتيب موقعك للبحث عن "وصفة كعكة الشوكولاتة". بنفس الطريقة إذا كانت الصفحة أو المجال يرتبط بأحياء سيئة ، فسيؤدي ذلك إلى إتلاف مقاييس الثقة هذه.

Google هو في الواقع مسجل المجال ، مما يعني أنه يمكنه رؤية جميع بيانات whois للنطاقات المختلفة. هذا يسمح لهم بدمج المعلومات ، مثل عدد المرات التي تغير فيها المجال أو المدة حتى انتهاء صلاحية التسجيل ، في مقاييس الثقة تلك. هذه أكثر صعوبة في التلاعب بها.

يتم تحديد الثقة أيضًا حسب نوع المجال أو الصفحة ونوع الروابط التي تنقلك. مع التأثير المعاكس للحي السيئ ، تتمتع المواقع الأكاديمية مثل نطاقات .edu بثقة عالية. قد تتمتع أنواع المجالات الأخرى أيضًا بدرجة ثقة عالية ، مما يجعل الروابط منها أكثر قيمة.


سهولة الاستخدام

تريد Google أن يكون المحتوى الذي تعرضه في نتائج البحث الخاصة بها جذابًا للبشر وكذلك روبوتات محركات البحث. هناك مجموعة من المقاييس المخصصة لهذه العوامل فقط. إن امتلاك محتوى رائع ، ولكن بعد ذلك ، على سبيل المثال ، لن يؤدي تغطيته في الإعلانات إلى توفير تجربة مستخدم رائعة. هذا هو السبب في أن Google ستخفض وزن الصفحة التي يكون موضع الإعلان فيها بارزًا للغاية.

سرعة الصفحة عامل مهم آخر؛ تمثل الصفحات التي يتم تحميلها ببطء شديد مصدر إزعاج للباحثين ، مما يتسبب في عودة الأشخاص إلى نتائج البحث واختيار صفحة أخرى. تريد Google من الأشخاص الاستمرار في استخدام Google ، ولذا فمن مصلحتهم أن يتم تحميل النتائج التي يعرضونها بسرعة. إنهم يقيسون سرعة الصفحة من HTML ولكن يمكنهم أيضًا استخدام بيانات مستخدم Chrome.

نوع النتائج والتخصيص

إذا كنت تبحث على هاتف محمول ، فسيتم عرض مجموعة مختلفة من النتائج عما إذا كنت تبحث على جهاز كمبيوتر سطح المكتب. النتائج الفعلية التي يتم إرجاعها من المفهرس (لذلك عند مستوى منخفض) ستكون مختلفة. لا يؤثر نوع الجهاز فقط على النتائج التي تراها ، فقد تختار Google عرض النتائج بتنسيق مختلف تمامًا اعتمادًا على مصطلحات البحث التي تستخدمها.

يتم ترجيح عمليات البحث المترجمة بشكل مختلف وتظهر في تنسيق صفحة نتائج مختلف لعمليات البحث عن المنتج على سبيل المثال. لديك أيضًا عمليات بحث مختلطة عن الوسائط حيث قد يعرض محرك بحث Google نتائج تتضمن مقاطع الفيديو والصور. تحتوي بعض عمليات البحث على صفحات نتائج مخصصة لمجموعة ضيقة جدًا من المصطلحات. ترتبط هذه عادة بالأحداث الجارية مثل الألعاب الرياضية أو الانتخابات.

عامل آخر هو التخصيص. ما قمت بالبحث عنه سابقًا سيؤثر على النتائج التي يعرضها Google. هناك درجة من التعلم الآلي تلعب هنا. لذلك ، عندما يبحث شخص ما عن نوع واحد من النتائج باستمرار ، ستفترض Google أن عمليات البحث المماثلة في المستقبل ستكون من نفس الطبيعة. هذا بارز بشكل خاص لعمليات البحث الغامضة ، حيث كلمة واحدة لها معان متعددة.

هل اعجبك الموضوع :

تعليقات

التنقل السريع