نواع محرك البحث جوجل

انا تولين

  كان لابد  من عمل ما يسمي بمحركات البحث لتسهيل البحث عن المواقع التي تحتاجها بسرعة و بعطاء خيارات اكثر و شمل عن المقال الذي تريدة , و يصبح البحث عن الجابة التي تكتبها فمربع البحث بمواقع موجودة على النترنت كتبت عن ذلك المقال و تتوافر بها جميع المصطلحات او البعض منها التي قمت بالبحث عنها , او ممكن البحث عن ما تريدة من اثناء كتابة اسم الموقع الذي يحتوى على ما تريدة مباشرة من اثناء ما يعرف بدلة البحث Search Directories]


ن محركات البحث search engine هي ادوات شائعة الاستعمال الى الوصول الى صفحات النسيج الشبكى العالمي world wide web لكنها تعود بمئات النتائج و الوصلات التي تكون فالغالب غير ذات صلة بمقال البحث الرئيسى مما يجعل الباحث فحيرة و يس من وجود ما يبحث عنه، فن استعمال ادوات البحث المتوفرة على النترنت بدون استراتيجية بحث محددة تشبة الى حد كبير من يسير فمكتبة ضخمة بشكل عشوائى يحاول العثور على كتاب معين.
وسوف يناقش ذلك البحث النقاط الاتيه:
1-   الفرق بين محركات البحث و الدلة .
2-   مكونات محركات البحث على شبكة النترنت و طريقة عملها.
3-   نسبة المواقع التي تغطيها محركات البحث من مجموع مواقع الشبكه.
4-   فهرسة محركات البحث لمواقع الشبكه.
5-   الوقت اللازم لظهور صفحات الويب الحديثة فمحركات البحث.
6-   اليات البحث فمحركات البحث.
7-   نوعيات محركات البحث.

 

ولا : الفرق بين محركات البحث و الدله(1) :

 

يسخر مستعملو النترنت ادوات البحث المختلفة على الوب للوصول الى المعلومات المفيدة الموزعة على ملايين الجهزة الخادمة على النترنت، و هذي الدوات هي محركات البحث search engine و الدلة directories التي تساعد فتسريع عملية البحث بدرجة كبيره، و فهذا السياق لابد تقديم تعريف مبسط لهاتين الداتين قبل ان دخل فتفاصيل محركات البحث.

 

محركات البحث Search Engines

 

و هي ممكن تعريفها ببسط صورة هي عبارة عن قواعد بيانات ضخمة بعناوين و مواقع، و مع وصف مصغر لصفحات النترنت المختلفه، و التي بواسطتها اي محركات البحث ممكن البحث على مقال معين فحقل من الحقول المختلفة فالشبكة بشكل دائم بغرض ايجاد دليل معين لمثل هذي الصفحات، و لنها تعمل بشكل الى و تقوم بفرز و فهرسة كم هائل من الصفحات ..فسيلاحظ جميع شخص يستعمل هذي المحركات على انها تحتوى على كثير من المعلومات غير المتوفرة فالدلة directories و ربما يمثل هذا جانب ايجابي يجعل من محركات البحث اداة فعالة اكثر من الدله(2).

 

الدلة Directories



الدلة لا تعمل بشكل الى بل تتم ادارتها من قبل اشخاص متخصصين، و ما يحدث هو ان الكثير من المواقع يتم تسليمها الى دليل ما ، و من بعدها يتم فرزها و تبويبها تحت تصنيف معين، و لن هذي الله يتم ادارتها بشكل بشرى فنها قادرة دوما على توفير معلومات اكثر دقة و ما موقع yahoo المشهور الا المشهور الا مثال واحد لهذه الدله(3).
و تقدم الدلة للمستخدم كيفية سريعة للبدء بعمليات البحث عن المعلومات بواسطة تفحص المقالات المصنفة التي يعرضها ، اذ يندرج تحت جميع مقال لائحة من المقالات الفرعية فيمكن للمستخدم ان يتفحصها تباعا الى ان يصل الى المعلومات المطلوبه، و فحال عدم وجود المعلومات تحت المقال الذي اختارة المستخدم، يتراجع و يختار موضوعا اساسيا احدث ليقوم بالبحث فتفرعاتة من جديد، و هكذا…
وفى ذلك السياق لابد من توضيح من ان هنالك الكثير من ادلة البحث تعمل كذلك كمحركات منها : yahoo – altavista – excite ……

 

ثانيا : مكونات محركات البحث و طريقة عملها(4)(5) :

 

يوجد على شبكة النترنت كميات ضخمة من المعلومات تتوزع على شكل صفحات و تنمو بشكل سريع ( فعام 1996 بلغ معدل النمو 400% )، و فاوائل 1998 كان هنالك ما يتعدد ب 300 مليون صفحة متوفرة على النسيج، و فاواخر اعم 2000 قدر عدد الصفحات بكثر من مليار صفحه، و هو الن يقدر بن يصبح حوالى مليار و نص فبداية عام 2002، و يقدر عدد الصفحات التي تضاف او تحدث يوميا بمليون و ما ئتين صفحه، و ذلك يدل على معدل نمو النترنت الذي يتضاعف بكل سنوي.
هنالك اكثر من 2500 اداة بحث متوفرة و يقدر تغطية تلك الدوات للنترنت ب 5 % للدوات الصغيرة و 15 % لتلك العملاقه، و من هنا نعلم انه مهما كان سمعة اداة البحث فنها لا ممكن ان تغطى كافة المعلومات المتوفرة على الشبكه، و تخرج محركات البحث نتائج مختلفه، لن جميع منها يبحث فقاعدة بياناتة الخاصة به، التي تتضمن جزء من مواقع الوب ، و يتلف محرك البحث من ثلاثة اجزاء اساسية هي:
1.    برنامج العنكبوت : (Spider program )
2.    برنامج المفهرس : ( Indexer program)
3.    برنامج محرك البحث .

 

1. برنامج العنكبوت :

 

تستخدم محركات البحث برنامج العنكبوت ليجاد صفحات حديثة على الوب اضافتها، و يسمي ذلك البرنامج كذلك ” الزائر” لنة يبحر فالنترنت بهدوء، لزيارة صفحات الويب و الطلاع على محتويتها، و يخذ ذلك البرنامج مؤشرات المواقع من عنوان الصفحة ” page title ” و العبارات المفتاحية ” key words” التي تحتويها ، اضافة الى محتويات محددات الميتا ” meta tags” فيها.
و لا تقتصر زيارة برنامج العنكبوت على صفحات الموقع، بل يتابع البرنامج تعقب الروابط ( links) الموجودة بها لزيارة صفحات اخرى. اما الغاية من هذي الزيارات فهي وضع النصوص المتاحة على تلك المواقع على فهارس محرك البحث ليتمكن المحرك من العودة اليها
فيما بعد، و لم تغب فكرة تغيير المحتوي فالموقع عن البال مصممى محرك البحث، اذ يقوم محرك البحث بزيارات دورية للمواقع الموجودة فالفهارس للتكد من التعديلات التي تصيب المواقع المفهرسه.



2. برنامج المفهرس:

 

يمثل برنامج المفهرس ( index program)، الكتالوج (catalogue) احيانا، قاعدة بيانات ضخمة توصيف صفحات الويب و يركز التوصيف على المعلومات التي حصلت عليها من برنامج العنكبوت ( spider) كما تعتمد على بعض المعايير كالعبارات الكثر تكرارا من غيرها، و تختلف محركات البحث عن بعضها فهذه المعايير، اضافة الى اختلافها فخوارزميات البحث searching algorithms .

 

3. برنامج محرك البحث :

 

يبدا دور برنامج محرك البحث (search engine program) عند كتابة كلمة مفتاحية فمربح البحث ( search box) اذ يخذ ذلك البرنامج الكلمة المفتاحية و يبحث عن صفحات الويب التي تحقق الاستعلام، الذي كونة برنامج المفهرس فقاعدة بيانات الفهرس، بعدها يعرض نتيجة البحث المتمثلة بصفحات الويب التي طلبها المستخدم فنافذة المستعرض ” browser window” و يقوم كذلك بعملية الترتيب لهذه الصفحات.
وتختلف محركات البحث عن بعضها فاسلوب العمل، فمثلا: تحتفظ قاعدة بيانات altavista بكل تفاصيل صفحة الويب المخزنة عليها، اما محركات البحث الخري فقد تحتفظ بالعاوين الاساسية للصفحة فقط، مما يؤدى الى اختلاف شكل و دقة نتائج البحث الظاهر للمستخدم.

 

ثالثا :نسبة المواقع التي تغطيها محركات البحث من مجموع مواقع الشبكه(6)

 

اكدت دراسة اجراها معهد NEC للبحوث الواقع فمدينة برينيتون فو لاية نيوجرسى المريكية عام 1999، على 11 محرك بحث مستعملة فالنترنت، ان هذي المحركات لم تتمكن من التقلم مع النمو الكبير لمواقع الويب، و بينت الدراسة ان محركات البحث لا تغطى سوي قسم ضئيل من صفحات الويب، و ان ادراج الصفحات الحديثة بينها يستغرق و قتا طويلا.
ووجدت الدراسة ان محرك البحث “northern light” هو اكثر المحركات شمولا لكنة على الرغم من هذا لا يغطى سوي 1/6 من صفحات النترنت التي ممكن ان تصل النترنت اليها، و يذكر ان هذي النسبة قبل 18 شهر كانت تصل الى 1/3 من صفحات النترنت.
ويقول ستيف لورانس و سى لى جاليز، المتخصصان فعلوم الكمبيوتر فمعهد NEC و القائمين بهذه الدراسه، انه من المحتمل ان يصبح تخر ادراج الصفحات الحديثة ضمن محركات البحث امرا مقصودا، اذا تمتلئ قواعد البيانات التابعة لمحركات البحث هذي و صبحت عملية اضافة موقع جديد اليها عملية مكلفه، خاصة ان هذي الضافة لا تزيد فمعظم الحوال من الرباح العلانيه.

 

سم المحرك
نسبة التغطية المئويه
دعم اللغة العربيه
عنوان موقع الويب للمحرك
NORTHERN LIGHT
16.0%
لا
WWW.NORTHERNLIGHT.COM
SNAP
15.5%
لا
WWW.SNAP.COM
ALTAVISTA
15.5%
نعم
WWW.ALTAVISTA.COM
HOT BOT
11.3%
لا
WWW.HOTBOT.COM
MICROSOFT
8.5%
لا
WWW.MSN.COM
INFOSEEK
8.5%
نعم
WWW.INFOSEEK.COM
GOOGLE
7.8%
نعم
WWW.GOOGLE.COM
YAHOO(15)
7.4%
لا
WWW.YAHOO.COM
LYCOS
2.5%
لا
WWW.LYCOS.COM
EUROSEEK
2.2%
نعم
WWW.EUROSEEK.COM
EXICIT
5.6%
نعم
WWW.EXCIT.COM
ALL THE WEB
15.5%
نعم
WWW.ALLTHEWEB.COM

 

 

 

 

 

رابعا : فهرسة محركات البحث للمواقع(7):

 

ومن اثناء العرض السابق لمكونات محركات البحث، تبين ان برنامج العنكبوت او عنكبوت الشبكة ” web spider ” و برنامج المفهرس “cataloger” هما المسئولان عن ايجاد صفحات الويب الحديثة و فهرستها و دخالها داخل قاعدة بيانات المحرك … و لكن كيف ؟
تستعمل و اصفات <META> الخاصة بكلا من “وصف الموقع ” و ” عبارات المفتاح ” فصفحة HTML ، حتي تضمن ادراج المواقع بشكل سليم فمحركات البحث، و وضع وصف و اضح له فيها، و لا يؤدى استعمال و اصفة <META> بعكس كثير من و اصفات HTML الى ظهور اي عنصر مرئى على صفحتك، لكن عمل هذي الواصفة يتم فالكواليس، حيث تقدم و صفا ن المعلومات التي تتضمنها الصفحة الى المتصفحات و عناكب الشبكة و محررات HTML .
ذا الوظيفة الساسية هي وصف الصفحة و عبارات المفتاح بها و تقديمها لمحركات البحث.
عندما يزور عنكبوت الشبكة صفحة لا تحتوى على وصف لها باستعمال و اصفة <META> فنة يسجل السطر القليلة الولي من النص الموجود فبداية الصفحة و يعتبر هذا و صفا لها ، و لا يعطى ذلك السلوب غالبا و صفا دقيقا للصفحه. و حد السباب الاساسية لذا “وجود ملف صورة فبدايتها”، اذ لا يتعرف عنكبوت الشبكة الا على النصوص، و لا يستطيع قراءة الملفات الرسوميه، التي تتضمن نصوص على هيئة صور، و ذلك يوضح استعمال و اصفات <META> و خاصتا عندما تحتوى الصفحة على كثير من الصور.

 

خامسا : الوقت اللازم لظهور صفحات الويب الحديثة فمحركات البحث.

 

من اثناء بحث اجرتة مجلة الطبيعة المريكية فعدد JOLY من عام 1999 و التي اوضحت ان المتوسط العمري لظهور الموقع فمحركات البحث هو 57 يوم تقريبا(8) و حاز محرك البحث ALTAVISTA على المركز الول فيما بينها و الحصائيات كانت على النحو الاتي:

33 يوم ATAVISTA
47 يوم
EXCITE
48 يوم
NORTHERNLIGHT
51 يوم
HOT BOT
57 يوم MSN
60 يوم INFOSEEK
76 يوم YAHOO
91 يوم SNAP
147 يوم LYCOS
غير معروف UROSEEK
غير معروف GOOGLE
كما اوضحت الدراسة ان الوقت اللازم لتحديث قاعدة بيانات جميع محرك بحث هي نفس المعدلات السابقه، حيث لا بد ان يتم تحديث قواعد بيانات محركات البحث لملاحقة التغيرات او التعديلات على المواقع الموجودة داخل قاعدة البيانات و ايضا الحصول على مزيد من المواقع الحديثة على الويب.

 

سادسا : اليات البحث فمحركات البحث

 

ذكرنا سابقا ان محركات البحث تستعمل فبحثها عن مواقع الويب ما يدعي العبارات المفتاحية “KEY WORDS” التي ممكن ان تكون عباره، و تستعمل اليات البحث عادة بعض المعاملات “OPERATORS” مع هذي العبارات المفتاحيه، لتوفير خيارات اضافية لعملية البحث، و هنالك طريقتين للبحث فمحركات البحث هما:

 

البحث البسيط SIMPLE SEARCH

 

وهذا النوع من نوعيات البحث يقوم فيه معظم الناس و خاصتا المبتدئين مع استعمال النترنت و هم من يجهلون تقنيات البحث المتقدم. و هو يصبح عن طريق وضع كلمة بدون اي علامات او شارات بعدها البحث عنها و لكننا سنجد النتيجة الكثير من النتائج العلائقية و الروابط المتينه.

 

البحث المتقدم ADVANCED SEARCH

 

تزيد خصائص البحث المتقدمة التي يوفرها العديد من محركات البحث امكان العثور على المعلومات، كما انها كيفية فعالة للبحث عن معلومات محددة “SPECIFIC INFORMATION” اذ تتيح للمستخدمين امكان البحث عن عدة عبارات مفتاحية معا.
وفيما يلى قائمة لمحركات البحث و مصطلحات البحث المتقدم التي تستعملها(9):
infoseek
lycos
excite
hotbot
altavista
yahoo
x
x
x
x
x
and
x
x
x
x
x
Or
x
x
x
x
Not
x
x
Near
x
And not
x
x
x
x
x
x
” “
x
x
x
x
x
x
+
x
x
x
x
x
x
x
x
*

 

سابعا : نوعيات محركات البحث(10):

 

يمكن القول انه ربما و لي الزمان الذي كان ممكن به الاكتفاء بموقع بحث واحد ليلبى مختلف احتياجاتك فالبحث بالشبكه، فمع التنامي المطرد للنترنت جري نوع من التخصص فو ظائف البحث، بحيث اصبح جميع موقع لمحركات البحث يحتوى على مجموعة من الخدمات التي تحتاجها للتنقيب عن المعلومات المطلوبة بسرعة و يسر، و سيتم عرض تلك النواع و هي كالتى :

 

محرك بحث يبحث عن الصور(11):

 

يمكن القول بن موقع WWW.DITTO.COM و هو محرك بحث يرتكز على الصور، من ادخال كلمه، او قطع للبحث عنه، و بدلا من اعادة  نتائج البحث بشكل نصى يعيد الموقع النتائج بشكل عدد من الصور المصغرة Thumbnails ، و عند النقر على اي صورة مصغرة تعرض صفحة الويب التي تتضمنها، و يضم الفهرس فهذا الموقع اكثر من مليونى صوره، و ذلك طبقا لحصائية تم عملها فعام 1999، كما ان هنالك الكثير من محركات بحث الصور منها www.snap.com

 

* محرك بحث الملفات :

 

قامت شركة c2v بتصميم برنامج جديد اطلق عليه اسم textomattom و هو من محركات البحث متعددة اللغات و ليس من بينها العربيه، و هو يعمل على ايجاد الملفات الهامة عن طريق محتوياتها ايا كانت نوعها او مواقعها على الويب، كما يعمل على تنفيذ عمليات البحث اعتمادا على ادخال عبارات مفاتيح المفردات المتخصصه، و بالتالي يستطيع البرنامج من اثناء المحتوي دون اللجوء الى عناوين الملفات و دون الحاجة الى فتحها ايا كان نوع الصداره، و ايضا يسمح باستعمال عبارات البحث المتقدم and , or , not


نواع محرك البحث جوجل