مقدمه
با وجود اينكه شبکه تنها 15 سال است که بوجود آمده است ، يک منبع اطلاعاتي عمده و رسانه ارتباطي شده است و تاثير خود را بر رفتار اطلاعاتي و ارتباطاتي هم در زندگي روزمره و هم در زندگي علمي داشته است . تحقيقات شبکه اي چند رشته اي [4] است . اين تحقيقات بطور گسترده اي توسط دانشمندان رايانه و اطلاعات ، جامعه شناسان ، اقتصاددانان ، زبان شناسان ، روانشناسان ، دانشمندان ارتباطات و ديگران صورت مي پذيرد . به منظور انجام مطالعه بر روي شبکه ، بيشتر محققان نيازمند داده هستند . بعضي از محققين ( مثل ثلوال[5]، 2001 يا آلبرت ، جونگ و بارباسي[6] ، 1999) قادرند ( ازهر دو لحاظ فني و اقتصادي ) ابزارهايي براي جمع آوري داده هاي ضروري را از شبکه ايجاد نمايند . سوسيبات[7] توسط تيم ثلوال توسعه يافته است و براي هر کسي که منابعي دارد که مي تواند توسط خزنده[8] اداره شود و بروندادهاي آن قابل ذخيره باشند ( گروه تحقيقات آماري سايبر متريکس[9] ، 2004 الف ) ، و نتايج جستجوهاي ويژه براي بارگيري در دسترس است (گروه تحقيقات آماري سايبر متريکس ، 2004 ب ) ، بصورت رايگان قابل استفاده است. ديگران ( مثلا اسپينك[10] و يانسن[11] ، 2004 يا هوبرمن و آداميك[12] ، 1999) به اندازه كافي خوش شانس بودند تا به داده هاي جمع آوري شده توسط ابزارهاي جستجو تجاري دسترسي داشته باشند . بعضي از مطالعات شبكه اي توسط محققاني كه در مورد موتورهاي جستجو كار مي كردند اجرا شده است ( مثلا برودر[13] و ديگران ، 2000 يا فترلي[14] و ديگران 2004 ) ، بنابراين آنها مي توانستند به شبكه خزيده يا به داده هاي پايگاه داده موتورهاي جستجو دسترسي يابند.
ديگر محققين به آنهايي كه خوش شانس و مبتكر بوده اند و مي توانستند رايگان به ابزارهاي بازيابي اطلاعات دسترسي داشته باشند ، غبطه مي خورند : به موتورهاي جستجو ، يا به پايگاههاي داده پروژه هاي نگهداري شبكه (مثل آرشيو اينترنت[15]). امروزه پروژههاي نگهداري شبكه نيز دسترسي محدودي بوجود آوردهاند (بدليل مشكلات حق مولف) يا حداقل ابزارهاي بازيابي و يا غير متني را فراهم مي نمايند، بنابراين براي استفاده تحقيقات شبكه بسيار محدودند. لذا بهترين ابزارهاي جستجوي رايگان موتورهاي جستجو هستند. چشم انداز موتورهاي جستجو در سالهاي اخير تحت تغييرات عمده اي قرار گرفتهاند ، و معمولا تنها چند بازيگر عمده معدود وجود دارد ( سوليوان[16] 2004) : گوگل، ياهو ، اسكجيوز/ تئوما[17] ، و ام.اس.ان. در اين مقاله ما گوگل، ياهو و ام.اس.ان. را در نظر گرفته ايم (هم اكنون اسكجيوز/ تئوما تعدادي از ويژگيهاي عمده تحقيقات شبكهاي، مثل پيوند به صفحات را دارانيست). اگزاليد[18] تازه واردي به صحنه جستجو است وتنها چيزي كه باقي ميماند اينست، ببينيم چگونه در آينده توسعه مييابد. موتورهاي جستجوي اضافي با قابليتهاي بخصوص ومرتبط به تحقيقات شبكهاي، ميتواند وجود داشته باشند، اما به عقيده ما پوشش ابزارهاي جستجو يك ويژگي مركزي است (مثلا در اين مورد، اندازه فرق ميكند) و بنابراين آزمودن ابزارهاي جستجو تنها محدود به اين موتورهاي جستجو ميشود. با توجه به کامسکور[19] ( 2005) ، گوگل ، ياهو و ام.اس.ان. با هم و در مجموع 5/82 % از نتايج شبكه اي در جولاي 2005 را تشكيل داده اند ( گوگل 5/36% ، ياهو 5/30% و ام.اس.ان.5/15% ).
نماي كلي مقاله بدين ترتيب است : اول ويژگيهاي مطلوب را فهرست كرده و اهميت آن را براي تحقيقات شبكه اي توضيح مي دهيم . بعد آزمايش مي كنيم كه آيا سه موتور جستجويي كه در بالا ذكر شدند اين التزامات را به انجام مي رسانند و در نهايت دريافتمان را از يافته ها به بحث مي گذاريم . موتورهاي جستجو بطور مداوم درحال تغييرند ، بنابراين مي خواهيم بر اين نكته تاكيد داشته باشيم، مواردي كه درباره اين ابزارها بدست آمده بر اساس يافته هاي ما در اواسط آگوست 2005 مي باشد . براي پشتيباني يافته ها ، ما هر مثالي را كه در مقاله ارائه شده ، ذخيره و مستند كرده ، و نسخه هاي ذخيره شده مثالهاي جستجو و ديگر مستند سازيهايي كه مقاله بر اساس آن شكل گرفته در اختيار علاقمندان قرار داده مي شود .

Alltheweb : يك موتورجستجوي خيلي بزرگ كه اعتبار و عموميت زيادي دارد. درسال 2002 ظاهراً يکي از مهمترين رقباي Google بشمار مي رفت . در يك بررسي صورت گرفته توسط Pandecta magazine ، كه در چهارمين سه ماه سال 2002 انجام شده است ، تخمين زده شده است كه alltheweb دومين و بزگترين پايگاه داده را دارد , همچنين در تست ارتباط نيز خوب كار ميكند و بعد ازگوگل و wisenut در رتبه سوم است. اما در تست سرعت معمولا شكست ميخورد.
Altavista : موتورجستجوي پيشگامي است كه توسط overture درفوريه 2003 خريداري شده است.

Ask jeeves : يك موتورجستجوي نسبتاً عمومي است. ادعايش براي شهرت اين است كه به شما اجازه ميدهد تا بجاي استفاده تنها از كلمات كليدي بتوانيد درخواست خود را بصورت يک سئوالات متني توضيحي واردكنيد. Ask jeeves ازteoma ، overture و ODP نتايج جستجو را دريافت ميكند.

Excite : يكي از موتورهاي اصلي جستجو است.

Google : بزرگترين ، سريعترين و دقيقترين موتور جستجو است . گوگل با سيستم pagerank خودش مشهور است.

Hotbot : يك موتورجستجوي نسبتاً عمومي است ، اگرچه محبوبيت آن شديدا با تسلط پيدا كردن گوگل كاهش يافته است. Hotbot يكبار گزارش شده است كه بزرگترين پايگاه داده را در اختيار دارد. دريك بررسي صورت گرفته توسط pandecta magazine تخمين زده شده است كه چهارمين پايگاه داده بزرگ را بعد ازگوگل ، alltheweb و wisenut دارد . hotbot به منظور رسيدن به سرعت از فن آوري محاسبه موازي بهره برداري ميكند ( شبكه ايستگاه هاي كاري ). زماني كه شما قدرت محاسبه تركيبي اين مولفه هاي كوچكتر را اضافه ميكنيد، شما كارايي طبقاني ابركامپيوتر را به دست مي آوريد.

Lycos : خود را به عنوان يك موتورجستجو مطرح کرده است و در اواخر دهه 90 داراي رتبه بالايي از لحاظ محبوبيت بين کاربران اينترنتي بوده است.

Overture : بزرگترين و عمومي ترين موتورجستجوي PPC است , كه قبلاً به عنوان GoTo شناخته شده است..

Teoma : يك موتورجستجوي نسبتاً جديد است . ( درمقايسه با oldiesمانند altavista .)

Yahoo : يكي ازاولين و دوست داشتني ترين دايركتوريهاي وب است. Yahoo درحال حاضر ( 2002 ) سايتي است كه بيشترين بازديد كننده را در اينترنت دارد.
ده نكته مهم براي بهبود بخش جست و جوي سايت
در اينترنت جست و جو تنها محدود به موتورهاي جستجوي بزرگ وب نيست. يكي از مهمترين بخشهاي سايتهاي بزرگ، امكان جست و جو در اطلاعات و صفحات همان سايت است. بسياري از طراحان و توسعه دهندگان وب، خود اقدام به طراحي يك موتور جستجو براي سايت مشتري خويش ميكنند و عدهاي نيز از ابزارهاي رايگان يا تجاري در اين زمينه بهره ميبرند. برخي از شركتهاي مطرح مانند گوگل يا Fast Search نيز اقدام به ارائه راه حلها و محصولاتي در همين زمينه كرده اند كه به صورت انحصاري اقدام به گردش در صفحات يك سايت و ايندكسسازي صفحات و اطلاعات آن ميكنند. مواردي كه در اين نوشتار خواهيد خواند، گوشهاي از نكات مهميست كه شركت گوگل به مديران سايتها براي بهبود بخش جستجو در سايت توصيه ميكند. بيگمان، اين نكات حاصل تجربهي اين شركت در زمينهي جست و جوست و نشان از اهميت اين بخش در سايتها دارد.
۱-كاربران و جست و جوگران را راضي نگه داريد.
مردم از ابزارهاي جستجو براي بدست آوردن نتايج مورد نياز خود استفاده ميكنند. اگر جست و جوگر درست كار نكند و كاربران واقعا” به نتايج حاصل از جست و جو نياز داشته باشند، تكنولوژي و اطلاعاتي كه در سايت قرار دادهايد، تنها تلف كردن وقت و سرمايه است. پس از كاربران حرفهاي خود بخواهيد براي بهبودِ بخش جست و جوي سايت خود، به شما كمك كنند.
۲-جست و جوي خود را سريع كنيد.
جست و جو و نمايش نتايج آن بايد سريع باشد. سرعت بيشتر جست و جو ،كاربران را تشويق ميكند تا بيشتر از اين بخش، استفاده كنند. اكثرا كاربران، تكنولوژي و سايتهايي را انتخاب خواهند كرد كه استفاده از آنها آسان باشد و نتايج را به سرعت نمايش دهد.
۳-امكان جستجو در هر لحظه
بايد امكان جست و جو براي كاربران در هر لحظه و يا در هر صفحهي وب سايت شما كه هستند، فراهم باشد.سعي كنيد جعبهي جست و جو و يا دست كم لينك به صفحهي جست و جو در تمام صفحات وب سايت شما تكرار شود و در صفحات نتايج جست و جو نيز همواره يك جعبهي جست و جو قرار گرفته باشد.
۴- صفحات نتايج جستجو را ساده نگه داريد
در طراحي قالب و طرح صفحات حاصل از جست و جو، سعي كنيد سادگي و خلوت بودن را رعايت كنيد. جست و جوي پيشرفته و ديگر امكانات غير ضروري را در صفحات ديگر قرار دهيد. همچنين در نمايش آيتمها و نتايج جست و جو، به عناصر مهم و اساسي اكتفا كرده و از نمايش نتايج و يا لينكهاي مرتبط و يا غير ضروري پرهيز كنيد.
۵- هر چيزي را كه ممكن است، ايندكس كنيد
مهمترين دليلي كه افراد نميتوانند سند يا صفحه اي را كه به دنبالآن هستند، در نتايج جست و جو بيابند، آن است كه آن سندها در بانك اطلاعات موتور جست و جو درج نشده اند.
اگر سند و يا صفحهاي از سايت شما مهم است، حتما” مطمئن شويد كه در بانك اطلاعات موتور جست و جوي سايت شما نيز درج و در صفحات نتايج نشان داده ميشود.
۶-صفحات و اسنادي كه HTML نيستند را فراموش نكنيد
دركنار جست وجو و ايندكس صفحات HTML سايت خود، ديگر فايلها ومستندات غير HTML (مانند فايلهاي PDF ويا MS Word) را فراموش نكرده و آنها را نيز به موتور جست و جو سايت معرفي كنيد.
۷- انتشار مطالب
بسياري از اطلاعات و مستندات يا در ذهن كارمندان و يا در روي ميزهاي كار آنها قرار دارند. بهتر است آنها را در جايي قرار دهيد تا بتوان در آنها جست و جو كرد. هرگونه سند و يا اطلاعاتي را كه ميتوانيد بر روي سايت خود و يا در اختيار موتورهاي جست و جو قرار دهيد.
۸- از ايندكس كردن و جست و جو اسناد محرمانه نترسيد
موتور جست و جوي خود را از ايندكس مستندات مهم و يا اسنادي كه در بخشهاي اعضا و يا حفاظت شده HTTPS هستند، منع نكنيد.
اگر سندي واقعا” محرمانه نيست، آن را در بخشهاي حفاظت شده قرار ندهيد. ميتوانيد همهي اسناد را ايندكس و در بانك موتور جستجو قرار دهيد و طبيعي است كه اين اسناد تنها براي اعضاي معتبر نمايش داده خواهند شد.
۹- كلمات و درخواستهاي متعدد جست و جوگر سايت خود را آزمايش كنيد
بعد از ايندكس كردن و يا درج اطلاعات در بانك موتور جستجو، درخواستها و كلمات متعددي را با هدف پيدا كردن اسناد و صفحات مهم سايت خود آزمايش كنيد.از كلمات كليدي مهم و مرتبط با صفحات سايت خود در جست و جو استفاده كنيد . اين روشي ساده براي پيدا كردن مشكلات ايندكس و يا جستجو و همچنين پيدا كردن صفحات و اسنادي با آدرسهاي اشتباه است. همچنين مفيد خواهد بود اگر از كاربران سايت نيز در اين آزمايشها كمك بگيريد.
۱۰-منافع و نگاه به آينده
اطلاعات سازمانها و يا شركتها و همچنين كاربران سايتها در حال افزايش است. آزمايش و اطلاع از تعداد جست و جوهايي كه هر كاربر در روز و يا در محدودهي زماني خاصي انجام ميدهد يا ميتواند انجام دهد، به شما در بهبود بخش جست و جوي سايت كمك ميكند.مطمئن شويد كه بخش جست و جوي سايت شما به راحتي گسترش پيدا ميكند، بدون آن كه لازم به هزينهي بسيار بيشتري به خاطر تجهيزات نرم افزاري و يا سخت افزاري و همچنين مديريت آن باشد.
دسته بندي ها:
موتورهاي جستجو
موتورهاي فراجستجو
موتورهاي جستجوي معروف
موتورهاي جستجو
مركز جستجوي مايكروسافت www.Search.msn.com
موتور جستجوي منعطف www.lycos.com
دروازه بزرگ و ابزار جستجو www.yahoo.com
جستجودر ميان مجلات – جستجوي موضوعي در محدوده جغرافيايي دلخواه www.hotbot.com
جستجوهاي پيچيده www.altavista.com
جستجودر مورد كاربرد نرم افزارها در اينترنت www.inktomi.com
جستجو، جستجوي مقالات براساس ارتباط مطلب با كلمه جستجو www.google.com
مقوله هاي مختلف همراه با يك فرم جستجو www.directhit.com
جستجو به طورهمزمان در چند موتور جستجو www.Framesearch.net
موتور جستجو براي بچه ها www.rcls.org/ksearch.htm
موتورجستجو www.excite.com
خدمات تجاري آن لاين www.aol.com
موتورجستجوي منعطف light.comwww.northern
معرفي چندين موتور جستجو www.searches.com
كتابخانه هاي دانشگاه آلباني با تركيبي از موتورهاي جستجو www.albany.edu/library/internet/5yntax.html
جستجودر اينترنت، خواندن اخبارروزانه بررسي قيمتهاي سهام www.netscape.com
جستجو در بيش از 3000 پايگاه اطلاعاتي www.isleuth.com
موتورقوي جستجو، استفاده از يوزنت، اخبار سهام و خدمات خبري سايتهاي FP- www.dogpile.com
جستجوي وسيع براي آدرسهاي اينترنتي، تلفن، آدرس پستي و پست الكترونيكي www.whowhere.com
موتورقوي جستجو براي آدرسهاي وب، مجله ها، روزنامه ها، گروههاي خبري، شركتهاو فايلهاي Mp3 www.mamma.com
جستجوي افراد www.People.yahoo.com
معرفي سايتهاي خود به اينترنت www.addweb.com
موتور جستجو براي متخصصين حقوق، تجارت، علوم و پزشكي www.galaxy.com
مقالات علوم اجتماعي، خريد، محيط آدرس بچه ها، آموزش، موسيقي www.nerdworld.com
موتور جستجو براي جمع آوري اخبار مهم برحسب مقوله از منابع رسانه اي دنيا www.totalnews.com
بيست صفحه اول پايان نامه هاي سراسر جهان و نيز فهرستي از خلاصه مقالات www.proquest.com
رتبه بندي و مقايسه موتورهاي جستو با توجه به تحقيقات بازار www.searchenginewatch.com
موتورهاي فراجستجو
www.1blink.com
www.2trom.com
www.800go.com
www.brightgate.com
www.copernic.com
www.debriefing.com
www.itools.com/find-it
www.fly-catcher.com
www.gohip.com
www.highway61.com
www.inference.com
www.metabug.com
www.metacrawler.com
www.metafind.com
www.metagopher.com
www.multimeta.com
www.metasearch.com
www.oneseek.com
www.search.com
www.searchspaniel.com
www.searchspell.com
www.surfwax.com
www.surfy.com
www.thebighub.com
www.webassyst.com
www.webtaxi.com
www.zinternet.com
موتورهاي جستجوي معروف
www.teoma.com
www.excite.com
www.goto.com
www.alltheweb.com
www.ask.com
www.infospace.com
www.looksmart.com
www.internet.com
www.hotsheet.com
www.snap.com
www.msn.com
www.nbci.msnbc.com
www.webcrawler.com
موتور جستجو يا جويشگر به طور عمومي به برنامهاي گفته ميشود که کلمات کليدي را در يک سند يا بانک اطلاعاتي جستجو ميکند. در اينترنت به برنامهاي گفته ميشود که کلمات کليدي موجود در فايلهاو سندهاي وب جهاني، گروههاي خبري، منوهاي گوفر و آرشيوهاي FTP را جستجو ميکند.
برخي از موتورهاي جستجو براي تنها يک وبگاه اينترنت به کار برده ميشوند و در اصل موتور جستجويي اختصاصي آن وبگاه هستند که تنها محتويات همان وبگاه را جستجو ميکنند.
برخي ديگر نيز ممکن است با استفاده از SPIDERها محتويات وبگاههاي زيادي را پيمايش کرده و چکيدهاي از آن را در يک دادگان به شکل شاخصگذاريشده نگهداري ميکنند. کاربران سپس ميتوانند با جستجو کردن در اين دادگان به وبگاهي که اطلاعات موردنظر آنها را در خود دارد پي ببرند.
۱- انواع موتورهاي جستجو
۱.۱- موتورهاي جستجوي پيمايشي
۱.۲- فهرستهاي تکميلدستي
۱.۳- موتورهاي جستجوي ترکيبي با نتايج مختلط
۱.۴- ابر جستجوگرها
انواع موتورهاي جستجو
موتورهاي جستجو به دو دسته کلي تقسيم ميشوند. موتورهاي جستجوي پيمايشي و فهرستهاي تکميلدستي. هر کدام از آنها براي تکميل فهرست خود از روشهاي متفاوتي استفاده ميکنند البته لازم به ذكر است كه گونه اي جديد از موتورهاي جستجوگر تحت عنوان "ابر جستجوگر" (Meta Search Engines) نيز وجود دارد كه در ادامه به توضيح هر يك از اين موارد خواهيم پرداخت :
موتورهاي جستجوي پيمايشي
موتورهاي جستجوي پيمايشي (Crawler-Based Search Engines) مانند گوگل فهرست خود را بصورت خودکار تشکيل ميدهند. آنها وب را پيمايش کرده، اطلاعاتي را ذخيره ميکنند، سپس کاربران از ميان اين اطلاعات ذخيره شده، آنچه را که ميخواهند جستجو ميکنند. اگر شما در صفحه وب خود تغييراتي را اعمال نماييد، موتورهاي جستجوي پيمايشي آنها را به طور خودکار مييابند و سپس اين تغييرات در فهرستها اعمال خواهد شد. عنوان، متن و ديگر عناصر صفحه، همگي در اين فهرست قرار خواهند گرفت.
فهرستهاي تکميلدستي
فهرستهاي تکميلدستي يا (Human-Powered Directories) مانند فهرست بازي (Open Directory) مانند Dmoz وابسته به کاربراني است که آن را تکميل ميکنند. شما صفحه مورد نظر را به همراه توضيحي كوتاه در فهرست ثبت ميکنيد يا اين کار توسط ويراستارهايي که براي آن فهرست در نظر گرفته شده، انجام ميشود. عمل جستجو در اين حالت تنها بر روي توضيحات ثبت شده صورت ميگيرد و در صورت تغيير روي صفحه وب، روي فهرست تغييري به وجود نخواهد آورد. چيزهايي که براي بهبود يک فهرستبندي در يک موتور جستجو مفيد هستند، تأثيري بر بهبود فهرستبندي يک دايرکتوري ندارند. تنها استثناء اين است که يک سايت خوب با پايگاه دادهاي با محتواي خوب شانس بيشتري به نسبت يک سايت با پايگاه داده ضعيف دارد. البته در مورد جستجوگرهاي مشهور از جمله گوگل و ياهو، يک مولفه ديگر هم براي بهبود فهرستبندي وجود دارد که کمک مالي است، يعني وبگاههايي که مايل به بهبود مکان وبگاه خود در فهرستبندي هستند، ميتوانند با پرداخت پول به اين جستجوگرها به هدف خويش برسند.
موتورهاي جستجوي ترکيبي با نتايج مختلط
به موتورهايي اطلاق ميشود که هر دو حالت را در کنار هم نمايش ميدهند. غالباً، يک موتور جستجوي ترکيبي در صورت نمايش نتيجه جستجو از هر يک از دستههاي فوق، نتايج حاصل از دسته ديگر را هم مورد توجه قرار ميدهد. مثلاً موتور جستجوي ام.اس.ان (MSN) بيشتر نتايج حاصل از فهرستهاي تکميلدستي را نشان ميدهد اما در کنار آن نيم نگاهي هم به نتايج حاصل از جستجوي پيمايشي دارد.
ابر جستجوگرها
اين گونه جديد از موتورهاي جستجوگر كه قدمت چنداني نيز ندارند از تركيب كردن نتايج حاصل از چنديد موتورجستجوگر استفاده ميكند.بدين معني كه اين موتور عبارت مورد نظر شما را در چندين موتورجستجوگر ِ جستجو ميكند و نتايج آنها را با هم تركيب كرده و يك نتيجه كلي به شما ارائه ميدهد.بهعنوان مثال موتورجستجوگر داگ پايل [1] از نتايج حاصل از موتورهاي Google - Yahoo - MSN و ASK استفاده كرده و نتيجه حاصل را به شما ميدهد.
اعظم شجاع الدين
دانشجوی ترم دوم