وب اخبار اطلاعات ١١٨ شعر و ادب
موتور جستجوی ریسمون

 

صالح و طالح متاع خویش نمودند         تا که قبول افتد و که در نظر آید

ریسمون نخستین موتور جستجوگر مستقل منابع فارسی در شبکه جهانی وب است.

این جستجوگر همه وب سایتهای فهرست Link.ir را در دوره های زمانی یک ماهه می پیماید و محتویات و مطالب آنها را نمایه سازی می کند و در بانک اطلاعاتی خود جهت ارائه خدمات جستجو به مراجعه کنندگان نگهداری می نماید.

پروژه جستجوگر ریسمون از مهرماه 1383 در شرکت رادکام آغاز گردید و هم اکنون پس از بیش از یک سال تلاش و پیگیری مستمر در مرحله راه اندازی آزمایشی قرار گرفته است.

در حال حاضر ریسمون به صورت آزمایشی راه اندازی شده است و ممکن است در ارائه خدمات خود دچار مشکلاتی باشد. ما همه کوشش خود را در جهت رفع مشکلات آن و ارائه بهتر خدمات به کار خواهیم بست و در این راه امیدواریم تا پیشنهادات و نظرات شما یاریگر ما باشد.

در اینجا لازم به ذکر است که پروژه ریسمون منحصرا بوسیله شرکت رادکام به اجرا درآمده است و این شرکت در طراحی، اجرا و راه اندازی آن به طور مستقل و بدون هیچ گونه پشتیبانی مادی و معنوی دیگران عمل نموده است و در مورد ریسمون به هیچ نهاد دولتی و خصوصی و یا شخصی بدهکار نیست.
 


معماری ریسمون

ریسمون دارای مؤلفه های اصلی یک موتور جستجو است. شکل 1 مؤلفه های یک موتور جستجوی مستقل نوعی، در بستر وب را نشان می دهد.

 مؤلفه پیمایش و نمایه سازی :

این مؤلفه سامانه ای است که با خزیدن در وب سایت ها، محتویات آنها را برای فرایند نمایه سازی و قراردادن در بانک اطلاعاتی، پالایش می کند. این سامانه معمولا برای یافتن وب سایت ها، از فهرست مرجع خود استفاده می کند. موتورهای جستجوگر غول پیکری مانند Google،دیگر تنها به فهرست مرجع خود متکی نیستند(البته در ابتدا متکی بود) بلکه همه پیوندهای موجود در هر وب سایتی را به صورت زنجیره ای دنبال می کنند. اما در مورد موتور های جستجوگر کوچک و یا منطقه ای با توجه به محدود بودن دامنه وب سایتها، فهرست مرجعی وجود دارد که سامانه پیمایش و نمایه سازی تنها به نمایه سازی وب سایتهای آن اقدام می نماید. در مورد ریسمون این فهرست مرجع، وب سایت Link.ir است که در بخش های بعدی به تفصیل در مورد آن صحبت خواهد شد.
 

 مؤلفه پویش و جستجو:

این مؤلفه، بانک اطلاعاتی را که بوسیله مؤلفه پیمایش و نمایه سازی پر شده است را برای عبارات مورد نظر، جستجو می¬کند. در واقع هسته اصلی جستجوگر در این این مؤلفه نهفته است. در مورد این مؤلفه آنچه از همه مهمتر است زمان پاسخ آن است و باید الگوریتم های مناسب و نیز زیرساختهای سخت افزاری کارا، برای به حداقل رساندن زمان پاسخ این مؤلفه به کار گرفته شود.

 مؤلفه پایش و نظارت:

این مؤلفه نقش نظارتی و تحلیلی بر خدمات موتور جستجوگر دارد. اطلاعات آماری که از این مؤلفه استخراج می گردد بسیار ارزشمند است و به عنوان مثال مشخص می کند که مردم بیشتر به چه چیزی علاقه دارند و به دنبال چه می گردند. علاوه بر این امکان ارائه اطلاعات آماری جغرافیایی نیز وجود دارد. تحلیل این اطلاعات آماری از دیدگاه های مختلف تجاری، فرهنگی و اجتماعی و حتی امنیت ملی بسیار مهم و قابل توجه است.

 خدمات ارزش افزوده:

با بالا رفتن مخاطبین وب سایتی که خدمات جستجو را به عنوان یکی از نیازهای اولیه کاربران وب، ارائه می دهد؛ توان اجرای طرحهای تجاری در این وب سایت بالا خواهد رفت. شاید تجربه Google در این عرصه مثال زدنی باشد. چرا که این وب سایت پس از جذب مخاطبین بیشمار از همه نقاط دنیا، با اجرای طرح تبلیغات در نتایج جستجو توانست به موفقیت تجاری چشم گیری دست یابد.
به علاوه این وب سایتها برای هرچه بالارفتن تعداد مخاطبین باز هم به ارائه خدمات جدید اقدام می کنند تا کاربران را هرچه بیشتر به خدمات خود وابسته نگه دارند. باز هم در این زمینه شاید Google موفق ترین باشد، این وب سایت با عرضه خدماتی مانند Froogle، Orkut، GoogleEarth، GMail وبسیاری خدمات دیگر، گوی سبقت را از سایر رقبای خود در جذب مخاطب ربوده است.

 در ریسمون مؤلفه پیمایش و نمایه سازی با استناد به فهرست Link.ir به عنوان مرجع پیوند خود، در وب سایتها می¬خزد و اطلاعات آنها را پس از استخراج و نمایه سازی در بانک اطلاعاتی خود ذخیره می کند. این فرایند در حال حاضر با توجه به زیرساختهای موجود برای نمایه سازی 2 میلیون صفحه، به مدت 10 روز به طول می انجامد. پس از پایان این فرایند بانک اطلاعاتی برای عملیات جستجو در اختیار مؤلفه پویش و جستجو قرار می گیرد و سامانه پیمایش و نمایه¬سازی، بانک اطلاعاتی قدیمی را دریافت و کار خود را دوباره آغاز می کند. به عبارت دیگر هر مؤلفه، یک بانک اطلاعاتی جداگانه برای خود دارد تا کار آنها با یکدیگر تداخل نداشته باشد. با این روش به حداکثر کارایی برای هر مؤلفه در تعامل آن با بانک اطلاعاتی دست می یابیم.
مؤلفه پایش و نظارت نیز به عنوان واسط بین کاربر و مؤلفه پویش و جستجو عمل می نماید؛ این مؤلفه عبارات مورد جستجو و سایر اطلاعات کاربر را جهت پردازش های بعدی ثبت می نماید.

مؤلفه خدمات ارزش افزوده نیز در ریسمون در نظرگرفته شده است. هم اکنون در وب سایت ریسمون جتسجوی اطلاعات تلفنی 118 کل کشور پیاده سازی شده است که از بانک اطلاعاتی کارگزارهای مرکز خدمات 118 مخابرات تهران استفاده می نماید. به علاوه یک سامانه تبلیغاتی نیز در حال پیاده سازی است که نسخه های اولیه آن در فهرست Link.ir نصب و راه اندازی شده است.


قابلیت های عمومی ریسمون

قابلیتهای عمومی ریسمون عبارتند از:

  1. نمایه سازی اسناد و پرونده هایی با قالبهای Open Office, Text RTF, Microsoft Office, PDF, HTML با پشتیبانی کامل از زبان فارسی.
  2. نمایه سازی محتویات فارسی بصورت جامع ، بطوریکه صفحاتی که با کاف و یای عربی تولید شده اند نیز به صورت فارسی نمایه سازی می شوند و در خروجی جستجو ظاهرمی گردند.
  3. نمایه سازی وب سایتهایی که با پروتکل SSL امن شده اند.
  4. نمایه سازی اسناد و پرونده هایی که در FTP سایت قراردارند.
  5. بهره مندی از Caching برای نگهداری اسناد و صفحات نمایه سازی شده.
  6. زمانبندی نمایه سازی مجدد.
  7. دسته بندی وب سایتهایی که نمایه سازی می شوند و امکان ارائه خدمات جستجو بصورت یک وب سرویس به وب سایتهای تابعه پورتالها دارد.
  8. قابلیت اعتبارسنجی برای ورود به بخشهای اینترانتی که برای دسترسی به آنها به گذرواژه نیاز است.
  9. پشتیبانی از stop words برای مشخص کردن کلمات و یا عباراتی که لازم نیست در نتیجه جستجو ظاهر شوند، مانند حروف اضافه "و"، "از"، "به" ، ...
  10. جستجوی منطقی بصورت ترکیب عطفی، فصلی و یا نفی از منطق بولی.
  11. بهره مندی از جستجوی پیشرفته با قابلیتهایی نظیر محدود کردن جستجو به موضوع مورد نظر.
  12. مشخص کردن کلمات یافت شده در نتیجه جستجو.
  13. نمایش خلاصه صفحه و یا سند یافت شده در نتیجه جستجو.
  14. اجرای چند نسخه از برنامه نمایه سازی و عملکرد همزمان آنها برای تسریع در امر نمایه سازی.
  15. بهره مندی از روال رتبه بندی نتایج جستجو به طوریکه صفحات و اسناد با ارتباط بیشتر، رتبه بالاتری در خروجی جستجو دارند.
  16. نمایش تعداد کل نتایج یافت شده.
  17. محاسبه و نمایش زمانی که صرف جستجو شده است.

Zoom Search قابلیت منحصر به فرد ریسمون

از جمله قابلیتهای منحصر به فرد جستجوگر ریسمون ارائه خدمات جستجو با امکان محدود کردن دامنه موضوع جستجو است. این قابلیت، امکان یافتن مطالب بدون تعویض عبارت مورد جستجو و صرفا با تحدید موضوع، جستجو را برای کاربر فراهم می کند.
هم اکنون در ریسمون امکان تحدید نتایج جستجو بر حسب موضوعات موجود در فهرست Link.ir تعبیه شده است و این امر به پالایش نتایج جستجو بوسیله کاربر متناسب با موضوع خود و یافتن صفحات و مطالب مورد نظر او کمک شایانی می کند.
به علاوه با این روش حتی می توان در ریسمون جستجوهای تخصصی ایجاد کرد. هم اکنون بخش جستجوی "شعر و ادب" در ریسمون به عنوان یک خروجی تخصصی جستجو عمل می نماید.
به عبارت دیگر این امکان نوعی Zoom در نتایج جستجو است و از امکانات منحصر به فرد ریسمون نسبت به سایر رقبای خارجی آن می باشد.
 

معرفی فهرست Link.ir به عنوان مرجع پیوندهای ریسمون

فهرست وب سایت های ایرانی

ریسمون از فهرست Link.ir به عنوان مرجع پیوند خود استفاده می کند. علاوه براین فهرست لینک امکان مرور موضوعی وب سایتهای ایرانی را نیز فراهم می کند. امکانی که از جهت ویژگیهای خود، تنها یک فهرست، می تواند در اختیار قرار دهد، چرا که هدف جستجوگر ها یافتن و دسترسی به محتویات وب سایت ها است و اگر کاربر بخواهد فهرست وب سایتهایی که در یک موضوع خاص فعالیت می کنند را بیابد، هیچ ابزاری به جز یک فهرست این امکان را در اختیار او قرار نمی دهد.

در حال حاضر در فهرست Link.ir افرادی به عنوان ویراستار سرفصل های اصلی، فعالیت می کنند؛ که مسوولیت دسته بندی و درج پیوند وب سایتهای سرفصل زیر مجموعه خود را دارند. کار دسته بندی وب سایتها و وارد کردن آنها در شاخه های مرتبط، کاری است که شاید در نگاه اول ساده به نظر برسد، ولی بسیار وقت گیر است و دقت خاص خود را می طلبد چرا که فردی که این کار را انجام می دهد باید آشنایی لازم را با نوع فعالیت وب سایت داشته باشد تا بتواند آن را در دسته مرتبط با آن ثبت کند.
ویراستار هر سرفصل پس از بررسی و مطالعه وب سایت و حصول اطمینان از حداقل های شرایط ثبت در فهرست Link.ir ، بهترین جایگاه را در میان شاخه زیر مجموعه خود انتخاب و وب سایت را به همراه توضیحاتی درباره وب سایت و نیز اطلاعات تماس با آن وب سایت، در آن شاخه درج می نماید. پس از این فرایند یک نامه الکترونیکی به Webmaster وب سایت ثبت شده، ارسال می گردد و او را از این امر مطلع می کند تا اگر نظر خاصی درباره شاخه، یا توضیحات وب سایت ثبت شده داشت، ویراستار را مطلع گرداند.
هم اکنون فهرست Link.ir در تلاش برای دسته بندی و نگهداری کلیه وب سایتهای فعال ایرانی ، شامل 13 سرفصل عمده به شرح زیر است:

 

اخبار و رسانه ها
مجلات و نشریات، روزنامه‌نگاران، رادیو، ...
خرید
فروشگاههای آنلاین، آگهی و نیازمندی ها، هدیه، ...
کودکان و نوجوانان
آموزش، سازمان ها و انجمن ها، تفریح و سرگرمی، ...
بهداشت و پزشکی
سازمان ها و انجمن ها، دارو، وبلاگ های پزشکی، ...
دانش
فنی و مهندسی، انتشارات، زیست شناسی، ...
منابع و مراجع
آموزش، کتابخانه ها، موزه ها، ...
تفریح و سرگرمی 
سایت های تفریحی، سفر، وبلاگ های تفریحی، ...
صنایع و بازرگانی
خودرو، کالا و خدمات صنعتی، محصولات غذایی، ...
هنر و ادبیات
موسیقی، ادبیات، سینما، ...
جامعه 
حکومت و دولت، مردم، دین، ...
کامپیوتر - رایانه
اینترنت، شرکت های کامپیوتری، وب لاگ های کامپیوتری، ...
ورزش
فوتبال، وبلاگ های ورزشی، سازمان ها و نهادهای ورزشی، ...
خانه و خانواده
لوازم خانگی، خرید خانه، اخبار، ...

 

کلیه حقوق این وب سایت متعلق به موتور جستجوی ریسمون می باشد.