با توجه به حجم انبوه اطلاعات، دسترسی به داده ها و اطلاعات مطلوب، گاهاً بسیار پیچیده و دشوار می شود. در این میان، خلاصه سازهای متن، سامانه های هستند که می توانید از آن برای سهولت دسترسی به اطلاعات موردنظر استفاده کنید. از هر خبر منتشر شده، بخشهای مهم آن خبر را پیدا کنید و دسته بندی کنید و یا نتایج موجود در تحقیق و یا مقاله ای را جمع بندی کنید. در نهایت شما قادر خواهید بود متنی را به عنوان ورودی به خلاصه سازها، ارائه دهید و آن را خلاصه کنید.
خلاصه سازی خودکار متن، یعنی روشی که یک متن طولانی توسط یک برنامه رایانه ای با حذف عبارات، کلمات و جملات اضافه کوتاه شود.به عبارت دیگر، “خلاصه سازی” متن به فرایندی اطلاق می شود که طی آن یک متن بزرگ (ضمن رعایت شرایط خاصی) به متن کوچکتر تبدیل می شود. تاکنون رویکردهای مختلفی برای خلاصه سازی خودکار متون ارائه شده است.
اهمیت این گونه برنامهها در حال حاضر با افزایش کاربرد برنامههای گوشیهای تلفن هوشمند و پیامک افزایش یافته است. اگر چه نیاز به این گونه سیستمها در کشورهای خارجی بسیار رایج است (لیست ۳۰ تایی از سیستمهای خارجی را میتوانید ببینید)، اما در ایران کمتر به آن پرداخته شده است. در این نوشته می خواهیم کمیدر مورد نمونههایی که در زبان فارسی خوب کار میکنند، بررسیهایی داشته باشیم.
متن یا فایل خود را در سایت وارد کنید و تعداد کلمات را انتخاب کنید. سایت به شما یک متن خلاصه می دهد. البته گاهی جملات ناقص است.
بر اساس جمله است و کلمهها یا حروف را نمیشمارد. ابتدا باید متن را وارد کنید و سایت تصمیم میگیرد که کدام جملهها را حذف کند. البته حدس بنده این است که جملاتی که کلمات مهم تر دارند را نگه میدارد.
از جمله ویژگی های متنک می توان به تشخیص وشناسایی متون،پردازش متن،حذف متن تکراری، و API برای استفاده در سایر سیستم ها اشاره کرد.
که گویا ابتدا برای زبان سوئدی نوشته شده، ولی برای زبانهای دیگر از جمله فارسی گسترش یافته است. مزیت این سیستم این است که میتوانید نوع متن را انتخاب کنید که سبک روزنامه ای است، یا آکادمیک.
امیدوارم این ابزارها برایتان مفید واقع شوند…
منابع:
بدون دیدگاه