أنا مهتم بمعرفة إذا مرت عليكم مثل هذه الخورازمية التي تسعى إلى التمييز بين عناوين الأخبار بحيث تعثر على العناوين المتشابهة والتي تتحدث عن نفس الخبر، مثل هذه الخورازمية قد تساعد كثير في تحسين قراءة الخلاصات.

أحد الأمور التي فكرت فيها هو قياس عدد الكلمات المتكررة في كل خبر لقياس الإرتباط لكن كلمة واحدة قد تغير كل المعنى، مثال:

  • مايكروسوفت قامت بإطلاق ويندوز 8

  • مايكروسوفت قامت بإطلاق أوفيس 2013

هل من مصادر وأفكار؟