لم تجب عن سؤال مهم
من أين تحصل على البيانات الضخمة لتدريب نماذجك ( ان صح التعبير ) ؟
-محتوى المواقع : المحتوى الذي يشاركه الناس على مواقع الأنترنت يعتبر بالأساس كنزاً من البيانات ، على سبيل المثال يمكنك استعمال تغريدات تويتر في هاشتاق معين كـ dataset لتدريب نماذج sentiments analysis أو chatbots ، كما يمكن استخدام مواقع المعلومات والموسوعات لجرف البيانات واستخدامها .
الجهات المختصة : على سبيل المثال بعض المنظمات الخاصة بالصحة تقوم بجمع البيانات عن المرضى ، وهناك منظمات خاصة بحماية البيئة والجهات الحكومية المكلفة بالاحصاء وغيرها ..
بياناتك الخاصة : يمكنك جمع البيانات بنفسك من الوسط الذي تعيش فيه أو عمل استفتاءات على شبكات التواصل ، وأخيراً فالبيانات موجودة في كل مكان !
التعليقات