إسأل ما تشاء عن الذكاء الصنعي أو علم البيانات


التعليق السابق

لم تجب عن سؤال مهم

من أين تحصل على البيانات الضخمة لتدريب نماذجك ( ان صح التعبير ) ؟

قد يفيدك هذا المقال:

أولا بيانات التدريب لا يُشترط أن تكون "بيانات ضخمة" فهذا المفهوم يشير إلى قطاعٍ آخر هو الـ "big data" ويُعنى بمعالجة البيانات الكبيرة لا أكثر ولا أقل ، إذن هذا المسمى وظيفي وليس مجرد وصف لنوع معين من البيانات .

بيانات التدريب يطلق عليها مبدئياً الـ Data Sets ، ويمكنك الحصول عليها من :

  • بنوك البيانات : هي مجموعة من الجهات والمواقع التي توفر كمية ضخمة من بيانات التدريب للعموم .

-محتوى المواقع : المحتوى الذي يشاركه الناس على مواقع الأنترنت يعتبر بالأساس كنزاً من البيانات ، على سبيل المثال يمكنك استعمال تغريدات تويتر في هاشتاق معين كـ dataset لتدريب نماذج sentiments analysis أو chatbots ، كما يمكن استخدام مواقع المعلومات والموسوعات لجرف البيانات واستخدامها .

  • الجهات المختصة : على سبيل المثال بعض المنظمات الخاصة بالصحة تقوم بجمع البيانات عن المرضى ، وهناك منظمات خاصة بحماية البيئة والجهات الحكومية المكلفة بالاحصاء وغيرها ..

  • بياناتك الخاصة : يمكنك جمع البيانات بنفسك من الوسط الذي تعيش فيه أو عمل استفتاءات على شبكات التواصل ، وأخيراً فالبيانات موجودة في كل مكان !


اسألني

اسألني ما تشاء. بإمكانكم فتح مواضيع خاصة بكم والطلب من الآخرين طرح الأسئلة عليكم للإستفادة من خبراتكم. لا تطرح أسئلة هنا.

67.7 ألف متابع