إسأل ما تشاء عن الذكاء الصنعي أو علم البيانات


من أين تحصل على البيانات الضخمة لتدريب نماذجك ( ان صح التعبير ) ؟

لطالما روادتني في فكرة اظنها من الخيال العلمي , هل يمكن مثلا وصل الذكاء الصناعي مع الانترنات مثلا تجعله يعالج محتوى موقع حسوب هذا و يتعلم طرق الرد ؟

ليست فكرة من الخيال العلمي بل هي فكرة ممكنة ، وموجودة من عقود حتى ! إطلعي على منشوري هذا :

لم تجب عن سؤال مهم

من أين تحصل على البيانات الضخمة لتدريب نماذجك ( ان صح التعبير ) ؟

قد يفيدك هذا المقال:

أولا بيانات التدريب لا يُشترط أن تكون "بيانات ضخمة" فهذا المفهوم يشير إلى قطاعٍ آخر هو الـ "big data" ويُعنى بمعالجة البيانات الكبيرة لا أكثر ولا أقل ، إذن هذا المسمى وظيفي وليس مجرد وصف لنوع معين من البيانات .

بيانات التدريب يطلق عليها مبدئياً الـ Data Sets ، ويمكنك الحصول عليها من :

  • بنوك البيانات : هي مجموعة من الجهات والمواقع التي توفر كمية ضخمة من بيانات التدريب للعموم .

-محتوى المواقع : المحتوى الذي يشاركه الناس على مواقع الأنترنت يعتبر بالأساس كنزاً من البيانات ، على سبيل المثال يمكنك استعمال تغريدات تويتر في هاشتاق معين كـ dataset لتدريب نماذج sentiments analysis أو chatbots ، كما يمكن استخدام مواقع المعلومات والموسوعات لجرف البيانات واستخدامها .

  • الجهات المختصة : على سبيل المثال بعض المنظمات الخاصة بالصحة تقوم بجمع البيانات عن المرضى ، وهناك منظمات خاصة بحماية البيئة والجهات الحكومية المكلفة بالاحصاء وغيرها ..

  • بياناتك الخاصة : يمكنك جمع البيانات بنفسك من الوسط الذي تعيش فيه أو عمل استفتاءات على شبكات التواصل ، وأخيراً فالبيانات موجودة في كل مكان !


اسألني

مجتمع للتفاعل المباشر مع الخبراء. كخبير، نظم جلسات "اسألني ما تشاء" (AMA) لعرض خبراتك، وشارك معرفتك، وأجب على أسئلة الأعضاء. تفاعل مع جمهور يبحث عن نصائح وحلول متخصصة.

68 ألف متابع