إسأل ما تشاء عن الذكاء الصنعي أو علم البيانات


من أين تحصل على البيانات الضخمة لتدريب نماذجك ( ان صح التعبير ) ؟

لطالما روادتني في فكرة اظنها من الخيال العلمي , هل يمكن مثلا وصل الذكاء الصناعي مع الانترنات مثلا تجعله يعالج محتوى موقع حسوب هذا و يتعلم طرق الرد ؟

ليست فكرة من الخيال العلمي بل هي فكرة ممكنة ، وموجودة من عقود حتى ! إطلعي على منشوري هذا :

لم تجب عن سؤال مهم

من أين تحصل على البيانات الضخمة لتدريب نماذجك ( ان صح التعبير ) ؟

قد يفيدك هذا المقال:

أولا بيانات التدريب لا يُشترط أن تكون "بيانات ضخمة" فهذا المفهوم يشير إلى قطاعٍ آخر هو الـ "big data" ويُعنى بمعالجة البيانات الكبيرة لا أكثر ولا أقل ، إذن هذا المسمى وظيفي وليس مجرد وصف لنوع معين من البيانات .

بيانات التدريب يطلق عليها مبدئياً الـ Data Sets ، ويمكنك الحصول عليها من :

  • بنوك البيانات : هي مجموعة من الجهات والمواقع التي توفر كمية ضخمة من بيانات التدريب للعموم .

-محتوى المواقع : المحتوى الذي يشاركه الناس على مواقع الأنترنت يعتبر بالأساس كنزاً من البيانات ، على سبيل المثال يمكنك استعمال تغريدات تويتر في هاشتاق معين كـ dataset لتدريب نماذج sentiments analysis أو chatbots ، كما يمكن استخدام مواقع المعلومات والموسوعات لجرف البيانات واستخدامها .

  • الجهات المختصة : على سبيل المثال بعض المنظمات الخاصة بالصحة تقوم بجمع البيانات عن المرضى ، وهناك منظمات خاصة بحماية البيئة والجهات الحكومية المكلفة بالاحصاء وغيرها ..

  • بياناتك الخاصة : يمكنك جمع البيانات بنفسك من الوسط الذي تعيش فيه أو عمل استفتاءات على شبكات التواصل ، وأخيراً فالبيانات موجودة في كل مكان !


اسألني

اسألني ما تشاء. بإمكانكم فتح مواضيع خاصة بكم والطلب من الآخرين طرح الأسئلة عليكم للإستفادة من خبراتكم. لا تطرح أسئلة هنا.

67.6 ألف متابع