Ahmed Hussein

1 نقاط السمعة
433 مشاهدات المحتوى
عضو منذ
1

ما هي ال target network في DQN ؟

السلام عليكم .. كما مكتوب في العنوان فأنا ادرس حاليا مجال الذكاء الاصطناعي ولكني توقفت عند target network قرأت اكثر من مقال يتكلم عن هذا الموضوع مثل https://medium.com/@awjuliani/simple-reinforcement-learning-with-tensorflow-part-4-deep-q-networks-and-beyond-8438a3e2b8df ولكني لما استطع ان افهم بالزبط هذا الجزء في المقال "This second network is used to generate the target-Q values that will be used to compute the loss for every action during training. " اذا كان الtarget يتم الحصول عليه من Q فكيف يكون ثابت ؟؟ فعمليه الTraining بتحدث اكثر من مره