التعلم المعزز Reinforcement Learning

أحد فروع تعلم الآلة، حيث تتعلم الخوارزمية تحقيق هدف واضح بالمحاولة والخطأ، وتتخذ القرارات وتجرِّب قراراتها وتحصل على مكافأة أو عقوبة (بناء أرقام ضمن خوارزميات برمجية) بناء على نتائج تجاربها وأفعالها من حيث تحقيق الهدف.