2025秋江苏开放大学强化学习★★综合大作业（占比40％）

国家开放大学历年真题库｜作业答案｜复习资料一站式下载平台

当前位置

开大题库网 > 上海开放大学 > 2025秋江苏开放大学强化学习★★综合大作业（占比40％）

2025秋江苏开放大学强化学习★★综合大作业（占比40％）

分类：上海开放大学时间：2025-09-10 15:28:30 浏览：47次评论：0

摘要：强化学习 - ★★综合大作业（占比40％）课程名称：强化学习发布教师：卢艳君作业来源：课程总结作业满分：100.0分发布时间：2025-07-06 作业要求：本次大作业占比40%，请根据本课程的学习内容认真答题。题型包括单选，多选，简答，以及实践编程。本次大作业着重考核大家对利用强化学习解决问题的方法掌握程度，从理论到实践进行全面考核。

关键字：应试策略结合习题库高效备考训练指南职业培训在线课程高效选择技巧解析远程教育时间管理应试策略优化方案设计个性化学习方案与时间管理技巧结合方法指南习题库同步教材解析高效备考技巧指南在线教育答疑系统提升学习效率方案解析开放课程记忆技巧学习效果提升方法设计职业课程时间管理学习计划制定技巧解析远程教育个性化时间管理方案设计解析技巧教材同步习题库

国家开放大学作业考试答案

想要快速找到正确答案？

立即关注国开搜题微信公众号，轻松解决学习难题！

国家开放大学

作业辅导
扫码关注
论文指导
轻松解决学习难题!

强化学习 - ★★综合大作成人学历业（占比40％）

课程名称：强化学习发布教师：卢艳君作业来源：课程总结作业满分：100.0分发布时间：2025-07-06 作业要求：本次大作业占比40%，请根据本课程的学习内容认真答题。题型包括单选，多选，简答，以及实践编程。本次大作业着重考核大家对利用强化学习解决问题的方法掌握程度，从理论到实践进行全面考核。

单选题

1. Q(s,a)是指在给定状态s的情况下，采取行动a之后，后续的各个状态所能得到的回报(）（分值：5.0分）

A. 总和

B. 最大值

C. 最小值

D. 期望值

2. Q-learning算法中，Q函数是（）。（分值：5.0分）

A. 状态-动作值函数

国家开放大学 B. 状态函数

C. 估值函数

D. 奖励函数

3. 在强化学习的过程中，(）能够在稍微偏离目前最好策略的基础上，尝试更多策略，(）能够运用目前最好的策略，获取更高的奖励。（分值：5.0分）

A. 利用，探索

B. 探索，利用

C. 利用，输出

D. 探索，输出

4. 在强化学习过程中，学习率越大，表示采用新的尝试得到的结果比例越()，保持旧的结果的比例越() （分值：5.0分）

渝粤文库 A. 大，小

B. 大，大

C. 小，大

D. 小，小

5. 在epsilon-greedy算法中，epsilon的值越大，采取随机动作的概率越()，采广东开放大学用当前Q函数最大动作的概率越(）。（分值：5.0分）

A. 小，小

B. 大，小

C. 大，大

D. 小，大

多选题

1. 强化学习包含的元素有（）。（分值：5.0分）

A. Reward

B. Agent

C. State

D. Action

简答题/计算题

渝粤教育

1. Actor-Critic框架中的Cri 渝粤题库 tic起了什么作用？（分值：10.0分）

2. 请问DQN（Deep Q-Network）是什么？其两个关键性的技巧分别是什么？（每个问题5分）（分值：10.0分）

3. 请利用DDPG算法实现钟摆游戏Pendulum-v1，需要在答案区附上训练和测试曲线，包括训练时的奖励曲线图（20分）和测试时的奖励曲线区图（20分），并进行结果分析（10分）。（分值：50.0分）

推荐阅读

文章目录

文章作者：开大题库网
文章标题：2025秋江苏开放大学强化学习★★综合大作业（占比40％）
文章链接：https://yuyue-exam.com/shou/66454.html
本站所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议，转载请注明来自开大题库网！

📚 推荐阅读

相关文章

评论留言请发表您的神机妙论……

评论列表（共有0条评论）

站点资料

开大题库网

开大题库网是国家开放大学学习者的专属资源平台，整合全国电大系统（含广州、宁波等地方开放大学）的历年考试真题、形考作业参考答案及复习指南。网站支持按课程名称、试卷代码（如1379人文英语3、1255计算机网络等）精准检索，提供试卷下载、答案解析及题库推荐功能。涵盖行政管理、金融学、计算机等热门专业，定期更新最新考试动态与备考攻略，帮助学生高效规划复习计划，一站式解决作业与考试难题。

联系站长关注公众号

文章105713
评论0
微语0

搜索

热门文章

最新文章

链接

标签

我的足迹清空

sitemap