人工智能 - 未来日记

探索OpenAI Gym的CartPole-v0环境

技术文章 探索OpenAI Gym的CartPole-v0环境

OpenAI Gym中的CartPole-v0是一种强化学习环境，旨在通过左右移动小车来平衡立杆。状态空间由小车的位置和速度以及杆的角度和速度组成。智能体可以选择向左或向右移动小车以获得奖励，其目标是延长杆保持竖直的时间。环境在杆倾角过大、小车移出指定范围或达到时间步限制时终止。CartPole-v0对于初学者和专家都是理想的测试和研究平台。

深入解析PPO算法：原理、优劣特点及应用场

技术文章 深入解析PPO算法：原理、优劣特点及应用场

Proximal Policy Optimization（PPO）算法自2017年提出以来，在强化学习领域显示出卓越性能。该算法通过限制策略更新步长，提高了稳定性和计算效率，适用于机器人控制、游戏AI等多种场景。尽管PPO对超参数敏感、样本效率相对较低，但依旧被广泛应用。

如何用Python和NetworkX绘制学生和教师关系图

技术文章 如何用Python和NetworkX绘制学生和教师关系图

在这篇文章中，我将介绍如何用Python和NetworkX库来绘制一个学生和教师之间的关系图，以及如何查询两个节点之间的关系路径。这个关系图可以很好的帮助我们了解学生和教师之间的联系，以及他们所参与的课程和活动。

技术文章 手写数字识别

MNIST是一个大型数据库，其中包含手写数字。它通常被用作图像处理机器学习的基准测试。该数据库包含60,000个训练图像和10,000个测试图像。每个图像都是28×28的灰度图像，表示0到9之间的数字。

技术文章 人工智能领域常见名词解释

常见名词 Tokenization 人工智能领域的 Tokenization 是指将输入的文本分割成一个个最小…