PyTorch 2026-05-19
模型训练步骤:
模型训练步骤: 准备数据集->设计模型->训练->测试
数据集分为训练集(输入与输出)+测试集(一般只有输入),由于测试集用于最终测试,而我们需要在开发中途简单评估一下模型质量,因此再把训练集分成训练集和验证集,他们都有输入和输出,前者用于训练,后者用于简单评估
数据集会出现数据分布偏移(Distribution Shift)现象,简单说就是:模型在”学校题”上考满分,但到”社会题”上就蒙圈。可以通过数据增强,迁移学习+微调,领域自适应,持续学习,分布检测与监控等方法解决
1个样本可以得出1个误差;多个样本可以得出均方差:MSE

训练过拟合,说明模型泛化能力不好,表现为验证集数据在真实收敛域附近的loss增大