2.6 练习
- 选择第 2.1 节中的硬编码时间估计问题是因为数据大致是线性的。其他数据集在拟合时将具有不同的损失曲面和动力学。希望在此处尝试替换您自己的数据,以探索模型的反应。您可能需要研究学习率,初始化或规范化,以使模型得到一些有趣的东西。
- 在第 2.3.5 节中,我们花了一些时间描述归一化的重要性,以及如何归一化输入数据的均值和单位方差。您应该能够修改示例以删除规范化并看到模型不再训练。您还应该能够将规范化例程修改为具有例如 0 以外的平均值或较低但不那么低的标准偏差。一些规范化会对模型起作用,而某些标准化将导致模型永不收敛。
- 众所周知,波士顿房屋价格数据集的某些特征比其他特征更能预测目标。如果要删除除一个功能以外的所有功能,我们应该保留哪个功能?如果我们要保留两个功能,该如何选择呢?尝试使用波士顿住房示例中的代码进行探索。
- 描述梯度下降如何通过比随机方式更好的方式更新系数来优化模型。
- 波士顿住房的示例打印出前 5 个影响最大的特征系数。尝试修改代码以打印出最小系数相关的特征。您能想象为什么这些重量很小?如果有人要问你这些系数为什么会是这些,你能告诉他们什么?