# 2.6 练习

选择第 2.1 节中的硬编码时间估计问题是因为数据大致是线性的。其他数据集在拟合时将具有不同的损失曲面和动力学。希望在此处尝试替换您自己的数据，以探索模型的反应。您可能需要研究学习率，初始化或规范化，以使模型得到一些有趣的东西。
在第 2.3.5 节中，我们花了一些时间描述归一化的重要性，以及如何归一化输入数据的均值和单位方差。您应该能够修改示例以删除规范化并看到模型不再训练。您还应该能够将规范化例程修改为具有例如 0 以外的平均值或较低但不那么低的标准偏差。一些规范化会对模型起作用，而某些标准化将导致模型永不收敛。
众所周知，波士顿房屋价格数据集的某些特征比其他特征更能预测目标。如果要删除除一个功能以外的所有功能，我们应该保留哪个功能？如果我们要保留两个功能，该如何选择呢？尝试使用波士顿住房示例中的代码进行探索。
描述梯度下降如何通过比随机方式更好的方式更新系数来优化模型。
波士顿住房的示例打印出前 5 个影响最大的特征系数。尝试修改代码以打印出最小系数相关的特征。您能想象为什么这些重量很小？如果有人要问你这些系数为什么会是这些，你能告诉他们什么？