数学建模B题
x1~x4 分别为性别、年龄、身高、体重,假设模型:
\[ y=w_{0}+w_{1}x_{1}+w_{2}x_{2}+w_{3}x_{3}+w_{4}x_{4} \]
使用多元线性回归
1.数据处理
空白值删除2001条。
异常值删除2条。
使用数据4517条。
数据预览:
1 | dataSet |
2.公式
变量:潮气量、用力肺活量、中心气道参数 ... 外周气道参数C、外周气道参数D分别为x1、x2、x3、x4、x5...x9: \[ X=\begin{pmatrix} x_{11} & x_{12} & x_{13} & x_{14}\\ x_{21} & x_{22} & x_{23} & x_{24}\\ \vdots & \vdots & \vdots & \vdots \\ x_{45171} & x_{45172} & x_{45173} & x_{45174} \end{pmatrix} \] 系数向量: \[ w=\begin{pmatrix} w_{1}\\ w_{2}\\ \vdots \\ w_{9} \end{pmatrix} \] \(w0\) 初始化为0: \[ w_{0}=\begin{pmatrix} 0\\ 0\\ \vdots \\ 0 \end{pmatrix} \] 公式: \[ f=Xw+w_{0} \]
4.误差函数
概率: \[ P(x_{1},x_{2},x_{3},x_{4})=\sigma (f)=\frac{1}{1+e^{-f}} \] 所有病例预测正确预测的概率为: \[ P=P_{1}\times P_{2}\times \cdots P_{N} \]
最大似然估计优化: \[ E=-logP \] 求上式的最小值,即Loss最小值,最终计算出w0,w1,w2,w3...w9的最优解,得到: \[ y= 2.960129 + 1.099700x_{1} + 11.472289x_{2} + -12.098226x_{3} + -13.661840x_{4}+ -14.122027x_{5}+ -14.122027x_{6}+ -12.703490x_{7}+ -0.870683x_{8}+ 0.370302x_{9} \]