r语言多因素方差分析不出现p值,r语言单因素方差分析

对于一些有关r语言多因素方差分析不出现p值和r语言单因素方差分析的相关题,你对r语言多因素方差分析不出现p值这样的题了解多少呢?就让小编带各位来了解一下吧!


管理混乱这个结果主要是由什么因素造成的?

在管理工作过程中,管理者常常被以下题所困惑

不同品牌的手机在同一城市的不同区销售。由于手机品牌因素和销售区域因素的影响,手机的销量存在差异。营销经理想知道,哪个因素对手机品牌和销售地区的手机销量差异影响更大?

另一个例子,使用不同的机器来制造相同的零件,并且在该过程中每台机器使用不同的冷却剂。经过测试,发现零件直径存在差异。负责生产和技术的管理人员需要分析判断加工零件的直径差异是加工设备造成的还是冷却液使用不同造成的?不同类型的冷却液对加工零件的直径有显着差异吗?

再比如,R附带的数据集中于维生素C对豚鼠牙齿生长的影响。豚鼠的牙齿生长主要是给药方法不同还是剂量不同引起的?

要科学、可靠地回此类题,就必须采用“双向方差分析”。这正是本文要解释的内容。

在上一篇文章中,我解释了“单因素方差分析”。如果你对方差分析还没有初步的了解,请先阅读我公众号之前的文章学习。”

34;

什么是双向方差分析?

双因素方差分析是一种统计分析方法,可以用来分析两个因素的不同水平是否对研究对象的测量结果产生显着影响,以及两个因素之间是否存在交互作用。

因素影响研究对象的指标、变量、响应、测量等。

水平因子变化的各种状态或因子变化的等级、组或类别。

实验设计平衡实验和不平衡实验

通常,在使用双因素方差分析之前,需要对不同水平的两个因素的组合进行实验设计。要求各因素水平组合下得到的样品含量相同,为平衡实验。如果样本量不相同,那么这是一个不平衡的实验。

对于不同水平的两个因素的每种组合,如果仅进行一次实验测量,则用此类数据执行的二因素方差分析是二因素非重复测量方差分析。

如果要测试两个因素的相互作用,则必须对两个因素的每个水平组合至少进行两次实验测量。如下图所示,行为A因素有两个水平,列为B因素,有两个水平。对两个因素的每个水平组合进行两次实验

如果已知因素之间不存在交互作用,或者预先通过定性分析知道因素之间虽然存在交互作用但影响较小,对实验测量结果的影响较小,则可以不考虑交互作用。

模型与计算

双向方差分析是线性模型的特例。该模型的形式为

Yijr是响应变量的观测值;

i表示第i组行因子A,i=1,2,I;j表示第j组列因子B,j=1,2,J;R代表重复测量的次数,R=1,2,…,R。

据此,总共有N=IJR观测值。

是总体平均值。i是由行因子A定义的组与总体平均值的偏差。i的值之和为0。

j是由列因子B定义的组与总体平均值的偏差。j的值之和为0。

ij是相互作用。ij各行各列的值之和为0。

ijr是随机扰动。假设它们是独立的、正态分布的并且具有恒定方差。

关于行因子A组的均值相等的假设是

列因子B组的均值相等的假设为

关于列因子和行因子相互作用的假设是

ANOVA将总平方和SST分解为行因子A平方和SSA、列因子B平方和SSB、A、B交互平方和SSAB、误差平方和SSE。它们之间的数量关系为

方差分析将因因素或相互作用引起的变异与因误差引起的变异进行比较。

如果分子中两个变量的比率较高,则该因素的影响或交互效应在统计上显着。您可以使用F分布统计量来衡量统计显着性。

对于行因子A的组均值相等的原假设,检验统计量为

对于列因子B的各组均值相等的原假设,检验统计量为

对于列因子和行因子之间的交互作用为零的原假设,检验统计量为

如果F统计量的p值小于显着性水平,方差分析将拒绝原假设。最常见的显着性级别是001和005。

简要介绍了双因素方差分析的数学模型。更详细的解释可以参考网上或者概率论和数理统计方面的书籍。可供参考的方差分析表如下

案例使用Python进行双向方差分析

使用五台不同的机器来制造同一零件,并且在此过程中每台机器使用不同的冷却剂。现在我们想知道,造成加工零件直径差异的主要原因是什么?不同类型的冷却液加工零件的直径是否有差异?

案例分析数据读取

导入pandas作为pd导入statsmodelsapi作为smfromstatsmodelsformulaapi导入olsfromstatsmodelsstatsanova导入anova_lmfromstatsmodelsgraphicsfactorplots导入interaction_plot导入matplotlibpyplot作为pltfromscipy导入statsimportseaborn作为snsfromstatsmodelsstatsmulticomp导入pairwise_tukeyhsddatafile=34;df=pdread_exceldatafiledfinfodftail5

ax=snspointplotx=39;y=39;色调=39;数据=df

snsboxplotx=39;y=39;数据=df,色调=39;

interaction_plotx=dfmachine、trace=dfcoolant、响应=dfdiameter、标记=[39;39;]、颜色=[39;39;]、func=npmean、ms=8

从以上数据图可以初步判断,不同加工设备在不同冷却液下的零件平均直径是不同的。为了进一步寻找显着差异,需要进行方差分析。

首先,没有考虑因素之间的相互作用。

公式=39;模型=olsformula,dffitanova_table=anova_lmmodel

在不考虑交互作用的情况下,从方差分析表可以看出

“冷却剂”对所生产零件的直径没有显着影响。

“机器”对所生产零件的直径有显着影响。

其次,考虑因素之间的相互作用。

公式=39;模型=olsformula,dffitanova_table=anova_lmmodelanova_table

在考虑交互作用的情况下,从方差分析表可以看出

“冷却剂”对所生产零件的直径没有显着影响。

“机器”对所生产零件的直径有显着影响。

“冷却剂和机器的相互作用”对所生产零件的直径没有显着影响。

综上所述,影响零件直径的因素是机械设备的因素。可以理解,与所使用的冷却液关系不大,对零件直径加工的影响可以忽略不计。

最后检验残差是否正常。显然残差是正常的。

res=modelresidFig=smqqplotres,fit=True,line=34;dist=statsdistributionsnormpltshow

多重比较寻找显着差异。

既然机器设备因素对零件直径有显着影响,那么哪些加工机器设备对加工零件的直径有显着差异呢?

从statsmodelsstatsmulticomp导入pairwise_tukeyhsdmc=pairwise_tukeyhsddf[39;],df[39;]printmcmcplot_simultaneous


今天关于r语言多因素方差分析不出现p值和r语言单因素方差分析的相关话题就分享到这儿了,如果本文对各位有所帮助,记得收藏并关注本站。

除非特别注明,本站所有文字均为原创文章,作者:admin

No Comment

留言

电子邮件地址不会被公开。 必填项已用*标注

感谢你的留言。。。