- 93.00 KB
- 60页
- 1、本文档共5页,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 文档侵权举报电话:19940600175。
李春喜《生物统计学》第三版课后作业答案导读:就爱阅读网友为您分享以下“李春喜《生物统计学》第三版课后作业答案”的资讯,希望对您有所帮助,感谢您对92to.com的支持!习题8.7解:分析见下表:TestsofBetween-SubjectsEffectsDependentVariable:历期SourceCorrectedModelInterceptGROUPMOISTURETEMPERATErrorTotalCorrectedTotalTypeIIISumofSquares3799.883a324903.97530.886436.6183332.379188.852328892.7103988.735df81323394847MeanSquare474.985324903.97510.295218.3091110.7934.842F98.09067096.112.12645.083229.391Sig..000.000.113.000.000PartialEtaSquared.953.999.141.698.946a.RSquared=.953(AdjustedRSquared=.943)1.GrandMeanDependent60
Variable:历期Mean82.273Std.Error.31895%ConfidenceIntervalLowerBoundUpperBound81.63082.915EstimatesDependentVariable:历期窝组Ⅰ窝Ⅱ窝Ⅲ窝Ⅳ窝Mean83.33382.69281.83381.233Std.Error.635.635.635.63595%ConfidenceIntervalLowerBoundUpperBound82.04884.61881.40783.97780.54883.11879.94882.518UnivariateTestsDependentVariable:历期SumofSquares30.886188.852df339MeanSquare10.2954.842F2.126Sig..113PartialEtaSquared.141ContrastErrorTheFteststheeffectof窝组.Thistestisbasedonthelinearlyindependentpairwisecomparisonsamongtheestimatedmarginalmeans.35/43EstimatesDependentVariable:历期相对湿度100p@%Mean80.20680.07586.538Std.Error.550.550.55095%ConfidenceIntervalLowerBoundUpperBound79.09381.31978.96281.18885.42587.650PairwiseComparisonsDependentVariable:历期MeanDifference(I-J)Std.60
Error.131.778-6.331*.778-.131.778-6.463*.7786.331*.7786.463*.77895%ConfidenceIntervalforaDifferenceLowerBoundUpperBound-1.8152.078-8.278-4.385-2.0781.815-8.409-4.5164.3858.2784.5168.409(I)相对湿度100p@%(J)相对湿度70@0@0p%Sig.1.000.0001.000.000.000.000aBasedonestimatedmarginalmeans*.Themeandifferenceissignificantatthe.05level.a.Adjustmentformultiplecomparisons:Bonferroni.UnivariateTestsDependentVariable:历期SumofSquares436.618188.852df239MeanSquare218.3094.842F45.083Sig..000PartialEtaSquared.698ContrastErrorTheFteststheeffectof相对湿度.Thistestisbasedonthelinearlyindependentpairwisecomparisonsamongtheestimatedmarginalmeans.EstimatesDependentVariable:历期温度26℃28℃30℃32℃Mean92.25887.65078.53370.650Std.Error.635.635.635.63595%ConfidenceIntervalLowerBoundUpperBound90.97393.54386.36588.93577.24879.81869.36571.93536/43PairwiseComparisonsDependentVariable:历期MeanDifference(I-J)Std.60
Error4.608*.89813.725*.89821.608*.898-4.608*.8989.117*.89817.000*.898-13.725*.898-9.117*.8987.883*.898-21.608*.898-17.000*.898-7.883*.89895%ConfidenceIntervalforaDifferenceLowerBoundUpperBound2.1117.10511.22816.22219.11124.105-7.105-2.1116.62011.61414.50319.497-16.222-11.228-11.614-6.6205.38610.380-24.105-19.111-19.497-14.503-10.380-5.386(I)温度26℃28℃30℃32℃(J)温度28℃30℃32℃26℃30℃32℃26℃28℃32℃26℃28℃30℃Sig..000.000.000.000.000.000.000.000.000.000.000.000aBasedonestimatedmarginalmeans*.Themeandifferenceissignificantatthe.05level.a.Adjustmentformultiplecomparisons:Bonferroni.UnivariateTestsDependentVariable:历期SumofSquares3332.379188.852df339MeanSquare1110.7934.842F229.391Sig..000PartialEtaSquared.946ContrastErrorTheFteststheeffectof温度.Thistestisbasedonthelinearlyindependentpairwisecomparisonsamongtheestimatedmarginalmeans.MultipleComparisonsDependentVariable:历期LSDMeanDifference(I-J)Std.Error.1312.77801-6.3313*.77801-.1312.77801-6.4625*.778016.3313*.778016.4625*.77801(I)相对湿度100p@%(J)60
相对湿度70@0@0p%Sig..867.000.867.000.000.00095%ConfidenceIntervalLowerBoundUpperBound-1.44241.7049-7.9049-4.7576-1.70491.4424-8.0362-4.88884.75767.90494.88888.0362Basedonobservedmeans.*.Themeandifferenceissignificantatthe.05level.37/43MultipleComparisonsDependentVariable:历期LSDMeanDifference(I-J)Std.Error4.6083*.8983713.7250*.8983721.6083*.89837-4.6083*.898379.1167*.8983717.0000*.89837-13.7250*.89837-9.1167*.898377.8833*.89837-21.6083*.89837-17.0000*.89837-7.8833*.89837(I)温度26℃28℃30℃32℃(J)温度28℃30℃32℃26℃30℃32℃26℃28℃32℃26℃28℃30℃Sig..000.000.000.000.000.000.000.000.000.000.000.00095%ConfidenceIntervalLowerBoundUpperBound2.79126.425411.907915.542119.791223.4254-6.4254-2.79127.299610.933815.182918.8171-15.5421-11.9079-10.9338-7.29966.06629.7004-23.4254-19.7912-18.8171-15.1829-9.7004-6.0662Basedonobservedmeans.*.Themeandifferenceissignificantatthe.05level.60
38/43第十章直线回归与相关分析(P204)习题10.1什么叫回归分析?回归截距和回归系数的统计意义是什么?答:(1)回归分析(regressionanalysis)是用来研究呈因果关系的相关变量间的关系的统计分析方法,其中表示原因的变量为自变量,表示结果的变量为因变量。(2)回归截距是当自变量为零时,因变量的取值,即回归线在y轴上的截距;回归系数是回归直线的斜率,其含义是自变量改变一个单位,因变量y平均增加或减少的单位数。习题10.2直线回归中总变异可以分解为哪几部分?每一部分的平方和如何计算?答:直线回归中,依变量y是随机变量,y的总变异(y???y)可以分解为两部分,即由x?y?变异引起的变异((1)。SSy?y)和误差所引起的变异(y?y)?U?Q。60
,为依变量y的平方和,称为离均差平方和或者总平方和,记作SSy或SS总。它是y的离均差平方和,表示未考虑x与y的回归关系时y的变异。(2)U??(y?y)??2,为因x变异引起的y变异的平方和,称为回归平方和(regressionsumofsquares),记作U或SS回归。它反映在y的总变异中由于x与y的直线关系而使y变异减小的部分,也就是在总平方和中可以用x解释的部分,即由x的变异引起y变异的平方和。U越大,说明回归效果越好。(3)Q??(y?y)为误差因素引起的平方和,称为离回归平方和或残差平方和(剩?2余平方和)(residualsumofsquares),记作Q、SS离回归或者SS剩余。它放映了除去x与y的直线回归关系外的其余因素引起变化的大小,即反映x对y的线性影响之外的一切因素对y的变异的作用,也就是在总平方和中无法用x解释的部分,即是由误差因素引起的平方和。习题10.3什么叫相关分析?相关系数和决定系数各具有什么意义?答:(1)相关分析是用来研究呈平行关系的相关变量之间的关系的统计方法。60
(2)相关系数(correlationcoefficient)表示变量x与变量y相关的程度和性质;决定系数(coefficientofdetermination)是相关系数的平方,表示变量x引起y变异的回归平方和和占y变异总平方和的比率,它只能表示相关的程度而不能表示相关的性质。39/43《生物统计学》第三版课后作业答案(李春喜、姜丽娜、邵云、王文林编著)第一章概论(P7)习题1.1什么是生物统计学?生物统计学的主要内容和作用是什么?答:(1)生物统计学(biostatistics)是用数理统计的原理和方法来分析和解释生物界各种现象和实验调查资料,是研究生命过程中以样本来推断总体的一门学科。(2)生物统计学主要包括实验设计和统计推断两大部分的内容。其基本作用表现在以下四个方面:①提供整理和描述数据资料的科学方法;②确定某些性状和特性的数量特征;60
③判断实验结果的可靠性;④提供由样本推断总体的方法;⑤提供实验设计的一些重要原则。习题1.2解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。答:(1)总体(populatian)是具有相同性质的个体所组成的集合,是研究对象的全体。(2)个体(individual)是组成总体的基本单元。(3)样本(sample)是从总体中抽出的若干个个体所构成的集合。(4)样本容量(samplesize)是指样本个体的数目。(5)变量(variable)是相同性质的事物间表现差异性的某种特征。(6)参数(parameter)是描述总体特征的数量。(7)统计数(statistic)是由样本计算所得的数值,是描述样本特征的数量。(8)效应(effection)试验因素相对独立的作用称为该因素的主效应,简称效应。(9)互作(interaction)是指两个或两个以上处理因素间的相互作用产生的效应。(10)实验误差(experimentalerror)是指实验中不可控因素所引起的观测值偏离真值的差异,可以分为随机误差和系统误差。60
(11)随机误差(random)也称抽样误差或偶然误差,它是有实验中许多无法控制的偶然因素所造成的实验结果与真实结果之间产生的差异,是不可避免的。随机误差可以通过增加抽样或试验次数降低随机误差,但不能完全消。(12)系统误差(systematic)也称为片面误差,是由于实验处理以外的其他条件明显不一致所产生的倾向性的或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的,只要试验工作做得精细,在试验过程中是可以避免的。(13)准确性(accuracy)也称为准确度,指在调查或实验中某一实验指标或性状的观测值与其真值接近的程度。(14)精确性(precision)也称精确度,指调查或实验中同一实验指标或性状的重复观测值彼此接近程度的大小。(15)准确性是说明测定值堆真值符合程度的大小,用统计数接近参数真值的程度来衡量。精确性是反映多次测定值的变异程度,用样本间的各个变量间变异程度的大小来衡量。0/43习题1.3误差与错误有何区别?60
答:误差是指实验中不可控制因素所引起的观测值偏离真值的差异,其中随机误差只可以设法降低,但不能避免,系统误差在某种程度上可控制、可克服的;而错误是指在实验过程中,人为的作用所引起的差错,是完全可以避免的。第二章实验资料的整理与特征数的计算(P22、P23)习题2.1什么是次数分布表?什么是次数分布图?制表和绘图的基本步骤有哪些?制表和绘图时应注意些什么?答:(1)对于一组大小不同的数据划出等距的分组区间(称为组距),然后将数据按其数值大小列入各个相应的组别内,便可以出现一个有规律的表式,这种统计表称之为次数分布表。(2)次数分布图是指把次数分布资料画成图状,包括条形图、饼图、直方图、多边形图和散点图。(3)制表和绘图的基本步骤包括:①求全距;②确定组数和组距;③确定组限和组中值;④分组,编制次数分布表。(4)制表和绘图时需要注意的是事先确定好全距、组数、组距、各组上下限,再按观测值的大小来归组。习题2.2算数平均数与加权数形式上有何不同?为什么说它们的实质是一致的?答:(1)形式不同在于计算公式的不同:算数平均数的计算公式为M=x1?x2?...?xn;60
n加权平均数的计算公式为M=x1f1?x2f2?...?xmfm。f1?f2?...?fm(2)因为它们反映的都是同一组数据的平均水平。习题2.3平均数与标准差在统计分析中有什么作用?它们各有哪些特性?答:(1)平均数(mean)的用处:①平均数指出了一组数据资料内变量的中心位置,标志着资料所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其它资料进行比较。(2)平均数的特性:①离均差之和等于零;②离均差平方和为最小。1/43(3)标准差(standarddeviation)的用处:①标准差的大小,受实验或调查资料中多个观测值的影响,如果观测值与观测值之间差异较大,其离均差也大,因而标准差也大,反之则小;②在计算标准差时,如果对各观测值加上火减去一个常数a,标准差不变;如果给各观测值乘以或除以一个常数a,则所得的标准差扩大或缩小了a倍;③在正态分布中,一个样本变量的分布可以作如下估计:60
x±s内的观测值个数约占观测值总个数的68.26%,x±2s内的观测值个数约占总个数的95.49%,x±3s内的观测值个数约占观测值总个数的99.73%。(4)标准差的特性:①表示变量的离散程度,标准差小,说明变量的分布比较密集在平均数附近,标准差大,则说明变量的分布比较离散,因此,可以用标准差的大小判断平均数代表性的强弱;②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准误,在计算平均数的标准误时,可根据样本标准差代替总体标准差进行计算;④进行平均数区间估计和变异系数的计算。习题2.4总统和样本的平均数、标准差有什么共同点?又有什么联系和区别?答:(1)总体和样本的平均数都等于资料中各个观测值的总和除以观测值的个数所得的商。二者区别在于,总体平均数用μ表示,μ=?x,公式中分母为总体观测值的个数N,Nx?x样本平均数用=,公式中的分分母为样本观测值的个数n。样本平均数x是总n体平均数μ的无偏估计值。60
(2)总体和样本的标准差都等于离均差的平方和除以样本容量。二者的区别在于,总体标准差用σ表示,,分母上总体观测值的个数N;标准差用s表示,,分母上是样本自由度n-1。样本标准差s是总体标准差σ的无偏估计值。2/43习题2.5答:见下图——100例30-40岁健康男子血清总胆固醇(mol/L)的次数分布表组限(mol/L)组中值(mol/L)次数频率累积频率2.60-3.10-3.60-4.10-4.60-5.10-5.60-6.10-6.60-7.10-习题2.6答:见下图——2.8703.3703.8504.3754.8455.3255.8256.3450.0007.220281224201878010.020.080.120.240.200.180.070.080.000.010.020.100.220.460.660.840.910.990.991.00100例男子总胆固醇2010FrequencyStd.Dev=.87Mean=4.7402.753.253.754.254.755.255.756.256.757.253.003.504.004.505.005.506.006.507.00N=100.00100例男子总胆固醇这100例男子的血清总胆固醇基本呈正态分布,中间4.1-5.1mol/L的最多,两边少,但6.6-7.1mol/L的没有。60
习题2.73/43答:见下图——Statistics100例男子总胆固醇NMeanStd.ErrorofMeanMedianModeStd.DeviationVarianceSkewnessStd.ErrorofSkewnessKurtosisStd.ErrorofKurtosisRangeMinimumMaximumSumPercentilesValidMissing10004.7389.086674.6600a4.79b.86665.75108.276.241.055.4784.522.707.22473.893.5850c4.08334.20004.31004.49004.66004.85005.16005.21005.38505.93251020253040506070758090a.Calculatedfromgroupeddata.b.Multiplemodesexist.Thesmallestvalueisshownc.Percentilesarecalculatedfromgroupeddata.Std.DeviationStatistic.86665VarianceStatistic.751DescriptiveStatisticsNStatistic100100RangeStatistic4.52MinimumStatistic2.70MaximumStatistic7.22MeanStatisticStd.Error4.7389.0867100例男子总胆固醇ValidN(listwise)由上表可知:平均数μ=4.7389,标准差s=0.86665,而CV=s/μ*100%=18%习题2.860
答:由习题2.7的表可知:中位数Median=4.6600,平均数μ=4.7389,两数相差0.0789,符合正态分布。习题2.9答:分析见下图:4/43DescriptiveStatisticsNStatistic1010RangeStatistic4.00MeanStatisticStd.Error20.0000.3944Std.DeviationStatistic1.24722VarianceStatistic1.55624号ValidN(listwise)DescriptiveStatistics金皇后ValidN(listwise)NStatistic1010RangeStatistic11.00MeanStatisticStd.Error20.00001.0750Std.DeviationStatistic3.39935VarianceStatistic11.556由上图可知:“24号”玉米的平均数Μ=20,标准差s=1.24722,而CV=s/Μ*100%=6.24%;“金皇后”玉米的平均数Μ=20,标准差s=3.39935,而CV=s/Μ*100%=17.00%,比较二者的变异系数CV,“24号”玉米的的变异系数CV比“金皇后”玉米的小得多,说明“24号”玉米的整齐度大于“金皇后”玉米。习题2.10答:分析见下图:60
DescriptiveStatisticsNStatistic5050MinimumStatistic25.00MaximumStatistic53.00MeanStatisticStd.Error42.4600.9865Std.DeviationStatistic6.97579VarianceStatistic48.662贻贝单养ValidN(listwise)DescriptiveStatistics贻贝与海带混养ValidN(listwise)NStatistic5050MinimumStatistic39.00MaximumStatistic69.00MeanStatisticStd.Error52.1000.8959Std.DeviationStatistic6.33503VarianceStatistic40.133由上图可知,贻贝单养的平均数μ1=42.46,极差R1=53-25=28.00,标准差s1=6.97579,CV1=s1/μ1*100%=16.43%;贻贝与海带混养的平均数μ2=52.10,极差R1=69-39=30.00,标准差s2=6.33503,CV2=s2/μ2*100%=12.16%,虽然单养的极差较小(28),但贻贝与海带混养的平均数更大(52.10),且混养的变异系数更小,即其整齐度更有优势,由此得出,贻贝与海带混养的效果更好。5/4360
第三章概率与概率分布(P48)习题3.1试解释必然事件、不可能事件和随机事件。举出几个随机事件例子。答:(1)必然事件(certainevent)是指在一定条件下必然出现的事件;相反,在一定条件下必然不出现的事件叫不可能事件(impossible);而在某些确定条件下可能出现,也可能不出现的事件,叫随机事件(randomevent)。(2)例如,发育正常的鸡蛋,在39℃下21天会孵出小鸡,这是必然事件;太阳从西边出来,这是不可能事件;给病人做血样化验,结果可能为阳性,也可能为阴性,这是随机事件。习题3.2什么是互斥事件?什么是对立事件?什么是独立事件?试举例说明。答:(1)事件A和事件B不能同时发生,即A2B=V,那么称事件A和事件B为互斥事件(mutuallyexclusionevent),如人的ABO血型中,某个人血型可能是A型、B型、O型、AB型4中血型之一,但不可能既是A型又是B型。60
(2)事件A和事件B必有一个发生,但二者不能同时发生即A+B=U,A3B=V,则称事件A与事件B为对立事件(contraryevent),如抛硬币时向上的一面不是正面就是反面。事件A与事件B的发生毫无关系。(3)事件B的发生与事件A的发生毫无关系,则称事件A与事件B为独立事件(independentevent),如第二胎生男生女与第一台生男生女毫无关系。习题3.3什么是频率?什么是概率?频率如何转化为概率?答:(1)事件A在n次重复试验中发生了m次,则比值m/n称为事件A发生的频率(frequency),记为W(A)。(2)事件A在n次重复试验中发生了m次,当试验次数n不断增加时,事件A发生的频率W(A)就越来越接近某一确定值p,则p即为事件A发生的概率(probability)。(3)二者的关系是:当试验次数n充分大时,频率转化为概率。习题3.4什么是正态分布?什么是标准正态分布?正态分布曲线有何特点?u和δ对正态分布曲线有何影响?答:(1)正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。(2)μ=0,σ2=1的正态分布为标准正态分布,记为N(0,1)。60
(3)正态分布具有以下特点:①正态分布曲线是以平均数μ为峰值的曲线,当x=μ时,1f(x)取最大值?x?u2?;②正态分布是以μ为中心向左右两侧对称的分布③?的绝对值越大,f(x)值就越小,但f(x)永远不会等于0,所以正态分布以x轴为渐近线,x的取值区间为(-∞,+∞);④正态分布曲线完全由参数μ和?来决定⑤正态分布曲线在x=μ±?处各有一个拐点;⑥正态分布曲线与x轴所围成的面积必定等于1。(4)正态分布具有两个参数μ和?,μ决定正态分布曲线在x轴上的中心位置,μ减小曲线左移,增大则曲线右移;?决定正态分布曲线的展开程度,?越小曲线展开程度越小,曲线越陡,?越大曲线展开程度越大,曲线越矮宽。6/43习题3.5答:查附表1可得:(1)P=(0.3(4)P=(-1.96习题3.6解:因为x服从μ=4,σ=4的正太分布N(4,16),故通过标准化转换公式u=x?μ?可转化为:(1)P(-3P=(-1.75P=(μ(3)P(x>-1.5)→→60
P(μ>-1.375)≈P(μ>-1.38)P=(μ>-1.38)=1-F(μ=-1.38)=1-0.08379=0.91621(4)P(x≥-1)→→P(μ>-1.25)P=(μ≥-1.25)=1-F(μ=-1.25)=1-0.1056=0.89440习题3.7解:(1)根据基因分离定律和基因自由组合定律可知:F1代非糯稻Ww与糯稻ww回交,F2代糯稻和非糯稻的概率均为1/2,其中糯稻有200*1/2=100株,非糯稻有200*1/2=100株。(2)糯稻为2000*1/4=500株,非糯稻为2000*3/4=1500株。习题3.8解:由题意可知这种遗传符合泊松分布,P=0.0036(1)∵,λ=np=200*0.0036=0.72,∴P(1)=0.721*e-0.45/1!=0.72*e-0.45=0.4591(2)调查的株数n应满足e=e因此n=-λ-np=0.01-2lg0.01=≈1280(株)?p*lge-0.0036*0.43429习题3.9解:此题符合二项分布,n=5,p=0.425,q=1-0.425=0.57560
故“四死一生”的概率P(4)=C45p4q1=5*0.4254*0.5751=0.093787/43习题3.10解:设x服从这一正态分布。因为x服从μ=16,σ=2的正太分布N(16,4),故通过标准化转换公式u=x?μ?可转化为:(1)P(10∵P=(-320)→→P(μ2)∵P1=(μP2=(μ>2)=1-F(μ=2)=1-0.97725=0.02275∴P1(μ2)的总概率P=P1+P2=0.02275+0.02275=0.04550∴小于12或大于20的数据的百分数为4.55%。习题3.11解:(1)查附表3可知,当df=5时:①P(t=2.571)=0.05,故P(t≤-2.571)=0.05/2=0.025②P(t=4.032)=0.01,故P(t>4.032)=0.01/2=0.005(2)查附表4可知,当df=2时:①P(Xˉ=0.05)=0.975,故P(Xˉ≤0.05)=0.975②P(Xˉ=5.99)=0.05,故P(Xˉ>5.99)=1-0.05=0.95③∵P(Xˉ=0.05)=0.975,故PXˉ>0.05)=1-0.975=0.02560
P(Xˉ=7.38)=0.025,故P(Xˉ0.05)=0.025-0.025=0(3)查附表5可知,当df1=3,df2=10时:①P(F>3.71)=0.05②P(F>6.55)=0.018/43第四章统计推断(P78-79)习题4.1什么是统计推断?统计推断有哪两种?其含义是什么?答:(1)统计推断(statisticalinference)是根据总体理论分布由一个样本或一系列样本所得的结果来推断总体特征的过程。(2)统计推断主要包括参数估计和假设检验两个方面。(3)①假设检验是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率水平(或显著水平)上应该接受或否定的哪种假设的推断。②60
参数估计则是由样本结果对总体参数在一定概率水平下所做出的估计。参数估计包括点估计(pointestimation)和区间估计(intervalestimation)。习题4.2什么是小概率原理?它在假设检验中有什么作用?答:(1)小概率原理(littleprobability)是指概率很小的事件在一次试验中被认为是几乎不可能会发生的,一般统计学中常把概率概率小于0.05或0.01的事件作为小概率事件。(2)它是假设检验的依据,如果在无效假设H0成立的条件,某事件的概率大于0.05或0.01,说明无效假设成立,则接受H0,否定HA;如果某事件的概率小于0.05或0.01,说明无效假设不成立,则否定H0,接受HA。习题4.3假设检验中的两类错误是什么?如何才能少犯两类错误?答:(1)在假设检验中如果H0是真实的,检验后却否定了它,就犯了第一类错误,即α错误或弃真错误;如果H0不是真实的,检验后却接受了它,就犯了第二类错误,即β错误或纳伪错误。(3)假设检验中的两类错误是弃真错误和取伪错误。为了减少犯两类错误的概率要做到:①60
显著水平α的取值不可以太高也不可太低,一般去0.05作为小概率比较合适,这样可以使犯两类错误的概率都比较小;②尽量增加样本容量,并选择合理的实验设计和正确的实验技术,以减小标准误,减少两类错误。习题4.4什么叫区间估计?什么叫点估计?置信度与区间估计有什么关系?答:(1)区间估计(intervalestimation)指根据一个样本的观测值给出总体参数的估计范围,给出总体参数落在这一区间的概率。(2)点估计(pointestimation)是指从总体中抽取一个样本,根据样本的统计量对总体的未知参数作出一个数值点的估计。(3)置信度与区间估计的关系为;对于同一总体,置信度越大,置信区间就越小,置信度越小,置信区间越大。习题4.5解:(1)①假设Ho:???o,即改变饵料后对虾体重无显著变化;HA:???o,即改变饵料后对虾体重显著变化。②由于置信度P?1???0.95,确定显著水平??0.05。9/43第五章χ2检验(P89-90)习题5.1什么是χ检验?什么情况下的假设检验?60
2答:(1)χ检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验。即根据样本的频数分布来推断总体的分布。它属于自由分布的非参数检验。它可以处理一个因素分为多种类别,或多种因素各有多种类别的资料。所2以,凡是可以应用比率进行检验的资料,都可以用χ检验。2(2)χ检验主要有三种用途:一个样本方差的同质性检验,适合性检验和独立性检验。一个样本方差的同质性检验用于检验一个样本所属总体方差和给定总体方差是否差异显著,适合性检验是比较观测值与理论值是否符合的假设检验;独立性检验是判断两个或两个以上因素间是否具有关联关系的假设检验。2习题5.2χ检验的主要步骤有哪些?什么情况下需要进行连续性矫正?2答:(1)χ检验的步骤为:①提出无效假设H0:观测值与理论值的差异由抽样误差引起即观测值=理论值60
备择假设HA:观测值与理论值的差值不等于0,即观测值≠理论值②确定显著水平α一般可确定为0.05或0.012③计算样本的χ,求得各个理论次数Ei,并根据各实际次数Oi,代入公式,计算2出样本的χ。④进行统计推断。2(2)自由度df?1时,x2值需进行连续性矫正,矫正的x?为:k22x???i?1?Oi?Ei?0.5?Ei2习题5.3解:(1)H0:野兔性别比例符合1:1的比例;HA:野兔性别比例不符合1:1的比例;(2)选择显著水平为0.05(3)经SPSS卡方分析得到如下结果:性别(1=雄性;2=雌性)ObservedN12Total5786143ExpectedN71.571.5Residual-14.514.515/4360
TestStatistics性别(1=雄性;2=雌性)Chi-SquareadfAsymp.Sig.5.8811.015a.0cells(.0%)haveexpectedfrequencieslessthan5.Theminimumexpectedcellfrequencyis71.5.(4)作出推断:由上表可知P=0.015合1:1的比例。习题5.4解:(1)H0:大麦F2代芒性状表型的其比率符合9:3:4的理论比率;HA:其比率不符合9:3:4的理论比率;(2)选择显著水平为0.05(3)经SPSS卡方分析得到如下结果:芒性状表型(1=钩芒;2=长芒;3=短芒)ObservedN123Total348115157620ExpectedN348.7116.4154.8Residual-.7-1.42.2TestStatistics芒性状表型(1=钩芒;2=长芒;3=短芒)Chi-SquareadfAsymp.Sig..0492.976a.0cells(.0%)haveexpectedfrequencieslessthan5.Theminimumexpectedcellfrequencyis116.4.(4)作出推断:由上表可知P=0.976>α=0.05,故接受H0,否定HA,认为大麦F2代芒性状表型比率符合9:3:4的理论比率。16/4360
习题5.5解:(1)H0:这群儿童性别比合理;HA:这群儿童性别比不合理;(2)选择显著水平为0.05(3)经SPSS卡方分析得到如下结果:性别(1=男孩;2=女孩)ObservedN12Total421326747ExpectedN373.5373.5Residual47.5-47.5TestStatistics性别(1=男孩;2=女孩)Chi-SquareadfAsymp.Sig.12.0821.001a.0cells(.0%)haveexpectedfrequencieslessthan5.Theminimumexpectedcellfrequencyis373.5.(4)作出推断:由上表可知P=0.001合理。习题5.6解:(1)H0:两种苹果的耐储性差异不显著;HA:两种苹果的耐储性差异显著;(2)选择显著水平为0.05;(3)经SPSS卡方分析得到如下结果:品种(1=国光;2=品种)*腐烂情况(1=腐烂;2=未腐烂)CrosstabulationCount腐烂情况(1=腐烂;2=未腐烂)1品种(1=国1光;2=品种)2Total1416302186162348Total20017837817/4360
Chi-SquareTestsValuePearsonChi-SquareContinuityCorrectionLikelihoodRatioFisher’sExactTestLinear-by-LinearAssociationNofValidCases.5083781.476adf111Asymp.Sig.(2-sided).475.601.476ExactSig.(2-sided)ExactSig.(1-sided).510b.274.509.568.300a.Computedonlyfora2x2tableb.0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis14.13.(4)作出推断:由上表可知P=0.274>α=0.05,所以接受H0,否定HA,即两种苹果的耐储性差异未达显著。习题5.7解:(1)H0:不同小麦品种与赤霉病的发生无显著关系;HA:不同小麦品种与赤霉病的发生有显著关系;(2)选择显著水平为0.05;(3)经SPSS卡方分析得到如下结果植株患病情况(1=健株;2=病株)*小麦品种(1=A;2=B;3=C;4=D;5=E)CrosstabulationCount小麦品种(1=A;2=B;3=C;4=D;5=E)1植株患病情况(1=健1株;2=病株)2Total442785202460394993478355134376298674549450544Total22505002750Chi-SquareTestsValuePearson60
Chi-SquareContinuityCorrectionLikelihoodRatioLinear-by-LinearAssociationNofValidCases379.68832.775275041.000.000420.671adf4Asymp.Sig.(2-sided).000(4)作出推断:由上表可知P值为0.000种与赤霉病的发生有极显著的关系。18/43a.0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis90.73.习题5.8解:(1)H0:灌溉方式与叶片衰老无关;HA:灌溉方式与叶片衰老有关;(2)选择显著水平为0.05;(3)经SPSS卡方分析得到如下结果灌溉方式(1=深水;2=浅水;3=湿润)*稻叶情况(1=绿叶;2=黄叶;3=枯叶)CrosstabulationCount稻叶情况(1=绿叶;2=黄叶;3=枯叶)1灌溉方式(1=深1水;2=浅水;3=2湿润)3Total146183152481279143037131636Total160205182547Chi-SquareTestsValuePearsonChi-SquareContinuityCorrectionLikelihoodRatioLinear-by-LinearAssociationNofValidCases5.5354.51054741.237.0345.622adf4Asymp.Sig.(2-sided).229(4)作出推断:由上表可知60
P=0.229>α=0.05,故接受H0,否定HA说明水稻灌溉方式与叶片衰老无关。a.0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis8.78.19/43第六章方差分析(P128-129)习题6.1什么是方差分析?方差分析的基本思想是什么?进行方差分析一般有哪些步骤?答:(1)方差分析是对两个或多个样本平均数差异显著性检验的方法。(2)方差分析的基本思想是将测量数据的总变异按照变异来源分为处理效应和误差效应,并作出数量估计,在一定显著水平下进行比较,从而检验处理效应是否显著。(3)方差分析的基本步骤如下:①将样本数据的总平方和与自由度分解为各变异因素的平方和与自由度。②60
列方差分析表进行F检验,分析各变异因素在总变异中的重要程度。③若F检验显著,对个处理平均数进行多重比较。习题6.2什么是多重比较?多重比较有哪些方法?多重比较的结果如何表示?答:(1)多个平均数两两间的相互比较称为多重比较。(2)多重比较常用的方法有最小显著差数法(LSD法)和最小显著极差法(LSR法),其中最小显著极差法又有新复极差检验(SSR法)和q检验法。(3)多重比较的结果常以标记字母法和梯形法表示。①标记字母法是将全部平均数从大到小依次排列,然后再最大的平均数上标字母a,将该平均数与以下各平均数相比,凡相差不显著的都标上字母a,直至某个与之相差显著的则标以字母b。再以该标有b的平均数为标准,与各个比它大的平均数比较,凡差数差异不显著的在字母a的右边加标字母b。然后再以标b的最大平均数为标准与以下未曾标有字母的平均数比较,凡差数不显著的继续标以字母b,直至差异显著的平均数标以字母c,再与上面的平均数比较。如此重复进行,直至最小的平均数有了标记字母,并与上面的平均数比较后为止。这样各平均数间,凡有一个相同标记的字母即为差异不显著,凡具不同标记的字母即为差异显著。差异极显著标记方法同上,用大写字母标记。②60
梯形法是将各处理的平均数差数按梯形列于表中,并将这些差数进行比较。差数>LSD(LSR)0.05说明处理平均数间的差异达到显著水平,在差数的右上角标上“*”号;差数>LSD(LSR)0.01,说明处理平均数间的差异达到极显著水平,在差数的右上角标上“**”号。差数习题6.3方差分析有哪些基本假定?为什么有些数据需经过转换后才能进行方差分析?答:(1)方差分析有3个基本假定,即正态性、可加性和方差同质性。方差分析有效性是建立在3个基本假定的基础上的。(2)在研究中会出现一些样本,其所来自的总体和方差分析的基本假定相抵触,这些数据在进行方差分析之前必须经过适当的处理即数据转换来变更测量标尺。20/43习题6.4解:根据题目所给信息可知该题属于组内观测次数相等的单因素方差分析,SPSS方差分析,结果如下:TestofHomogeneityofVariances芽长(cm)LeveneStatistic1.805df13df28Sig..22460
不同浓度氟化钠溶液处理芽长资料的方差分析结果见下表:ANOVA芽长(cm)SumofSquaresBetweenGroupsWithinGroupsTotal22.6093.96026.569df3811MeanSquare7.536.495F15.225Sig..001由上述方差分析计算所得到的F值达到极显著水平,表明不同浓度氟化钠容易处理种子后,对芽长有极显著的影响。用LSD法、SSR法、q法进行多重比较的结果见下列表格:(1)不同浓度氟化钠处理芽长资料差异显著性(LSD检验)MultipleComparisonsDependentVariable:芽长(cm)(I)氟化钠溶液浓度(ug/g)(1=0;2=10;3=50;4=100)LSD1(J)氟化钠溶液浓度(ug/g)(1=0;2=10;3=50;4=100)1234212343123441234*.Themeandifferenceissignificantatthe.05level.1.067-3.500*-2.733*-1.067.5745.5745.5745.5745.100.000.001.100-.258-4.825-4.058-2.3912.391-2.175-1.409.2581.667*2.733*-2.433*-1.667*.5745.5745.5745.5745.020.001.003.020.3421.409-3.758-2.9912.9914.058-1.109-.342.7672.433*3.500*-.767.5745.5745.5745.5745.219.003.000.219-.5581.1092.175-2.0912.0913.7584.825.55895%ConfidenceIntervalStd.ErrorSig.LowerBoundUpperBoundMeanDifference(I-J)21/4360
(2)不同浓度氟化钠处理芽长资料差异显著性(q法及SSR法)芽长(cm)氟化钠溶液浓度(ug/g)(1=0;2=10;3=50;4=100)4321Sig.Duncana4321Sig.Meansforgroupsinhomogeneoussubsetsaredisplayed.a.UsesHarmonicMeanSampleSize=3.000.3333.100Subsetforalpha=.05N3333.1005.1336.2007.8678.633.21915.1336.2007.8678.633.2192Student-Newman-Keulsa多重比较的结论:用LSD法、SSR法、q法进行多重比较的结果是相同的,多重比较结果表明,用氟化钠浸种后,与对照相比,芽长降低,其中10μg/g与对照相比,差异不显著;对照与50μg/g,100μg/g差异达到极显著水平;10μg/g与50μg/g差异达显著水平,与100μg/g差异达极显著水平;50μg/g与100μg/g差异不显著。习题6.5解:根据题目所给信息可知该题属于组内观测次数不等的单因素方差分析,SPSS方差分析,结果如下:TestofHomogeneityofVariances仔猪体重(kg)LeveneStatistic1.027df12df221Sig..375方差分析结果见下表:60
ANOVA仔猪体重(kg)SumofSquaresBetweenGroupsWithinGroupsTotal153.53074.929228.458df22123MeanSquare76.7653.568F21.515Sig..000由上述方差分析计算所得到的F值达到极显著水平,表明母猪对仔猪体重存在极显著的影响作用。22/43多重比较检验(LSD检验)如下:MultipleComparisonsDependentVariable:仔猪体重(kg)95%ConfidenceIntervalStd.Error.9776.9179.9776.9519.9179.9519Sig..011.000.011.002.000.002LowerBound.6814.091-4.7471.306-7.909-5.265UpperBound4.7477.909-.6815.265-4.091-1.306(I)母猪型号(1=NO.1;2=NO.2;3=NO.3)LSD1(J)母猪型号(1=NO.1;2=NO.2;3=NO.3)123MeanDifference(I-J)2.714*6.000*-2.714*3.286*-6.000*-3.286*21233123Bonferroni11232.714*6.000*-2.714*3.286*-6.000*-3.286*.9776.9179.9776.9519.9179.9519.034.000.034.007.000.007.1713.612-5.257.809-8.388-5.7625.2578.388-.1715.762-3.612-.80921233123*.Themeandifferenceissignificantatthe.05level.60
多重比较结果表明,母猪对仔猪断奶时体重有极显著的影响,参试的3头母猪彼此之间的差异均达极显著水平。习题6.6解:根据题目所给信息可知该题是两因素无重复观测值得方差分析,可以分别对品种、室温这两个因素的效应进行分析,且品种、室温均为固定因素,可依固定模型进行分析。以家兔品种作为因素A,该因素有4个水平;以室温作为因素B,该因素有7个水平,经SPSS统计分析结果如下:经F检验结果表明:品种和室温对家兔血糖值的影响均达极显著水平。多重比较(LSD检验)(1)品种间比较:TestsofBetween-SubjectsEffectsDependentVariable:血糖含量(葡萄糖含量/100g血液中)SourceCorrectedModelInterceptFACTORX2FACTORX1ErrorTotalCorrectedTotalTypeIIISumofSquares13288.607a373296.0362758.39310530.2141652.357388237.00014940.964df9136182827MeanSquare1476.512373296.036919.4641755.03691.798F16.0844066.51110.01619.119Sig..000.000.000.000a.RSquared=.889(AdjustedRSquared=.834)23/43MultipleComparisonsDependentVariable:血糖含量(葡萄糖含量/100g血液中)95%ConfidenceIntervalStd.60
Error5.1215.1215.1215.1215.1215.1215.1215.1215.1215.1215.1215.121Sig..070.002.123.070.129.002.002.129.000.123.002.000LowerBound-20.62-28.76-2.47-.90-18.907.387.24-2.6215.53-19.05-28.90-37.05UpperBound.90-7.2419.0520.622.6228.9028.7618.9037.052.47-7.38-15.53(I)品种(1=一号;2=二(J)品种(1=一号;2=二号;3=三号;4=四号)号;3=三号;4=四号)LSD11234212343123441234Bonferroni11234212343123441234Basedonobservedmeans.*.Themeandifferenceissignificantatthe.05level.MeanDifference(I-J)-9.86-18.00*8.299.86-8.1418.14*18.00*8.1426.29*-8.29-18.14*-26.29*-9.86-18.00*8.299.86-8.1418.14*18.00*8.1426.29*-8.29-18.14*-26.29*5.1215.1215.1215.1215.1215.1215.1215.1215.1215.1215.1215.121.421.015.738.421.775.014.015.775.000.738.014.000-25.03-33.17-6.89-5.32-23.322.972.83-7.0311.11-23.46-33.32-41.465.32-2.8323.4625.037.0333.3233.1723.3241.466.89-2.97-11.11LSD检验结果表明,品种Ⅲ与品种Ⅰ、品种Ⅳ差异达极显著水平;品种Ⅱ与品种Ⅳ差异达极显著水平。(2)室温间比较温度(1=35℃,2=30℃,3=25℃,4=20℃,5=15℃,6=10℃,7=5℃。60
24/43MultipleComparisonsDependentVariable:血糖含量(葡萄糖含量/100g血液中)LSD(I)温度(1=35°C,2=30°C(J)温度(1=35°C,2=30°C,3=25°C,4=20°C,5=15°,3=25°C,4=20°C,5=15°C,6=10°C,7=5°C)C,6=10°C,7=5°C)1234567213456731245674123567512346761234577123456*.Themeandifferenceissignificantatthe.05level.MeanDifference(I-J)25.00*40.00*58.25*56.00*27.50*17.50-25.00*15.0033.25*31.00*2.50-7.50-40.00*-15.0018.2516.00-12.50-22.50*-58.25*-33.25*-18.25-2.25-30.75*-40.75*-56.00*-31.00*-16.002.25-28.50*-38.50*-27.50*-2.5012.5030.75*28.50*-10.00-17.507.5022.50*40.75*38.50*10.0095%ConfidenceIntervalStd.60
Error10.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.24810.248Sig..024.001.000.000.014.102.024.158.004.006.810.472.001.158.089.133.236.039.000.004.089.828.007.001.000.006.133.828.011.001.014.810.236.007.011.340.102.472.039.001.001.340LowerBound3.6918.6936.9434.696.19-3.81-46.31-6.3111.949.69-18.81-28.81-61.31-36.31-3.06-5.31-33.81-43.81-79.56-54.56-39.56-23.56-52.06-62.06-77.31-52.31-37.31-19.06-49.81-59.81-48.81-23.81-8.819.447.19-31.31-38.81-13.811.1919.4417.19-11.31UpperBound46.3161.3179.5677.3148.8138.81-3.6936.3154.5652.3123.8113.81-18.696.3139.5637.318.81-1.19-36.94-11.943.0619.06-9.44-19.44-34.69-9.695.3123.56-7.19-17.19-6.1918.8133.8152.0649.8111.313.8128.8143.8162.0659.8131.3125/43LSD检验结果表明,35℃与25℃,20℃,15℃的温度差异均达到极显著水平,与30℃,10℃,5℃的温度差异达到显著水平;30℃与20℃,15℃的温度差异均达到极显著水平,与35℃,25℃的温度差异达到显著水平,与10℃,5℃的温度差异不显著;25℃与35℃的温度差异达到极显著水平,与30℃,20℃,15℃,5℃的温度差异达显著水平,与10℃的温度差异不显著;20℃与35℃,30℃,10℃,5℃的差异达到极显著水平,与25℃的温度差异达到显著水平,与15℃的温度差异不显著;15℃与35℃,30℃,5℃的温度差异达到极显著水平,与25℃,10℃60
的温度差异达到显著水平,与20°C的差异不显著;10℃与35℃,20℃,15℃的温度差异达显著水平,与30℃,25℃,5℃的温度差异不显著;5℃与20℃,15℃的温度差异达极显著,与35℃,30℃,25℃,10℃的温度差异不显著。习题6.7解:根据题目所给信息可知本题为有重复观测值的二因素方差分析,原料和发酵温度均为固定因素,可按固定模型进行分析,以原料作为因素A,因素A有3个水平;以发酵温度作为因素B,因素B有3个水平;每一个处理均重复4次,实验共有36个观测值。经SPSS方差分析,得到如下结果:TestsofBetween-SubjectsEffectsDependentVariable:适宜的条件SourceCorrectedModelInterceptFACTORX1FACTORX2ErrorTotalCorrectedTotalTypeIIISumofSquares4704.667a37636.0003150.5001554.1672465.33344806.0007170.000df4122313635MeanSquare1176.16737636.0001575.250777.08379.527F14.790473.24919.8089.771Sig..000.000.000.001经过方差分析可知:原料、温度间的差异均达极显著水平,原料X温度的差异达显著水平。多重比较(LSD检验)原料的检验:60
a.RSquared=.656(AdjustedRSquared=.612)26/43MultipleComparisonsDependentVariable:适宜的条件95%ConfidenceIntervalStd.Error3.6413.6413.6413.6413.6413.641Sig..007.000.007.147.000.147LowerBound-17.84-23.262.99-12.848.41-2.01UpperBound-2.99-8.4117.842.0123.2612.84(I)原料(1=A1;(J)原料(1=A1;Mean2=A2;3=A3)2=A2;3=A3)Difference(I-J)LSD112321233123Bonferroni112321233123Basedonobservedmeans.*.Themeandifferenceissignificantatthe.05level.-5.4215.83*5.42-10.42*-15.83*10.42*-5.4215.83*5.42-10.42*-15.83*10.42*3.6413.6413.6413.6413.6413.641.022.000.022.441.000.441-19.63-25.051.20-14.636.62-3.80-1.20-6.6219.633.8025.0514.63MultipleComparisons温度的检验:DependentVariable:适宜的条件95%ConfidenceIntervalStd.Error3.6413.6413.6413.6413.6413.641Sig..019.000.019.001.000.001LowerBound1.5715.32-16.436.32-30.18-21.18UpperBound16.4330.18-1.5721.18-15.32-6.32(I)温度(1=30°C;2=35°C,3=40°C)LSD1(J)温度(1=30°C;2=35°C,3=40°C)123MeanDifference60
(I-J)9.00*22.75*-9.00*13.75*-22.75*-13.75*21233123Bonferroni11239.0022.75*-9.0013.75*-22.75*-13.75*3.6413.6413.6413.6413.6413.641.057.000.057.002.000.002-.2113.54-18.214.54-31.96-22.9618.2131.96.2122.96-13.54-4.5421233123Basedonobservedmeans.*.Themeandifferenceissignificantatthe.05level.经过多重比较可知:该物质比较适宜的条件是:原选A1,温度选30℃。27/43习题6.8解:根据题目所给信息可知,此题为3因素方差分析,且3个因素均为固定因素,可依固定模型进行分析,数据共有60个。经SPSS方差分析,得到如下结果:TestsofBetween-SubjectsEffectsDependentVariable:干重平均数(g)SourceCorrectedModelInterceptFACTOR0FACTORX1FACTORX2FACTOR0*FACTORX1FACTOR0*FACTORX2FACTORX1*FACTORX2FACTOR0*FACTORX1*FACTORX2ErrorTotalCorrectedTotalTypeIIISumof60
Squares2607.22710894.5371189.04020.371915.5251.414403.21947.89929.75915.92513517.6902623.152adf2911242488306059MeanSquare89.90410894.5371189.04010.186228.881.707100.8055.9873.720.531F169.36520523.4622239.95019.188431.1731.332189.89911.2797.008Sig..000.000.000.000.000.279.000.000.000a.RSquared=.994(AdjustedRSquared=.988)由方差分析F值可见:处理时间、浓度、种子,类型、处理时间X浓度、浓度X种子类型和处理时间X浓度X种子类型均达极显著差异,而处理时间X种子类型未达显著性差异。28/43第七章抽样原理与方法(P131-142)习题7.1什么叫抽样调查?抽样调查有什么意义?P131答:(1)抽样调查(samplingsurvey)就是采用科学的方法,从所研究的总体中抽取一定数量的个体构成样本,通过对样本的调查研究,进而对总体做出推断的方法。(2)60
抽样调查的意义:节省人力、物力、财力和时间的同时,减少试验误差,提高试验的精确度,取得真实可靠的试验资料,为统计分析得出正确的推断和结论打下基础。习题7.2常用的抽样调查有哪些基本方法?试比较其优缺点及适用对象。答:(1)常用的抽样调查方法有随机抽样,顺序抽样和典型抽样。(2)随机抽样是指在抽样过程中,总体内所有个体都具有相同的被抽取的概率。由于抽样的随机性,可以正确的估计试验误差,从而推出科学合理的结论。随机抽样可分为以下几种方法:简单随机抽样,分层随机抽样,整体抽样和双重抽样。①简单随机抽样的结果可用统计方法进行分析,从而对总体作出推断,并对推断的可靠性作出度量。适用于个体间差异较小,所需抽取的样本单位数较小的情况。对于那些具有某种趋向或差异明显和点片式差异的总体不宜使用。②分层随机抽样是一种混合抽样。其特点是将总体按变异原因或程度划分成若干区层,然后再用简单随机抽样方法,从各区层按一定的抽样分数抽选抽样单位。分层随机抽样具有以下优点:①若总体内各抽样单位间的差异比较明显,可以把总体分为几个比较同质的区层,从而提高抽样的准确度;②分层随机抽样类似于随机区组设计,既运用了随机原理,也运用了局部控制原理,这样不仅可以降低抽样误差,也可以运用统计方法来估算抽样误差。60
③整体抽样是把总体分成若干群,以群为单位,进行随机抽样,对抽到的样本作全面调查,因此也称为整群抽样。整体抽样具有以下优点:①一个群只要一个编号,因而减少了抽样单位编号数,且因调查单位数减少,工作方便;②与简单随机抽样相比较,它常常提供较为准确的总体估计值,特别是害虫危害作物这类不均匀的研究对象,采用整体抽样更为有利;③只要各群抽选单位相等,整体抽样也可提供总体平均数的无偏估计。④双重抽样是在抽样调查时要求随机抽出两个样本,涉及两个变量。双重抽样具有以下两个优点:①对于复杂性状的调查研究可以通过仅测量少量抽样单位而获得相应于大量抽样单位的精确度;②当复杂性状必须通过破坏性测定才能调查时,则仅有这种双重抽样方法可用。(2)顺序抽样是按某种既定顺序从总体中抽取一定数量的个体构成样本。抽样顺序的优点表现在:①可避免抽样时受人们主观偏见的影响,而简便易行;②容易得到一个按比例分配的样本;③如果样本的观察单位在总体分布均匀,其取样个体在总体内分布较均匀,这时采用顺序抽样的抽样误差较小。其缺点表现在:①如果总体内存在周期性变异或单调增﹙减﹚趋势时,则很可能会得到一个偏差很大的样本,产生明显的系统误差;②60
顺序抽样得到的样本并不是彼此独立的,因此,对抽样误差的估计只是近似的。通过顺序抽样的方法,不能计算抽样误差,估计总体平均数的置信区间。(3)典型抽样是根据初步资料或经验判断,有意识、有目的的选取一个典型群体作为样本进行调查记载,以估计总体。这种抽样方法完全依赖于调查工作者的经验和技能,结果不稳定,且没有运用随机原理,因而无法估计抽样误差。典型抽样多用于大规模社会经济调查,而在总体相对较小或要求估算抽样误差时,一般不采用这种方法。29/43习题7.3解:本题为平均数资料样本量的确定,由题意可知:s=3.3,允许误差L=0.5故n=tsL0.05222=4s2L2=4*3.320.52=175(头)答:该调查方案的样本容量以175头仔猪为宜。习题7.4解:本题为频率资料样本量的确定,由题意可知:p=0.15,q=1-0.15=0.85,允许误差L=0.0360
由于n=tsL0.05222,以频率表示的标准误sp?pqn故n=4pqL2?4*0.15*0.85=567(只)20.03答:该调查方案应至少调查567只鸡才能达到目的。习题7.5解:本题为成对资料样本量的确定。由题意可知:故n=s?d?3.65,允许误差d?3,tα?t0.05≈22?2?ts0.05?222d4sdd?4*3.652d32?5.7?6(对)因为按上式计算时,是按n>30的t0.05计算所得,求出所需调查6对鸡,还得以n=6再做进一步计算,以取得一个稳定的n值。当n=6时,自由度df=n-1=5,t0.05=2.571,则:n=ts0.05?222d?2.571*3.6532222?9.8?10(对)d再以n=10,自由度df=10-1=9,t0.05=2.262,计算得:n=ts0.05?222d?d2.26232.36532*3.6522?7.8?8(对)=2.365,计算得:60
再以n=8,自由度df=8-1=7,t0.052n=ts0.05?222d?*3.652?8.3?8(对)d答:该调查方案应至少调查8对鸡才能达到目的。30/43习题7.6解:本题为非成对资料样本量的确定。由题意可知:s2?4,允许误差(x1?x2)??2?1.5。2以α=0.05,n>30,t?tα0.05?2计算,则:?14.2?14n?2t0.05s??222?2*4*4(x1?x2)2t0.05s??2221.52再以n=14,自由度df=14+14-2=26,t0.05=2.056,计算得:n??2*2.056*42(x1?x2)2t0.05s??2221.52?15.01?15再以n=15,自由度df=15+15-2=28,t0.05=2.048,计算得:n??2*2.048*42(x1?x2)1.52?14.91?15答:该调查方案中,每组实验至少应调查15条鱼才能达到目的。习题7.760
解:根据题意可知:n=10,x?464.8,s=46.59,df=10-1=9,查表得故样本估计标准误?t0.05=2.262sx??sn??46.5910x??14.733(g)其95%的置信区间为:x?ts0.05?464.8?2.262*14.733?464.8?33.326即这批平菇平均单重有95%的可能性在464.8?33.326g范围内,也就是在区间(431.474,498.126)内。31/43第八章实验设计及其统计分析(一)(P164-165)习题8.1何为试验设计?生物学试验的基本要求是什么?答:(1)试验设计(experimentaldesign)包括广义的试验设计和狭义的试验设计。广义的试验设计是指整个研究课题的设计,包括试验方案的拟订,试验单位的选择,分组的排列,试验过程中试验指标的观察记载,试验资料的整理,分析等内容;而狭义的试验设计则仅是指试验单位的选择、分组与排列方法。生物统计学中的试验设计主要指狭义的试验设计。60
(2)生物学试验的基本要求是:①试验目的要明确;②试验条件要有代表性;③试验结果要可靠;④试验结果要能重演。习题8.2试解释什么是处理、处理效应、主效应、互作?答:(1)处理(treatment)是指对受试对象给予的某种外部干预,是试验中实施的因子水平的一个组合,又称为处理因素(treatmentfactor)。(2)处理效应(treatmenteffect)是指处理因素作用于受试对象的反应,是研究结果的最终体现。(3)主效应(maineffect)是指由于因素水平的改变而造成因素效应的改变。(4)互作(interaction)是指两个或两个以上处理因素间的相互作用产生的效应。习题8.3简述试验误差的来源及其控制途径。答:(1)试验误差的来源主要有:①试验材料固有的差异;②试验条件不一致;③操作技术不一致;④偶然性因素的影响。(2)针对试验误差来源,控制试验误差的途径主要有:①选择纯合一致的试验材料;②改进操作管理制度,使之标准化;③精心选择试验单位;④采用合适的试验设计。习题8.4试验设计的基本原理和作用是什么?60
答:(1)试验设计有3项基本原则:重复,随机和局部控制。(2)重复原则的主要作用是估计试验误差,降低试验误差;随机原则的主要作用是提供无偏的试验误差估计;局部控制原则的主要作用是降低试验误差。总之,只有遵循重复、随机、局部控制3项基本原则的试验设计,才能由试验获得真实的处理效应和无偏的、最小的试验误差估计,从而对各处理间的比较得出可靠的结论来。习题8.5本章讲述的常用试验设计有哪几种?这些方法各适宜在什么情况下使用?答:(1)对比设计(comparisondesign)是一种最简单的试验设计方法,适用于单因素试验。对比设计分为邻比设计(neighbourcomparisondesign)和间比设计(interphasecomparisondesign)。①邻比设计的优点是简单易行,精度较高,便于田间观察评比,缺点是对照小区太多,一般要占试验地面积的三分之一,一般处理数为10以内而不宜过多。②间比设计的精度不够高,但在一个实验中可以包括较多的处理。(2)随机区组设计(randomizedblocksdesign)既适用于单因素试验也适用于多因素试验。该设计不允许处理数太多或太少,太多导致区组增大,局部控制效率降低,太少误差的自由度太小,降低假设检验的灵敏度,因此最好在10个左右。32/4360
(3)平衡不完全区组设计(balancedincompleteblockdesign,BIB)适用于区组没有均一性的时候。平衡不完全区组设计的优点是利用不完全区组安排试验处理,而仍可作出各处理间的正确比较。其主要缺点是区组数必须严格按照规定数目设置,否则各处理间的比较会失去均衡,所以不完全区组实际的总小区数较多,即同类试验的规模往往比随机区组大,因而只有当难以进行随机区组试验时才采用平衡不完全区组试验。习题8.6解:计算各品种对相邻CK的百分数品种CKABCKCDCKEFCK各小区重复产量Kg/100m2ⅠⅡⅢ20.320.016.820.118.417.319.020.017.015.716.814.720.717.816.921.618.115.617.816.413.920.714.912.817.314.918.619.116.214.8Ti57.155.856.047.255.455.348.148.450.850.1xi19.0318.6018.6715.7318.4718.4316.0316.1316.9316.70?对临近CK的%100.00%97.72%118.64%100.00%117.37%114.97%100.00%100.62%101.40%100.00%60
由上表可见:B、C、D三个品种的大豆产量超过对照10%以上,大体上可以认为这三个品种优于对照,其他品种A、E、F未超过对照或超过不明显,即与对照无异。习题8.6解:分析见下表:TestsofBetween-SubjectsEffectsDependentVariable:增重SourceInterceptFOODGROUPTypeIISumofSquares4004.45015.75015.75014.0002.80014.000df13312412MeanSquare4004.4505.250a5.2501.167b.7001.167bF762.7524.500.600Sig..000.025.670HypothesisErrorHypothesisErrorHypothesisErrora.MS(FOOD)b.MS(Error)33/43EstimatesDependentVariable:增重饲料A饲料B饲料C饲料D饲料Mean15.20013.60014.80013.000Std.Error.483.483.483.48395%ConfidenceIntervalLowerBoundUpperBound14.14816.25212.54814.65213.74815.85211.94814.052PairwiseComparisonsDependentVariable:增重MeanDifference(I-J)Std.Error1.600.683.400.6832.200*.683-1.600.683-1.200.683.600.683-.400.6831.200.6831.800.683-2.200*.683-.600.683-1.800.68395%ConfidenceIntervalforaDifferenceLowerBoundUpper60
Bound-.5543.754-1.7542.554.0464.354-3.754.554-3.354.954-1.5542.754-2.5541.754-.9543.354-.3543.954-4.354-.046-2.7541.554-3.954.354(I)饲料A饲料B饲料C饲料D饲料(J)饲料B饲料C饲料D饲料A饲料C饲料D饲料A饲料B饲料D饲料A饲料B饲料C饲料Sig..2231.000.044.223.6271.0001.000.627.131.0441.000.131aBasedonestimatedmarginalmeans*.Themeandifferenceissignificantatthe.05level.a.Adjustmentformultiplecomparisons:Bonferroni.UnivariateTestsDependentVariable:增重SumofSquares15.75014.000df312MeanSquare5.2501.167F4.500Sig..025ContrastErrorTheFteststheeffectof饲料.Thistestisbasedonthelinearlyindependentpairwisecomparisonsamongtheestimatedmarginalmeans.34/43习题10.4解:(1)根据题目所给信息,通过SPSS回归分析得到如下结果:CoefficientsaUnstandardizedCoefficientsModel1(Constant)60
温度(℃)B-283.68018.084Std.Error63.8723.387.860StandardizedCoefficientsBetat-4.4415.339Sig..001.000a.DependentVariable:棉蚜虫数(个)所以建立的直线回归方程为:y=-283.6799+18.0836x(2)回归系数的显著性检验由上表可知,t=5.339,查t值表,当df=n-2=12-2=10时,t0.05(10)=2.228即t=5.339>t(0.05)10=2.228,应否定H0:β=0,接受HA:β≠0,即认为该回归系数达极显著水平。(3)该地区4月份下旬均温为18℃时,5月上旬50株棉蚜虫预期头数。当x=18时,有:y=-283.6799+18.0836x=283.6799+18.0836x18=41.8249≈42,即当该地区4月份下旬均温为18℃时,5月上旬50株棉蚜虫预期头数为42头。习题10.6解:根据题目所给信息,通过SPSS回归分析得到如下结果(如下表所示)(1)所以建立的直线回归方程为:y=-47.3530+0.2610x(2)对所建立的直线回归方程进行显著性检验假设H0:大白鼠进食量x与体重增加量y之间无线性关系;HA:二者之间存在线性关系将F检验结果列于表:60
CoefficientsaUnstandardizedCoefficientsModel1(Constant)进食量B-47.353.261Std.Error51.605.065.854StandardizedCoefficientsBetat-.9184.018Sig..394.007a.DependentVariable:体重增加ANOVAbModel1RegressionResidualTotalSumofSquares2954.9051097.9704052.875df167MeanSquare2954.905182.995F16.147Sig..007aa.Predictors:(Constant),进食量b.DependentVariable:体重增加40/43由上表可知,P=0.007(3)进食量为900时,大白鼠的体重95%置信区间。当x=900时,y=187.574095%置信区间:(166.6619,208.4861)习题10.7解:根据题目所给信息,通过SPSS相关分析得到如下统计结果:DescriptiveStatisticsMeanStd.DeviationN未受冻32.92505.6147016受冻35.18564.0310516Correlations未受冻受冻未受冻PearsonCorrelation1.593*Sig.(2-tailed)..015N1616受冻PearsonCorrelation.593*1Sig.(2-tailed).015.N1616*.Correlationissignificantatthe0.05level(2-tailed).44424038受冻36343230282620304050未受冻相关分析结果表明,相关系数肩标“*”即为P60
Rsq=0.351641/43第十二章协方差分析(P235)习题12.1什么是协方差分析?协方差分析的主要作用是什么?答:(1)协方差分析(analysisofcovariance)是将乘积和与平方和同时按照变异来源进行分解,从而将直线回归与方差分析结合应用的一种统计方法。它用于比较一个变量y在一个或几个因素不同水平上的差异,但y在受这些因素影响的同时,还受到另一个变量x的影响,而且x变量的取值难以人为控制,不能作为方差分析中的一个因素处理。此时,如果x与y之间可以建立回归关系,则可以用回归分析的方法对y值进行矫正,在排除x对y的影响后用方差分析的方法对各因素的影响作出统计推断。(2)协方差分析的主要作用表现在3个方面:①利用协变量可以降低试验误差,矫正处理平均数,实现统计控制;②分析不同变异来源的相关关系;③对缺失数据进行估计。注:第九章、第十二章、第十三章、十四章、十五章、十六章内容没有上,未做。42/4360
百度搜索“就爱阅读”,专业资料,生活学习,尽在就爱阅读网92to.com,您的在线图书馆百度搜索“就爱阅读”,专业资料、生活学习,尽在就爱阅读网92to.com,您的在线图书馆!60