利用LAWSCH85.RAW中的数据。
(i)使用与第3章习题4一样的模型,表述并检验原假设:在其他条件不变的情况下,法学院排名对起薪中位数没有影响。
(ii)新生年级的学生特征(即LSAT和GPA)对解释salary而言是个别或联合显著的吗?
(iii)检验是否要在方程中引入入学年级的规模(clsize)和教职工的规模(faculty);只进行一个检验。(注意解释clie和facuiy的缺失数据。)
(iv)还有哪些因素可能影响到法学院排名,但又没有包括在薪水回归中?
在第3章的习题3中,我们估计了一个方程,来检验一个随机样本中每个人每周花在睡眠上的分钟数(sleep)和每周花在工作上的分钟数(totwork)之间的替代关系。方程中还包括受教育程度和年龄。由于sleep和totwork是每个人同时选择的,所估计的睡眠和工作之间的交替关系会遭到“联立性偏误”的批评吗?请解释。
有计划上大学的中学高年级学生。
(Ⅰ) 假设你有权进行一项控制实验。请说明为了估计hours对sal的引致效应, 你将如何构建实验。
(Ⅱ) 考虑一个更加实际的情形, 即由学生选择在备考课程上花多少时间, 而你只能随机地从总体中抽出sat和hours的样本。将总体模型写作如下形式:
其中,与通常带截距的模型一样, 我们可以假设E(u)=0。列举出至少两个u中包含的因素。这些因素与hours可能呈正相关还是负相关?
(III)在(Ⅱ)的方程中,如果备考课程有效,那么β1的符号应该是什么?
(Ⅳ)在(Ⅱ)的方程中,β0该如何解释?
设某系统中N个粒子的速率分布曲线如习题5-13图所示。试求:(1)常量A以v0表示;(2)速率在0~v0之间、1.5 v0~2 v0之间的粒子数;(3)粒子的平均速率;(4)速率在0~v0之间粒子的平均速率。
下面是关于摩托车的一个调查,我们共有20种车的数据,其中考察了5个变量:
(1)发动机大小,用1.2.3.4.5来代表;
(2)汽罐容量,用1.23来相对描述;
(3)费油率,用1.2. 3.4来相对描述;
(4)重量,用12.3.4.5来描述;
(5)产地,0表示北美生产,1表示其余产地。
试用多维标度法来处理表10.24中的数据,并对结果进行解释。
令math10表示密歇根州高中学生在一次标准化数学考试中的及格百分比(也可参见例4.2)。我们感兴趣的是估计每个学生的支出对其数学成绩的影响。一个简单的模型是
其中,poverty表示贫困生的比例。变量Inchprg表示学校有资格享受联邦政府午餐资助计划的学生比例。为什么它是povert的一个合适的代理变量?
(ii)下表包含了有和没有Inchprg作为解释变量时的OLS估计值。解释为什么支出对mathl0的影响在列(2)比在列(1)要低。列(2)中的这种影响在统计上仍大于1吗?
(iii)在其他条件相同的情况下,越大的学校通过率越低吗?请解释。
(iv)解释列(2)中Inchprg的系数。
(v)你如何理解R从列(1)到列(2)的显著提高?
一致估计量。给定这样一个估计量,定义β0的一个估计量为
证明。
参考第3章习题14。现在,我们使用住房价格的对数作为因变量:
(i)你想在住房增加一个150平方英尺的卧室的情况下, 估计并得到price变化百分比的一个置信区间。以小数形式表示就是θ1=150β1+β2。使用HPRICE1.RAW中的数据去估计θ1。
(ii)用θ1和民β1表达β2,并代入log(price) 的方程。
(iii)利用第(ii)部分中的结果得到θ1的标准误,并使用这个标准误构造一个95%的置信区间。
对美国所有家庭构成的总体考虑一个家庭储蓄方程:
其中,inc表示家庭收入,hhsize表示家庭规模,educ表示户主受教育年数,而age表示户主的年龄。假定E(ulinc,hhsize,educ,age)=0。
(i)假设样本只包括户主年龄在25岁以上的家庭。如果我们对这样一个样本使用OLS,我们能得到βj的无偏估计量吗?请解释。
(ii)现在假设我们的样本只包括无子女的已婚夫妇。我们能估计储蓄方程中的所有参数吗?我们能估计哪些参数?
(iii)假设我们从样本中排除掉储蓄超过每年25000美元以上的家庭。OLS能得到βj的一致估计量吗?
对(许多美国工人可用的)401(k)养老金计划的出现是否提高了净储蓄,吸引了大量研究兴趣。数据集401KSUBS.RAW包含了有关净金融资产(nettfa)、家庭收入(ic)、是否有资格参与401(k)计划的二值变量(e401k)和其他几个变量的信息。
(i)样本中有资格参与一个401(k)计划的家庭比例是多少?
(ii)估计一个用收入、年龄和性别解释401(k)资格的线性概率模型。包括收入和年龄的二次项,并以通常形式报告结论。
(iii)你认为401(k)资格独立于收入和年龄吗?性别呢?请解释。
(iv)求第(ii)部分中估计的线性概率模型的拟合值。有小于0或大于1的拟合值吗?
(v)利用第(iv)部分中的拟合值e401k1,定义e401k1在e401k≥0.5时取值1,并在2e401k<0.5时取值0。在9275个家庭中,预计有多少家庭有资格参与401(k)计划?
(vi)对于没有资格参加401(k)的5638个家庭,利用预测值e401k1,预测其中有多大比例没有401(k)?对于有资格参加401(k)的3637个家庭,其中有多大比例的家庭有401(k)?(如果你的计量经济软件具有“制表”命令更好。)
(vii)总正确预测比约为64.9%。给定第(vi)部分的答案,你认为这是模型好坏的一个完备描述吗?
(viii)在线性概率模型中增加一个解释变量pira。其他条件不变,若一个家庭有某人拥有个人退休金账户,一个家庭有资格参与401(k)计划的估计概率会提高多少?在10%的显著性水平上,它统计显著异于0吗?