利用HPRICE1.RAW中的数据。
(i)估计模型
并按通常的格式报告你的结果,包括回归标准误。当我们代入lotsize=10000,sqrft=2300和bdrms=4时,求出预测价格,将这个价格四舍五入到美元。
(ii)做一个回归,使你能得到第(i)部分中预测值的一个95%的置信区间。注意,由于四舍五入的误差,你的预测将多少有些不同。
(iii)令price0为具有第(i)部分和第(ii)部分所述特征的住房的未知未来售价。求出price0的一个95%的置信区间,并对这个置信区间的宽度进行评论。
其中,因为滞后支出变量,第一个可用年份(基年)是1993年。
(i)用混合OLS估计模型,并报告通常的标准误。为使得ai的期望值可以非零,你应该与年度虚拟变量一起包含一个截距项。支出变量的估计效应是什么?求OLS残差。
(ii)lunchit系数的符号在意料之中吗?解释系数的大小。你认为学区的贫穷率对考试通过率有很大的影响吗?
(iii)利用的回归计算AR(1)序列相关的一个检验。你应该在回归中使用1994-1998年的数据。验证存在很强的正序列相关,并讨论为什么。
(iv)现在用固定效应法估计方程。滞后的支出变量仍显著吗?
(v)你为什么认为在固定效应估计中,注册学生人数和午餐项目变量不是联合显著的?
(vi)定义支出的总(或长期)效应为的标准误。
在模式枚举(pattern enumeration)类应用中,需要从主串T中找出所有的模式串P(T|=n,|P|=m),而且有时允许模式串的两次出现位置之间相距不足m个字符。
类似于教材310页图11.3中的实例,比如在“000000”中查找“000”。若限制多次出现的模式串之间至少相距|P|=3个字符,则应找到2处匹配;反之,若不作限制,则将找到4处匹配。
a)试举例说明,若采用后一约定,则教材11.4.3节BM算法的好后缀策略,可能需要Ω(nm)时间;
b)试针对这一缺陷改进好后缀策略,使之即便在采用后一约定时,最坏情况下也只需线性时间。
维持人体正常代谢所必需的小分子有机化合物,大部分需要从食物中摄取的是
A.葡萄糖
B.果糖
C.维生素
D.脂肪乳
E.氨基酸
舌下腺囊肿的治疗中错误的是
A.摘除舌下腺
B.口外型需要从口外入路
C.口外型需要术后加压包扎
D.囊壁可不摘除
E.舌下腺摘除后需要放置引流
在教材例12.8中,我们发现方程(12.47)的ut中有异方差性存在的证据。因此,我们就来计算异方差-稳健标准误(在[]中给出)和通常的标准误:
使用异方差-稳健:统计量对returnt-1的显著性有何影响?
在教材例11.6中,我们估计了一个一阶差分形式的有限分布滞后模型:
利用FERTIL3.RAW中的数据来检验误差中是否存在AR(1)序列相关。
本题使用GPA2.RAW中的数据。
(i)考虑方程
其中,colgpa表示累积的大学GPA,hsize表示高中毕业年级以百人计的规模,hsperc表示在毕业年级中学术排名的百分位,sat表示SAT综合分数,female是一个二值变量,而athlete也是一个运动员取值1的二值变量。你对这个方程中的系数有何预期?哪些你没有把握?
(ii)估计第(i)部分中的方程,并以通常的形式报告结果。估计运动员和非运动员之间GPA的差异是多少?它是统计显著的吗?
(ii)从模型中去掉sat并重新估计这个方程。现在,作为运动员的估计影响是多大?讨论为什么这个估计值不同于第(ii)部分的结论。
(iv)在第(i)部分的模型中,容许作为运动员的影响会因性别不同而不同。检验如下原假设:在其他条件不变的情况下,女生是否是运动员没有差别。
(v)sat对colgpa的影响会因性别不同而不同吗?讲出你的根据。
利用HPRICE1.RAW中的数据。
(i)估计模型
并以通常的OLS格式报告结论。
(ii)当losie=20000,sqpt=2500和bdrms=4时,求出log(price)的预测值。利用教材6.4节中的方法,在同样的解释变量值的情况下,求出price的预测值。
(iii)就解释price中的变化而言,决定你是喜欢第(i)部分中的模型,还是喜欢模型