【台湾教育部 - 新闻资讯】教育数据拾遗:如何使用不完整的资讯 2013年02月22日 10时讯
政策制定者和分析师在使用「输入调整法」评比大学院校时,必须尽可能掌握真实的数据资料。在现实世界中,教育方面的数据常常并不完整、也不容易使用。即便有强大的分析工具或方法,资料蒐集往往比分析本身更为困难,错误的资料就可能导致错误的结论。
有鉴于此,参与HCM「成功的脉络」这一系列研究的资深研究人员列出了使用数据的一些重点:
广泛蒐集资料有许多种不同来源的资料可用于「输入调整法」,数据的多寡则视蒐集的时间和来源而定。以下是可以蒐集资料的方向:‧12年国教期间的成绩单和其他记录(分数、是否有免费午餐、课表、操行等);‧大学申请资料(有考虑但并未就读的学校);‧财务援助申请资料(收入、财产);‧高等教育记录(转学学分抵免、结果变项);‧ACT与SAT测验记录(分数、背景调查问题);‧就业记录(结果变项,上大学前的受雇记录);‧学生调查(参见〈正确的大学院校调查〉一文);‧全国学生情报交换中心(私校/跨州转学)。
让遗漏的资料发挥作用将以上资料合併之后,许多学生的记录可能有部分遗漏。分析师应该建立一个独立的变项,说明每个变项是否有遗漏,并将这些变项进行分析。某些资料的欠缺本身就具有意义,例如,没有参加SAT或ACT测验的学生,可能原本就不打算就读四年制大学;未曾填写FAFSA(联邦学生补助免费申请)的学生更可能来自高收入家庭。
避免遗漏分析师应尽可能使用所有可获得的资讯,否则选择性的过滤资讯可能导致上百种不同的预测结果。如果某些资讯最终无助于预测结果、或不容易取得、或难以解释,之后随时可以将这些资料拿掉,但任何可能有用的资讯都值得一试。
修正偏离值或使用对数在收入这个变项,一个Facebook员工的收入可以是一群大学毕业生平均收入的两倍。有一种替代方法是将这些极端值排除或设定上限,但这样可能漏掉重要资讯(毕竟这所学校的确出了至少一个成功的工程师!)。更好的办法是以收入的对数来代替收入本身的数字,这样让100万到10万美元的差距与10万到1万美元的差距相仿,而不是差到10倍。其他会出现巨大偏离值的变项也应採类似的处理方式。
【台湾教育部 - 新闻资讯】教育数据拾遗:如何使用不完整的资讯追蹤多个世代儘可能採用不只一年的入学学生资讯,这样有两个潜在的优点,首先能增加资讯的数量,让统计效果更好;其次,这样统计出来的结果可能更接近一般真实情况,而非某一年度学生的特殊情形。但若使用太多年份的资料,统计结果可能无法反映当下的现况。
(译者:魏瑀娴)
感谢您阅读本文,本文转载自台湾教育部官网.更多精彩资讯请关注查字典资讯网,我们将持续为您更新最新资讯!