教育数据拾遗:如何使用不完整的资讯

首页 > 

留学

 > 教育数据拾遗:如何使...

教育数据拾遗:如何使用不完整的资讯

【台湾教育部 - 新闻资讯】教育数据拾遗:如何使用不完整的资讯 2013年02月22日 10时讯

政策制定者和分析师在使用「输入调整法」评比大学院校时,必须尽可能掌握真实的数据资料。在现实世界中,教育方面的数据常常并不完整、也不容易使用。即便有强大的分析工具或方法,资料蒐集往往比分析本身更为困难,错误的资料就可能导致错误的结论。

有鉴于此,参与HCM「成功的脉络」这一系列研究的资深研究人员列出了使用数据的一些重点:

广泛蒐集资料有许多种不同来源的资料可用于「输入调整法」,数据的多寡则视蒐集的时间和来源而定。以下是可以蒐集资料的方向:‧12年国教期间的成绩单和其他记录(分数、是否有免费午餐、课表、操行等);‧大学申请资料(有考虑但并未就读的学校);‧财务援助申请资料(收入、财产);‧高等教育记录(转学学分抵免、结果变项);‧ACT与SAT测验记录(分数、背景调查问题);‧就业记录(结果变项,上大学前的受雇记录);‧学生调查(参见〈正确的大学院校调查〉一文);‧全国学生情报交换中心(私校/跨州转学)。

让遗漏的资料发挥作用将以上资料合併之后,许多学生的记录可能有部分遗漏。分析师应该建立一个独立的变项,说明每个变项是否有遗漏,并将这些变项进行分析。某些资料的欠缺本身就具有意义,例如,没有参加SAT或ACT测验的学生,可能原本就不打算就读四年制大学;未曾填写FAFSA(联邦学生补助免费申请)的学生更可能来自高收入家庭。

避免遗漏分析师应尽可能使用所有可获得的资讯,否则选择性的过滤资讯可能导致上百种不同的预测结果。如果某些资讯最终无助于预测结果、或不容易取得、或难以解释,之后随时可以将这些资料拿掉,但任何可能有用的资讯都值得一试。

修正偏离值或使用对数在收入这个变项,一个Facebook员工的收入可以是一群大学毕业生平均收入的两倍。有一种替代方法是将这些极端值排除或设定上限,但这样可能漏掉重要资讯(毕竟这所学校的确出了至少一个成功的工程师!)。更好的办法是以收入的对数来代替收入本身的数字,这样让100万到10万美元的差距与10万到1万美元的差距相仿,而不是差到10倍。其他会出现巨大偏离值的变项也应採类似的处理方式。

【台湾教育部 - 新闻资讯】教育数据拾遗:如何使用不完整的资讯

追蹤多个世代儘可能採用不只一年的入学学生资讯,这样有两个潜在的优点,首先能增加资讯的数量,让统计效果更好;其次,这样统计出来的结果可能更接近一般真实情况,而非某一年度学生的特殊情形。但若使用太多年份的资料,统计结果可能无法反映当下的现况。

(译者:魏瑀娴)

感谢您阅读本文,本文转载自台湾教育部官网.

更多精彩资讯请关注查字典资讯网,我们将持续为您更新最新资讯!

查看全部

推荐文章

猜你喜欢

附近的人在看

推荐阅读

拓展阅读

相关资讯

最新资讯

网友关注