本文与Chalkbeat共同发表,Chalkbeat 是一家涵盖公共教育的非营利新闻机构。请在此处注册其时事通讯。
去年夏天,威斯康星州基诺沙布拉德福德高中的管理人员像每年一样开会,为即将入学的九年级学生制定计划。副校长马特·布朗 (Matt Brown) 和他的工作人员从数百名中学生的名单中列出了 30 到 40 名他们认为毕业最困难的学生名单。
暑假期间,布朗和他的团队逐条列出名单并拜访了每个孩子的家。工作人员为学生们带来了 T 恤,向家长介绍了自己,留下了他们的联系方式,希望能给学生留下积极的第一印象。
“这就像是,‘嘿,我们想为你提供一些布拉德福德的装备。你现在将成为布拉德福德家庭的一员,”布朗说。
“这有点像‘嘿,我们来这里支持你’,而不一定是‘嘿,你的孩子去年真的搞砸了’……因为我们不希望父母有像你一样的感觉。”我们已经给他们的孩子贴上了麻烦制造者的标签。”
但在大多数情况下,布拉德福德暑期访问名单上的学生之所以来到那里,是因为威斯康星州建立的种族不平等算法给他们贴上了“高风险”标签,而这种算法经常引发误报。
自 2012 年以来,像布朗这样的威斯康星州学校管理人员从辍学预警系统 (DEWS) 中获得了对新生的第一印象,这是一个使用历史数据的机器学习算法的集合,例如学生的考试成绩、纪律记录、免费或简化的数据午餐价格状况和种族——预测该州每名六年级至九年级学生按时从高中毕业的可能性。
学校每年两次收到一份注册学生名单,每个名字旁边都有 DEWS 的颜色编码预测:绿色表示低风险,黄色表示中等风险,红色表示高退学风险。
去年,94% 的白人学生按时毕业,而只有 82% 的西班牙裔学生和 71% 的黑人学生在四年内完成了高中学业。 DEWS 的目的是尽早将个性化预测交给教育工作者,以便他们可以在孩子表现出明显偏离轨道的迹象之前进行干预。
但经过十年的使用和数百万次预测,The Markup 发现 DEWS 可能会错误地产生负面影响,影响教育工作者如何看待学生,尤其是有色人种学生。
加州大学伯克利分校的研究人员即将进行的一项学术研究与 The Markup 分享了数据和发表前的研究结果,该研究得出的结论是,DEWS 未能实现其主要目标:提高其标记为“高风险”的学生的毕业率。 ”
公共教育部 (DPI) 于 2021 年进行的一项内部公平分析发现,DEWS 对黑人和西班牙裔学生未按时毕业的误报率明显高于白人学生。
根据 DPI 总结分析的演示文稿(我们通过公共记录请求。
西班牙裔学生的误报率比白人学生高 18 个百分点。
DPI 尚未向使用 DEWS 的学校官员告知调查结果,自得出 DEWS 不公平结论以来的近两年内,它似乎也没有改变算法。
DPI 的演示文稿总结了我们审查的公平性分析,但不包括 DPI 用于计算的黑人、西班牙裔和白人学生的潜在误报率。它还不包括其他种族学生的成绩。
该部门拒绝回答有关分析的问题,并且在回应随后的公共记录请求时,DPI 表示,除了演示文稿之外,它没有任何股权分析结果的文件。 (可以在此处观看演示视频。)
2021 年 3 月,DPI 对 DEWS 准确性进行的单独验证测试显示,它预测学生无法按时毕业的概率中有近四分之三是错误的。
我们采访的学生惊讶地发现 DEWS 的存在,并告诉 The Markup,他们担心一种算法正在利用他们的种族来预测他们的未来,并将他们标记为高风险。
2022 年从布拉德福德高中毕业的黑人学生克里斯托弗·莱昂斯 (Christopher Lyons) 表示:“这让有色人种学生感觉自己被孤立了……就好像他们自然而然拥有的东西就少了。”
威斯康星州新闻部发言人 Abigail Swetz 拒绝回答有关 DEWS 的问题,但提供了一份简短的电子邮件声明。
“DEWS 是种族主义者吗?”斯韦茨写道。 “不,数据分析不是种族主义。数学反映了我们的系统。现实是,我们生活在一个白人至上主义社会,教育体系存在系统性种族主义。这就是为什么 DPI 需要 DEWS 等工具,也是我们致力于教育公平的原因。”
在回答我们的发现和进一步的问题时,斯韦茨写道:“你对这个系统的工作原理存在根本性的误解。我们坚持之前的回应。”她没有解释这个根本性的误解是什么。
为了弄清 DEWS 如何影响其所评判的学生,The Markup 检查了未发表的 DPI 研究,分析了 10 年的学区级 DEWS 数据,采访了学生和学校官员,并收集了该州 400 多个学区中 80 个学区的调查回复他们对预测的使用。
我们的调查显示,威斯康星州的许多地区都在使用 DEWS(占对我们调查做出回应的地区的 38%),而且由于教育工作者缺乏培训,算法的技术缺陷更加严重。
DEWS 是一项自愿计划, DPI 鼓励教育工作者将预测与有关学生的其他本地数据结合起来做出决策。该机构没有追踪学校是否或如何使用这些预测。
校长、主管和其他管理人员告诉 The Markup,他们很少或根本没有收到关于 DEWS 如何计算其预测或如何将“高风险”等标签转化为适当干预措施的解释。
在基诺沙这样的地区,有色人种学生不需要数据来理解被有偏见的系统评判的后果。 2020 年, 警察枪杀雅各布·布莱克 (Jacob Blake) 后,这座城市成为全国头条新闻。
今年早些时候,一名 12 岁黑人学生的家人起诉基诺沙联合学区,因为一名下班的保安警察在学校的午餐室掐住了她的脖子。
2018年,也就是莱昂斯进入布拉德福德高中的那一年,该校的一名老师被拍到在学生面前多次使用种族歧视言论。那一年,DEWS 将基诺沙 43% 的黑人九年级学生标记为高风险,而白人九年级学生的这一比例为 11%。
到那时,莱昂斯说他已经失去了学业动力。 “感觉好像我们没有被期望做太多事情,”他说。 “感觉就像他们知道我们注定会失败。”
然后,他大二那年发生了一些意想不到的事情:COVID-19 大流行爆发,课程改为虚拟,用他的话说,他的成绩从大流行前的 2.9 GPA“飙升”到转向远程学习后的 3.8 GPA。
对许多学生来说,这是一次令人迷失方向的学业中断,但对里昂来说,这是一次缓刑,让他能够集中注意力。 “我没有受到周围老师或行政部门等社会压力,”他说。 “只有我,电脑,无论我在和谁说话。”
去年,里昂斯获得全额奖学金,在基诺沙迦太基学院开始了一年级的学习。他的经历说明了个性、学习风格和环境的怪癖,一些专家表示,这些怪癖使得根据对统计上相似的学生的人口水平分析来预测个别学生的未来会适得其反。
尽管如此,使用机器学习来预测学生成绩的预警系统在 K-12和高等教育中很常见。根据对所有 50 个州的 Markup 调查,至少有 8 个州的公共教育机构提供算法预警系统,或者目前正在构建这些系统以供将来使用。四个州没有回应。
蒙大拿州是除威斯康星州外唯一一个表示已检查其预警系统在不同种族群体中表现如何的州。蒙大拿州公共教育办公室发言人布莱恩·奥利里表示,该州的公平研究尚未完成。
每年年初和年中,DEWS 都会计算每位六年级至九年级学生按时从高中毕业的可能性,范围为 0 到 100。
90 分表示具有相似学术、行为和人口统计特征的学生过去 90% 的时间都准时毕业。任何 DEWS 分数(加上误差幅度)低于 78.5 的学生都被标记为无法按时毕业的高风险。
为了使教育工作者更容易理解预测,DPI 将 DEWS 分数转换为简单的颜色编码格式。在全州信息系统的 DEWS 选项卡中,每个学生姓名旁边都有一个标签,显示他们的分数以及绿色“低”、黄色“中”或红色“高”风险指定。
在 2020-21 学年,超过 32,000 名学生(占该州六年级至九年级学生的 15%)被标记为“高风险”。
说明:学生的 DEWS 预测如何在全州信息系统中显示的示例。图片来源: DPI 的 DEWS 数据简介
专家表示,该系统的设计方式可能会无意中使教育工作者对学生的看法产生偏见,并误导稀缺的学校资源。特别令人担忧的是,DEWS 在很大程度上利用了种族、残疾和家庭财富等因素,这些因素可能会导致系统性歧视,而学校和学生都无法改变这一点。
输入 DEWS 的其他数据点,例如纪律率,存在明显的种族差异——DPI 知道这一点,并在其网站上写下了相关内容。
“我想知道这些风险类别如何促使学校和学区关注个人而不是结构性问题——说这个孩子需要这些东西,而不是结构性问题是我们看到这些风险的原因,”托拉尼·布里顿说是加州大学伯克利分校的教育学教授,他是即将发表的关于 DEWS 的研究的合著者。
“我不认为学生获得额外的资源是一件坏事,但与此同时,创建将你的种族或民族与你完成高中学业的能力联系起来的算法似乎是一条危险的道路。”
当 DEWS 预测学生将毕业时,通常是正确的——根据 2021 年验证测试,这些学生在标准四年内毕业的概率为 97%,该测试显示了算法在历史数据测试时的表现。
但当 DEWS 预测学生不会按时毕业时,通常是错误的——根据同一项测试,这些学生按时毕业的比例为 74%。
这部分是设计使然。 DPI 对 DEWS 进行了调整,以广泛撒网并过度识别有辍学风险的学生。
2015 年,DPI 前研究分析师 Jared Knowles 在《教育数据挖掘杂志》上发表的一篇描述 DEWS 的论文中写道,DPI “明确表示我们愿意接受”25 个错误警报,如果这意味着正确识别一名辍学学生,学生将无法毕业。
但在其权益分析中,DPI 发现这些算法产生的误报率并不相同。
说明文字:DPI 演示文稿的屏幕截图,总结了该部门的 DEWS 股权分析结果。图片来源:威斯康星州新闻部
“用外行的话来说:该模型在准时毕业生中过度识别白人学生,而在非准时毕业生中过度识别黑人、西班牙裔和其他有色人种学生,”DPI 研究分析师在报告中写道。推介会。
出于公平分析的目的,该演示文稿并未具体说明什么 DEWS 分数符合按时毕业的条件。
幻灯片的注释,标题为“DEWS 公平吗?”以“不……”的结论结束
“他们使用的模型肯定在学生种族方面存在系统性错误,这确实是必须解决的问题,”研究早期预警系统的宾夕法尼亚大学教育学教授瑞安·贝克 (Ryan Baker) 说。
“他们将人口因素作为预测因素,这将过分强调这些变量的含义并导致这种影响。”
最近,主要来自加州大学伯克利分校的一组研究人员(博士候选人 Juan Perdomo、Britton 以及算法公平性专家 Moritz Hardt 和 Rediet Abebe)通过不同的视角检查了 DEWS 的功效。
他们的研究使用了近 10 年的 DEWS 数据(DPI 自愿共享这些数据),这是关于预测性预警系统如何影响学生成绩的有史以来最大规模的分析。
虽然之前的研究询问了早期预警系统在根据历史数据进行测试时的准确度如何,但加州大学伯克利分校的研究检验了 DEWS 是否能为标记为高风险的实际学生带来更好的毕业率。
研究人员测试了 DEWS 分数略低于 78.5 阈值(将其归入高风险类别)的学生与分数略高于该阈值(将其归入中等风险类别)的学生相比,毕业率是否有所提高。
如果该系统按预期运行,高风险类别的学生将会看到毕业率提高,因为他们获得了额外的资源,但研究发现,被置于高风险类别对于学生是否按时毕业没有统计上的显着影响。
作者写道:“没有证据表明 DEWS 的预测以任何方式影响了按时毕业的可能性。”
加州大学伯克利分校的研究表明,如果该系统按预期运行,并且学校将更多资源分配给被标记为高风险的学生,这将产生不同但也不公平的影响。
作者写道:“如果学校通过对 [DEWS] 分数进行排名并选择预计毕业概率最低的学生来选择学生进行干预,那么服务不足的学生将被系统性地忽视和取消优先级。”
这是因为 DEWS 的预测毕业率并不能准确反映学生的真实毕业率。根据加州大学伯克利分校研究人员与 Markup 分享的数据,尤其是白人学生的毕业率远高于 DEWS 分数所显示的水平。
例如,获得 DEWS 分数 83 分的有色人种学生,90% 的学生都能按时毕业。这与去年威斯康星州全州平均毕业率相同。
DEWS 得分为 83 分的白人学生按时毕业的比例为 93%,高于州平均水平。
但至关重要的是,DEWS 分数明显较低(63 分)的白人学生按时毕业的比例与得分较高的白人学生基本相同:92%。
但 DEWS 分数为 68 分的有色人种学生只有 81% 按时毕业,低于州平均水平。
换句话说,如果教育工作者遵循 DEWS 的建议,优先为分数为 63 的白人学生提供帮助,而不是分数为 68 的有色人种学生,那么他们会优先考虑最终以高于平均水平毕业的学生,而不是最终以低于平均水平毕业的学生。平均费率。
该研究得出的结论是,该算法的这种特殊怪癖可能并没有加剧威斯康星州的不平等,因为 DEWS 并没有改善任何被标记为高风险的人的结果,无论种族如何。
从成立之初,DPI 就将 DEWS 推广为一种具有成本效益的工具,以应对该州“不可接受的”毕业差距。但预警系统并不是该机构的首选解决方案。
作为 2011 年半年度预算提案的一部分,现任州长托尼·埃弗斯 (Tony Evers) 领导下的威斯康星州新闻部 要求为“每个孩子都是毕业生”拨款计划提供 2000 万美元,该计划将直接向陷入困境的地区提供资源。
那一年,该州 91% 的白人学生按时高中毕业,而黑人学生的这一比例为 64%。
但时任州长斯科特·沃克对公共教育有不同的计划。他从两年预算中削减了近 8 亿美元,即约 7% 的公立学校国家拨款。其中包括用于“每个孩子都是毕业生”的 2000 万美元,沃克政府 将其中的 1500 万美元用于建立一个全州范围的学生信息系统,将所有学生数据存储在一个地方。
DPI 拒绝了其资助计划,但拥有大量新数据,因此寻求高科技解决方案来解决其毕业差距。 2012年,它开始试点DEWS。
在创建时,DEWS 是该国最先进的预测预警系统之一。
前 DPI 研究分析师诺尔斯表示,其准确性“与目前使用的一些最受推崇的系统相当,但是在更大规模、更多样化的学校环境中以及较低年级进行的”该系统的构建者在 2015 年《教育数据挖掘杂志》论文中写道。
DPI 很快决定扩大预测分析的使用,并于 2016 年推出了一个姊妹算法,称为大学和职业准备预警系统 (CCREWS),该算法可以预测学生是否为 ACT 和大学“准备好”或“未准备好”。
在 The Markup 对威斯康星州学区的调查中,80 名受访者中有 7 名表示他们以某种方式使用 CCREWS,而有 30 个学区报告使用 DEWS。
2019 年,DPI 试行了另一种基于 DEWS 的算法模型,旨在预测哪些学生会在 AP 课程中取得成功。根据通过公共记录请求获得的文件,11 个地区的学校报名参加了该试点项目,但该项目在 COVID-19 大流行爆发后被放弃。
自 2011 年(DEWS 试点前一年)以来,威斯康星州黑人和白人学生之间的毕业差距缩小了几个百分点。
在该州过去十年的预测算法实验中,威斯康星州的教育不平等现象几乎没有改善。
自 2011 年以来,黑人和白人学生的毕业差距仅缩小了 4 个百分点,从 27% 缩小到 23%。与此同时,自 2011 年以来的每一次全国教育进步评估 (NAEP) 中,威斯康星州八年级黑人和白人学生的阅读成绩差距一直是全美各州中最差的。
自 2009 年以来,该州在每次 NAEP 中的黑人和白人八年级学生的数学成绩差距也是所有州中最大的。
“当这些数据出来时,我总是问的问题不仅仅是黑人孩子的表现有多糟糕,[而是]白人孩子为什么表现得这么好?”全国教育不平等问题专家、威斯康星大学麦迪逊分校退休教授格洛丽亚·拉德森-比林斯说道。
“我们并不是不知道如何让这些孩子度过难关。问题是他们必须看起来像一级运动员,我们才会足够关心。”
威斯康星州的黑人和西班牙裔学生告诉 The Markup,他们常常感觉自己是二流学校系统的一部分。
肯尼斯·佩里 (Kennise Perry) 是威斯康星大学帕克赛德分校 (UW-Parkside) 的 21 岁学生,曾就读于密尔沃基公立学校,该学校的黑人学生比例为 49%,后来搬到沃科夏郊区,那里的学校只有 6% 的黑人学生。她说她的童年很艰难,她的家庭生活有时不稳定,她的学校可能认为她是“高风险”学生。
“我是所有班级中唯一的黑人孩子。没有其他任何人能代表任何看起来像我的人,而我的同龄人是极端种族主义者,”她说。 “这真的很痛苦……我非常生气,但我不知道如何发泄我的愤怒。我很痛苦。
然后,当然,标签之类的东西就开始了。但我觉得成功者和失败者之间的区别在于你周围的人,就像我有关心我并给我第二次机会之类的人。 [DEWS] 列出这些孩子的高风险和他们的统计数据,你甚至没有给他们机会,你已经给他们贴上了标签。”
沃科夏学区没有回应 The Markup 的调查或置评请求。然而,通过公共记录请求获得的文件显示,佩里就读的沃科夏北高中已报名参加 DPI 算法的试点,该算法旨在预测哪些学生将在 AP 课程中取得成功。
密尔沃基公立学校是该州最大的学区,其预警系统并未使用 DEWS 或任何类型的机器学习,发言人 Stephen Davis 在给 The Markup 的电子邮件中写道。与许多地区和州一样,它使用一种低技术含量的方法,根据学生是否达到某些基准(例如缺勤预定天数)来确定学生是否正常。
去年,卡达希高中的学生成立了第一个黑人学生会,以应对他们认为学校管理部门没有妥善解决的种族主义事件。
“你知道,[白人学生]已经占据了优势,”卡达希黑人学生会的大三学生兼副主席米娅·汤森德 (Mia Townsend) 说。 “你已经感受到了那种分离……他们有更多的机会,在某些事情上有更多的回旋余地。”
BSU 的学生有机地为彼此提供了与州政府希望通过其预测算法实现的相同类型的支持性干预措施。
在 2020-21 学年,威斯康星州 18% 的白人学生参加了 AP 考试,而黑人学生的这一比例为 5%。汤森是一名优等生,她表示,她原本打算避开 AP 课程,直到大三学生、BSU 校长莫里斯·牛顿 (Maurice Newton) 敦促她接受挑战。她要求明年参加 AP 英语课程。
“他们让它看起来更具挑战性,但实际上是一样的,”牛顿说。 “你可以以好的成绩通过这门课。”
在回答 The Markup 关于 DEWS 的问题时,Cudahy 区负责人蒂娜·欧文-摩尔 (Tina Owen-Moore) 分享了一封电子邮件,其中工作人员表示他们不知道也目前没有使用这些预测,但辅导员“对这一资源感到兴奋”。 ”
然而,在回顾了我们的发现后,欧文-摩尔写道:“这肯定改变了我的观点!!”
许多对 Markup 调查做出回应的学区表示,他们使用 DEWS 预测的方式与布朗和基诺沙布拉德福德高中的工作人员的做法类似,以确定建筑物中的哪些新生可能需要额外关注。
例如,在阿普尔顿市的学区,高中案件管理员使用 DEWS 和其他数据来识别需要支持的新生一年级学生,并确定特殊教育案件量。
温尼康学区“严重”依赖 DEWS 数据,向家长发送信件,告知他们的孩子可能面临风险,尽管这些信件没有提及该算法。
但一些学校发现了这些数据的其他标签外用途。例如,Maple 学区的负责人 Sara Croney 告诉 The Markup,她的员工使用 DEWS 的“感知到的无偏见数据”成功申请了一项员工发展补助金,重点关注未参与的学生。
在拉辛市,中学曾经使用 DEWS来选择哪些学生将被安置在一个特殊的“无暴力区”计划中,其中包括将有破坏性的学生送到单独的教室。
拉辛学区“目前没有使用 DEWS 或 CCREWS”,发言人 Stacy Tapp 在一封电子邮件中写道。
许多接受 The Markup 采访的管理员表示,他们很少或根本没有接受过有关 DEWS 如何计算预测或如何解释预测的培训。
“他们只是向我们提供了数据并说,‘弄清楚’,”克罗尼说。 “所以我们的校长将对其进行分析并决定谁是高危地区的孩子。”
DPI 在其网站上提供了有关 DEWS 工作原理及其预期用途的文档,但许多面向公众的材料都忽略了有关该系统的一个关键事实:其预测部分基于学生的种族、性别、家庭财富和收入。其他学校无法控制的因素。
例如,该部门的DEWS 行动指南没有提及学生种族、性别或免费或减价午餐状态是算法的关键输入变量。
DPI 的网页描述了用于生成 DEWS 预测的数据,列出了四个不同类别的信息:出勤率、纪律记录、上一年就读的学区数量(流动性)以及州考试成绩。
它指出“使用了人口统计属性”,但没有说明哪些属性或它们如何影响预测。
同样,当教育工作者在全州信息系统中查看学生的 DEWS 预测时,他们可以检查学生的出勤率、纪律记录、流动性和考试成绩如何影响整体风险标签,但他们不会看到学生的人口统计特征如何影响预测。
里奇兰学区课程和教学主任莎莉·约翰逊 (Shari Johnson) 表示,她的学校正在开始制定行动计划,并为“高风险”学生指派教职导师,目标是让他们脱离这一类别,尤其是那些“风险最高”的学生。 ”因为她说不可能指导所有人。
然而,当她接受 The Markup 采访时,她并不知道残疾或经济弱势等特征会影响学生的分数。
“我们知道这些事情是谁的责任?这是我在这个职位上所关心的问题,因为我只是偶然发现的,”约翰逊说。 “我所做的事情与 DEWS 和那里的信息直接相关,这让我感到害怕。”
DEWS 的工作方式与教育工作者对其工作方式的理解之间的脱节对于 DPI 来说并不是新闻。
2016 年,中西部地区教育实验室的研究人员根据对中学校长使用 DEWS 体验的调查,为 DPI 撰写了一份从未发表的报告。
我们通过公共记录请求获得的这份报告得出的结论是,受访者“希望在如何识别和监测干预措施方面获得更多培训和支持”,并且“时间、金钱和 DEWS 培训”是使用该系统的最大障碍。
布拉德福德高中校长布莱恩·盖格 (Brian Geiger) 表示,他记得在 DEWS 推出时就听说过 DEWS,当时他是另一所基诺沙学校的副校长,从那时起,他就将其用于各种目的,包括夏季家访。
现在,他在布拉德福德大学的副校长布朗也开始了这种做法。尽管知道 DEWS 存在缺陷,布朗表示这些预测是他为即将入学的学生提供的最佳数据。
“这不是 100% 的预测。我对此的看法是,我们可以用它作为指导,”他说,并补充道,“我希望我们能够参观所有 1,400 名孩子(在布拉德福德高中就读的)的每一所房子。我们没有暑期学校预算来做到这一点。”
本文中的地图的早期版本错误地包括了夏威夷、内华达、新泽西、北卡罗来纳和密歇根。这些州使用预警系统,但他们不使用算法或机器学习来预测学生的成绩。
致谢:托德·费瑟斯、科·布拉格、乔尔·伊斯特伍德、加布里埃尔·洪杜斯特、罗德尼·约翰逊、杰里米·辛格-瓦恩、玛丽亚·普尔塔斯和吉尔·贾洛夫
也发布在这里
照片由 Sigmund 在 Unsplash 上拍摄