在学习|教学评估准则的问题

标题是什么?它是复杂的

通过格兰特•威金斯特性的。真正的教育

标题是什么?为什么我们叫它呢?

指南写的标题是一组区分性能或产品不同的质量。

(我们将使用一个清单,如果我们在找什么东西或者不存在的东西,例如:是的,有一个参考书目)。组成的一个标题描述符为标准在每个级别的性能,通常在4到6点。有时候项目符号指标在每个使用通用描述符提供具体的例子或迹象每个描述符下寻找什么。一个好的标题,可以有效和可靠的标准参照判断性能。

“标题”这个词来源于拉丁语“红色。在古代,一个标题的指令集或光泽法律或礼拜仪式,通常用红色。因此,标题指示人——在这种情况下如何进行判断性能“依法”。

你说题目是建立的标准。但是一些题目用“特征”或“维度”这样的词语。”是一个特征相同的标准?

严格地说,它们是不同的。考虑写:“一致性”是一个特征;“连贯”的标准特征。这是另一个对:我们通过“组织”的视角来确定论文的组织和逻辑发展。“你看到的区别吗?一个特征是一个地方;标准是我们寻找的,我们需要看到法官的工作成功的(或者不高兴的)特征。

我为什么要担心不同特征的性能或标准?为什么不直接使用一个简单的整体范畴和做吗?

因为公平的名义和反馈可能会损害效率。在复杂的性能往往是相互独立的标准:味道这顿饭的小连接到它外观和外表没有关系的营养价值。这些条件独立的一个另一个。在实践中这意味着,你可以很容易地想象给高分的味道和外观的低分一顿饭,反之亦然。然而,在一个整体的方案你会给两个(不同的)表现相同的分数。然而,它不是有用的说,饭菜都是相同的质量。

分别使用单独的性能维度得分的另一个原因是降落在一个整体得分的问题不同的指标。考虑下面的口头评价标准。我们该怎么办如果学生使伟大的目光接触但不明确的情况下他们的主题的重要性?不能上我们很容易想象单独的性能与观众接触的维度和主张的主题的重要性,一个学生可能擅长和穷人在另一个吗?标题要我们相信这些sub-achievements总是相伴而行。

但逻辑和经验建议。

口头评价标准

- 5 -优秀:学生清楚地描述问题的研究和它的重要性提供了强有力的理由。给出具体的信息来支持结论,和描述。交付是迷人和句子结构是一贯正确的。目光接触是和持续整个演示。有强有力的证据的准备、组织和热情为主题。使用视觉教具演示更有效。观众提问与特定的和适当的信息清楚地回答。
- 4 -很好:问题描述的学生研究并提供它的重要性的原因。缺乏足够的信息支持结论,和描述。交付和句子结构通常是正确的。有证据的准备、组织和热情为主题。提到和使用视觉教具。观众提问回答清楚。
- 3 -好:学生描述问题的研究和结论,但支持信息并不健壮如4或5。交付和句子结构通常是正确的。有一些迹象表明准备和组织。提到的视觉援助。回答观众的问题。
- 2 -有限:学生状态问题研究,但不能完全描述它。不给回答问题的结论。交付和句子结构是可以理解的,但是有一些错误。缺乏证据的准备和组织。可能是也可能不是提到视觉援助。观众提问回答,只有最基本的反应。
- 1 -差:学生做了一个演讲没有声明这个问题和它的重要性。这个话题还不清楚,没有足够的结论。交付是很困难的。目前没有迹象表明,准备或组织。提问观众接收只有最基本的,或没有反应。
- 0 -不尝试口头报告。

你不能刚从每一层循环相关的句子更精确的反馈?

确定,但然后你使它变成一个analytic-trait标题是指由于每个句子不同的在所有的水平标准。(跟踪每个句子在段落到较低水平,看到它的并行版本,看看每一段是由单独的特征。)不管你怎么格式- 1标题或很多只要真正不同的标准不同。

考虑到性能的有用的分解成独立的维度,为什么老师和状态测试人员经常整体得分与一个标题吗?

因为整体得分是更快,更容易,通常足够可靠,当我们正在评估一个通用技能快速写在状态测试(例如,而不是评估控制特定体裁的写作)。这是一个权衡,效率和有效性的困境。

你的意思是当你说上面题目可能影响有效性。为什么不是一个函数的任务或问题?

从分数有效性问题允许的推论。测试或任务不是有效或无效;基于特定的结果推断总体能力有效或无效。换句话说,从这个特定的写作提示,我试图推断,一般来说,你的能力作为一个作家。

假设,一个标题来判断故事写作独家强调拼写和语法准确性。分数可能会高度可靠,因为它是容易计算这些类型的错误——但它可能会产生无效的推断谁能真正写精彩的故事。它不太可能,换句话说,拼写的准确性与写的能力在一个吸引人的、生动的、一致的方式对一个故事的元素(大概的核心故事写作。)许多好拼写能力无法构建引人入胜的故事,和许多美好的人在学校表现很差,语法和拼写测试。

因此,你应该考虑,不仅性能任务的适当性的标题及其标准。5月评估准则,例如,学生只需要产生“组织”和“机械声音”写作。肯定不是一个足够好的写作的描述。下面的(,)。

这是关于性能的目的:写作的目标——是什么?调查吗?说话的吗?科学公正的项目?考虑到目标评估,然后专注于最有说服力的标准吗?我们确定最重要的和揭示维度的性能,考虑到标准最适合这样的结果吗?标题是否提供一个真正的和有效的方式对表演了吗?每一层的性能充分的描述符是建立在实际样品的性能不同的质量呢?这些问题和其他问题的核心标准建设。

如何妥善处理这些设计问题?

通过专注于性能即受欢迎的影响的目的,不仅仅是演员或表现的最明显的特征。太多的题目集中在表面特性,可能偶然的总体结果或目的是否实现。法官的数学解决问题,例如,往往过于关注明显的计算错误;法官的写作倾向于过分关注语法或机械错误。我们应该突出最直接相关的标准所需的影响基于任务的目的。

我需要一个例子。

考虑讲笑话。这个笑话可能涉及相关内容的观众,可能已被告知有良好的措辞和速度,和一些妙语的时机可能是固体。但这些只是表面特性。最根本的问题与目的:这个笑话好笑吗?也就是说,人们真的笑了吗?

但这与学者如何?

考虑以下impact-focused问题:

数学的解决方案可能是准确和全面,但问题解决了吗?

历史上纸可能是证据充分,条理清晰,无机械错误,但论点令人信服?的反驳和counter-evidence有效地解决吗?

这首诗可能押韵,但它让人联想起充满活力的图像和感受吗?

实验可能是彻底地写,但结论有效吗?

是至关重要的,学生学习的性能是有效的/成功的结果,而不只是善意的努力和/或模仿的格式和例子。

它是有用的考虑四种不同的标准:影响,过程,内容,波兰。标准应该是主要的影响。过程是指方法或技术。内容是指内容的合理性和准确性。波兰是指如何精心设计产品。花说:许多好的演讲者眼神接触和改变他们的球场,在抛光方面,当他们谈论正确的内容。但这些不是底线的标准好来说,他们只是有用的技术在试图实现的预期效果(如让观众参与)。影响标准与说话的目的——即我演讲的预期效果:我理解吗?我迷人吗?我有说服力吗? moving? — i.e. whatever my intent, was it realized?

这似乎对孩子发育怀疑!

不客气。你需要学习尽早并且经常有一个目的和观众在所有真正的性能。你越早学会思考的关键目的观众问题——我的目标是什么?什么是成功呢?观众和形势需求什么?我想导致最后?更有效的和自主你会作为一个学习者。这不是一个偶然海蒂的研究这种元认知工作产生一些最伟大的教育收益。

有没有简单的规则为更好的区分有效和无效的标准吗?

是-一个简单的测试:你能想象有人会上你提出的标准草案标准,但无法执行的任务,鉴于其真正目的或自然?然后是错误的标准。评估组织,例如,许多写作部分力学,准确-恰当判断分析文章主题。这些是必要但不充分;他们不去的心写作的目的——实现一些效果或者对读者的影响。这些可以满足更多surface-related标准但仍带来乏味和无趣的写作,因此他们不能最好的基础标准。

但是肯定正式和机械方面的性能问题!

当然,他们做的。但是他们不写作的时候,只是达到目的的手段,不一定是唯一的手段。作者的意图是什么?任何写作的目的是什么?它应该‘工作’或读者产生一定的影响。哈克芬恩的作品即使人物的书面讲话是不符合语法。写作的目的是一些结果;作者旨在完成一些响应——这就是我们必须更好地评估。如果我们评估分析写作我们大概应该评估类似的深刻见解,新颖、清晰和令人信服的性质的分析。真正的标准将从分析发现问题的答案的性能的目的。

注意,这些最后的四维隐式地包含了更为正式的机械尺寸,关心你:一篇论文不可能引人注目的和彻底的如果它缺乏组织和清晰。我们实际上希望看到的描述符低水平的性能处理这些事务的缺陷妨碍清晰或说服力。所以,我们不希望学习者注意到表面特性或特定的行为;相反,我们希望他们注意到好的结果相关的目的。

嗯?你意思区分具体的行为和标准?

最新的题目往往会高估波兰、内容和过程,并同时under-valuing的影响结果,如上所述。相当于让学生只关注表面特征而不是目的。它无意中告诉学生,服从指令比成功更重要(和导致一些人错误地认为所有题目抑制创造力和真正的卓越)。vwin.com德赢

目光接触的问题,上面提到的。我们可以很容易地想象或找到的例子好在这眼神不是:认为收音机!看一些TED演讲。我们可以发现沉闷的例子来说有大量的目光接触。任何技术是最好的作为“指标”主要描述符下标题,即有几个不同的例子或技术,可以使用倾向于帮助“交付”——但他们不应该是强制性的,因为他们并不可靠的标准或唯一的方法。

这是为什么有些人认为题目杀死创造力?

完全正确。坏题目杀死创造力,因为他们需求公式化的反应。好的题目需求巨大的结果,给学生使他们的自由。底线是:如果你在评估准则的信号,一个强大的结果是一个目标释放创造力和主动性。如果你要求的格式、内容和过程,忽视的影响,你抑制创造力和奖励安全枯燥无味的工作。

但它是如此主观判断的影响!

不客气。“组织”实际上是更加主观的和无形的质量表示比'让我参与整个时间'如果你想它。当你去一个书店,你在找什么书吗?主要不是“组织”或“力学”但是一些想要的对你的影响。事实上,我认为我们学生严重不公,让他们不断地提交(并获得高分数!)在无聊,沉闷的论文、报告和项目。它教导一个坏的教训:只要你把正确的事实,我不在乎你如何沟通。

我见过的最好的老师是老师在波特兰HS,缅因州波特兰,他孩子最迷人的学生口头报告我听过。你是怎么做到的?我问。很简单,他说。你有1的2年级:是的=使我们在我们的座位的边缘。没有=我们失去兴趣或无聊。

我们不应该评估技术、形式或有用的行为,然后呢?

我不是故意表明它是一个错误。给予反馈所有标准的类型是有益的。例如,在射箭可以恰当地渴望分数的立场,与弓技术,精度。立场问题。另一方面,终极的价值肯定性能与它的准确性。在实践中这意味着我们有理由为一个过程或方法,但我们不应该高估它看来,结果真的不重要。

你应该做什么,然后,当使用不同类型的标准,向学习者参加什么信号,为什么?

你应该减肥有效,而不是任意的标准。例如,我们经常同样重量不同的标准,我们使用(说,说服力、组织发展、力学的概念)- 25%。为什么?习惯或者懒惰。有效性要求我们问:鉴于目的和观众,标准应如何加权?编写良好的论文很少,真的是有趣的或照明不应得到高分,然而使用许多当前的写作部分,本文将因为承担相同的标准和影响不是通常得分。

除此之外基本观点有效分配权重的不同标准,权重可能会随着时间变化,表明你的期望作为一名教师适当改变一旦孩子写作,演讲,或解决问题的是有目的的影响。例如,精度在射箭时可以适当的价值只有25%得分新手,但100%得分箭术在竞争的表现。

鉴于这是多么复杂,为什么不直接说性能的水平之间的差异,如果6是彻底或清晰准确,等5是不彻底的,不太清楚或低于6准确吗?大多数题目似乎这样做:他们依靠大量的比较和评价语言。

唉,你是对的。这是一种逃避,完全无益的学习者。它最终懒惰只是使用比较语言;它源于未能提供一个清晰和精确描述的独特特性的性能在每个级别。和学生留下很弱反馈当题目严重依赖于这样的词“不到5”或“一个相当完整的性能”——并不比得到不同年级平装和一封信。

理想情况下,一个标题主要关注性能差异明显的和有用的经验;这样的教育评估,不仅测量。太多这样的题目最终norm-referenced测试伪装的,换句话说,法官不能仔细看看更微妙但重要特性的性能。纯粹的可靠性是不够的:我们需要一个系统,通过反馈可以提高性能。

比较以下摘录ACTFL社会研究的指导方针标题下面的观点:ACTFL归为丰富indescriptive语言提供了洞察每一层及其独特性。社会研究题目从来没有超出比较太多语言参考维度进行评估(注意每一个评分点之间唯一的区别是改变一个形容词或比较):

Novice-High:能够满足立即需要使用学到的话语…只能问问题或使语句合理的准确性,这包括短期记忆话语或公式。大多数话语是电报,和错误经常发生当单词结尾和动词省略或困惑…演讲特点是枚举,而不是句子。有一些规则动词的现在时形式的概念基于“增大化现实”技术动词,和一些常见的不规则动词…有一些使用的文章,表明性别的概念,虽然错误是常数和众多…

Intermediate-High:能够满足大多数生存需求和有限的社会需求。发展语言的灵活性生产虽然仍不均匀流畅。可以启动和维持一般的谈话关于事实的主题超越基本生存需求。可以给自传…可以提供零星信息,虽然不一致,简单的方向和叙述,过去和未来事件,尽管有限词汇语法范围和控制不足导致太多的犹豫和不准确…。有基础知识之间的区别吗爵士和会,虽然错误频繁的…。能控制大多数规则动词和不规则动词的现在时…。理解母语用于处理外国人,但仍有重复话语经常被公众理解。

比较这些丰富的描述符和特异性这个模糊的社会研究范畴从加拿大省级考试:

分数	得分描述符
(5) 异常	例子和案例研究选择相关,准确、全面发展,揭示成熟和深刻的社会研究内容的理解。
(4) 精通	或案例研究选择的例子是相关的,准确的,很明显发展,揭示一个固体社会研究内容的理解。
(3) 令人满意的	相关案例或案例研究选择和充分发达但可能包含一些事实错误。案例研究的发展/展现了一个例子足够的社会研究内容的理解。
(2) 有限的	的例子或病例选择,而相关的,含糊的或不完全的开发,和/或它们包含不准确。一个限制社会研究的理解。
(1) 可怜的	相关的例子,但最小的尝试已经取得了发展,和/或例子包含主要错误揭示缺乏了解的内容。

有什么区别的、牢固的、充分的理解?我们不知道从标题(回归本源之前帖子:找出的唯一方法是看示例论文锚题目)。

更糟糕的是,然而,当题目定性差异变成任意的定量差异。

你是什么意思?

“不太清楚”纸比“清晰”显然是不可取的纸(尽管这并没有告诉我们很多关于清晰或者不存在的东西是什么样子),但这是几乎从来没有有效的说一个好纸有更多的事实或脚注或参数比纸更糟糕。纸是永远不会更糟,因为它有更少的脚注;更糟的是,因为消息人士引用不合适或有启发性。一篇论文并不好,因为它是长的,但是因为它有话要说。有一个坏的诱惑根据容易构建描述符计算量而不是有效的品质。

因此标题应该总是描述在有形的“更好”和“差”,每个描述符中定性方面:具体什么使这个论点或证明比另一个好吗?因此,当使用比较语言来区分质量,确保至少相比是相对质量,不是相对任意数量。

这篇文章最初发表在格兰特的个人博客。