有效性和符合性评估

本页所载的资料仅供一般参考之用,并不能代替专业的法律意见。

本页面概述了Vervoe开发符合高有效性标准的评估的过程,以便雇主能够理解评估如何符合他们的合规要求。Vervoe评估是根据这一流程创建的,以确保所有测试和人工智能评分减轻歧视或不公平的评估做法。

在这个页面:

平等就业机会委员会的具体信息


在美国,平等就业机会委员会(EEOC)提供了指导,帮助公司减轻在雇用前和挑选雇员的测试和其他甄选程序方面的歧视性做法。这些指引旨在澄清法律规定,包括:

  • 1964年《民权法案》第七章(经1972年《平等就业机会法案》修正)
  • 《美国残疾人法》第一篇
  • 《就业年龄歧视法案》

本页面的信息概述了Vervoe如何进行评估创建和使用,以确保对特定群体没有不同的影响,是与工作相关的,符合业务需要。

评估创建


Vervoe采用了一种标准化的流程来创建不同行业和角色类型的技能评估。我们的流程确保Vervoe的评估严格遵循上述标准化程序。所有评估都以技能为重点,并通过Vervoe平台进行在线管理。这确保了每个考生都有相同的机会参加考试,使用相同的指导、程序和时间限制(如果适用),以保持跨角色、组织和评估的考试条件一致。

Vervoe评估在创建时考虑了以下信息:

  • 识别完成工作所需的关键技能。分析相关的工作材料,包括工作和职位描述,以确定在角色中成功的技能和属性。在适用的情况下,Vervoe咨询组织中的关键人员,并进一步分析关键绩效指标和技能矩阵。这一过程确保了每个评估都包括候选人需要执行的技能。
  • 咨询专家。为了创建定制的评估,Vervoe涉及到来自您组织内部或市场更广泛领域的主题专家。通过咨询,我们开发与技能相匹配的特定内容,并在角色的背景下。在技术评估方面,Vervoe与主题专家合作进行内容创建和验证。
  • 业务成果。为我们的客户创建的所有定制评估都与相关和关键的业务结果直接相关。这是一个迭代过程,以确定在招聘过程开始时使用的评估的预测效度。
  • 质量保证.在发表之前,所有的评估都由Vervoe的内部评估和I/O心理学团队进行审查。如果评估是专门为您的组织创建的,那么您的相关主题专家将在使用前大量参与质量保证和批准过程。

Vervoe专有的人工智能根据考生与该平台的互动情况,以及他们如何进行评估以及对每个问题的回答,对考生进行评分。考生的背景、教育、地理位置、性别、种族或任何其他个人因素都不会被软件所知道,因此,在评分时也不会考虑。唯一被分析的因素是一个人回答问题的能力,因此,扮演这个角色的能力。

此外,Vervoe还设有质量保证检查,如果人工智能识别出人工评分存在偏差的可能性,数据科学团队就会将其暴露出来并进行调查。如果发现有违规,评分将会调整。这是Vervoe实施的另一项措施,以减少评估和招聘过程中存在偏见的可能性。

我们的流程确保每一次评估都适当地测试了执行角色所需的相关技能(技术和软技能),并且可以在每次创建新的评估时进行复制。

评估有效性


简介:

  • 任何直接模拟一个人在工作中所做的事情的测试都可以被认为是“有效的”。
  • 个性和软技能测试的风险更大,即使它们得到了“认可”,因为它们往往缺乏符合平等就业机会委员会要求的适当认可。
  • 积极的候选人经验和感知到的公平是两个主要原因,为什么技能测试是一种有效和便利的招聘实践。

概述


在雇佣应聘者之前对他们进行测试的价值在于,这是一种评估他们是否适合这份工作的权宜之计。然而,基于测试做出的决策不可能比测试提供的信息更好,这使得测试能够准确地表示它所表示的构造非常重要。

然而,这有点困难,因为被评估的结构,如知识、技能、态度和认知过程,不能客观地知道,必须进行推断。为此,有许多统计测量方法用于评估测试的可靠(一致)和有效(准确)程度。

有许多类型的心理测量效度,它是一个罕见的测试(如果有这样的存在),击中每一种类型。在寻找适合工作的测试中,有几种不同类型的有效性是特别相关的,不仅要确保招聘人员是一个好员工,还要确保符合平等就业机会委员会的规定。

建立Vervoe评估的有效性


评估的有效性有多个类别,我们的行为科学团队在创建Vervoe的所有评估时都关注这些类别:

表面有效性

这个测试看起来像是在评估它声称要测量的东西吗?
面部效度是效度的最基本形式,它要求人们达成共识,即参加测试的人需要展示测试所评估的构念。例如,一组数学问题被用来评估运算能力已经比一组词表面有效性问题,因为后者正在评估相结合的算术技能,阅读理解(这意味着测试是评估算术技能在一个特定环境中,但不是一般),等等。对于某些类型的技能测试,这是可用的主要有效性类型,有时是测试首次创建时唯一可以获得的有效性类型。

一般来说,这类技能测试要求应聘者从事的任务,理论上任何人都能完成。只要任务反映了个体为了正确完成工作而需要完成的活动,这些问题就具有表面效度,并且符合平等就业机会委员会的要求。

也就是说,公司应该始终注意不要对特定人群产生“不成比例的影响”,因为这可能表明测试存在问题。例如,如果人口统计学A的成员中只有75%的人通过了测试,而其他人口统计学的成员有93%通过了测试,那么该测试可能仍然符合平等就业机会委员会的要求,但必须进行调查。

实践中的表面效度
对呼叫中心代理的评估可能会有关于如何管理电话上愤怒的客户的问题——这将具有很高的表面有效性。相比之下,如果呼叫中心的代理被要求完成财务建模任务,候选人就会不知道这与职位有什么关联。这将具有较低的表面效度。

我们的所有评估都是针对特定的工作角色设计的,只包括与该职位相关的问题,在您的组织背景下,确保所有评估具有高的表面效度。

内容效度

测试是否涵盖了它应该测量的结构的全部范围?
内容效度指的是一个给定的测试是否涵盖了它所测量的结构的全部范围的具有代表性的样本。对于工作测试,效度的问题应该集中在这一点上。除了确保问题似乎是关于主题相关职位(表面有效性),一组(一组)的问题需要评估范围足够的任务,以便评估者可以知道答案的描绘个体是否能做的任务所需的工作。

只要一组问题提供了一个具有代表性的样本,候选人将需要做的工作,并能正确地做这项工作的人肯定能提供可靠的答案的问题,问卷具有内容效度,并符合平等就业机会委员会。(再次强调,重要的是要意识到不成比例的影响的可能性,并准备好改变任务,如果你看到一个特定的人口统计得分低于另一个。)

实践中的内容效度
继续我们前面的例子,如果呼叫中心代理只回答与处理愤怒的客户有关的问题,那么这个评估的内容有效性就会很低,因为这个角色还有许多其他方面。然而,如果评估的重点是成功执行该角色所需的多种技能,如纠纷解决、客户服务、销售和多任务处理,该评估将具有很高的内容效度,因为它涵盖了工作所需的任务范围。

我们的团队与您组织的专家进行协商,以了解角色的关键组成部分,并确保每次评估的高内容有效性。通常我们的团队会与您组织中对工作有深刻理解的人紧密合作。这个过程可能包括与该角色的经理或员工1:1的会议,了解该角色的挑战,高绩效人员的属性,以及需要发展的领域。

我们要求获得职位描述、培训材料、广告和绩效指标,以充分了解工作需要什么,因此,什么应该包括在评估中。从这项研究和调查中,我们努力包括成功执行角色所需的至少3 - 4个关键技能,以确保评估包含正在评估的完整结构,并涵盖工作的各种元素。

这样,你就可以相信那些在评估中得分高的候选人更适合这个职位,也可能表现得更好。

建构效度

这个测试真的测量了它声称测量的基于理论的结构吗?
在招聘中,构念效度对那些不直接评估将在工作中使用的知识和技能的测试有最大的影响。更确切地说,它是关于确定,比如说,对细节的关注(“软技能”的一个例子)或外向性(性格特征)的测试是否真的表明这个人具有所指示的特征。当人力资源人员问一个测试是否“有效”或“心理测量效度”时,这通常是他们所谈论的。

但是,当涉及到工作中直接使用的技能测试时,结构效度的相关性远不如面孔效度和内容效度。

然而,一般认知能力和/或人格测试绝对需要有构效度才能符合平等就业机会委员会,因为它们与成功完成工作的实际任务间接相关。为了使人格或“软技能”测试有效,它必须评估一个理论结构,这个理论结构的存在可以通过回顾科学文献进行辩护,而且统计数据必须表明,测试问题确实一起工作,以描述一个连贯的结构。

预测/外部有效性

我们从测试中获得的信息是否能预测/适用于其他情况?

预测/外部效度是关于测试是否能预测未被直接测试的领域的表现。即使测试可能具有上述类型的效度,在上下文无关的方式下测试的任务和在工作的上下文中执行实际任务之间仍然存在差异。如果一家公司要使用测试,那么证明这个测试能预测出员工在工作上的出色表现和/或与公司/团队的良好配合总是有帮助的。对于一个肯定会在工作中使用的技能测试,预测效度是非常有用的,但在技术上不是必需的,对于EEOC的依从性。但是,对于任何其他类型的测试,这对公司来说都是至关重要的,他们必须在自己的公司内部运行这些数据。

最重要的一点是要认识到预测效度不会在公司之间转移。如果一项研究证明,Test a可以预测十大咨询公司的高绩效,那么这对四大会计师事务所一点帮助都没有(尤其是当他们不得不在与平等就业机会相关的诉讼中为自己辩护时)。例如,如果你不能证明个性测试能区分公司的高绩效员工和低绩效员工,那么它又有什么用呢?

不幸的是,大多数测试不能做这样的事,部分原因是大多数人运行测试的预测效度这样做只是为了证明一个特定的组合——他们不能做什么工作,然而,证明它是最好或唯一的组合工作(这可以做到,但它是非常困难的,很费劲的去做)。反过来,这意味着他们还没有真正证明其他分数应该导致人们被拒绝,这可能是有风险的,并可能导致公司错过出色的人才。

此外,一个给定的公司只有在使用了一段时间并测量了在职表现之后,才能证明一项测试具有预测/外部效度,这意味着公司最初不能假设这些工作成功的间接衡量是有效的。

实践中的预测/外部效度
Vervoe的评估已经被证明对我们的客户具有预测效度。例如,在一个组织中,使用Vervoe评估的应聘者比销售目标高出4%。另一项研究表明,Vervoe的员工在呼叫中心职位上获得了更高的客户满意度得分。

技能评估的有效性和符合性


在招聘过程中使用基于技能的测试的主要价值之一是,在测试项目和工作中将要执行的任务之间有一个明确的对应关系。因此,技能测试同时具有表面效度和内容效度,符合平等就业机会委员会的要求。此外,在雇主花时间评估候选人的申请材料之前,这些测试可以方便地显示出哪些候选人名义上有能力胜任这份工作。相比之下,对未来工作表现的间接测试,如性格测试和一般认知能力和/或“软技能”的评估,需要广泛的评估,以确认构建和预测/外部有效性,这使它们成为一个风险更大、更不适宜的举动。

然而,在所有情况下,雇主都必须密切关注业绩的人口统计学差异,并在发现重大差异时立即展开调查。在Vervoe,我们一直在监控我们的测试,以确保候选人参加的是一个公平的测试,评估他们将用来把工作做好的技能。还有一个额外的好处是,许多公司发现,采用公平的考试还会产生更多样化的入围名单,这更能代表世界上存在的广泛人才群体。

虽然个性和认知评估很难在招聘过程中得到验证,但它们可以帮助新员工适应新环境,并根据他们的独特之处对他们进行培训,这可以让他们有一个平稳而有力的开始。但是,最重要的是候选人的经历。愉快的候选人的经验,结合感知过程是公平(连同测试实际上是公平!),是最好的方式,以确保候选人不仅将展示他们的能力,公司的公司但有积极的观点无论招聘过程的结果。

减少偏见

Vervoe的评估严格遵循上述标准化程序。所有评估都以技能为重点,并通过Vervoe平台进行在线管理。这确保了每个考生都有相同的机会参加考试,使用相同的指导、程序和时间限制(如果适用),以保持跨角色、组织和评估的考试条件一致。

Vervoe专有的人工智能根据考生与该平台的互动情况,以及他们如何进行评估以及对每个问题的回答,对考生进行评分。考生的背景、教育、地理位置、性别、种族或任何其他个人因素都不会被软件所知道,因此,在评分时也不会考虑。唯一被分析的因素是一个人回答问题的能力,因此,扮演这个角色的能力。

评估中的所有问题都是根据每位考生的情况来写的;无论背景、种族、性别、教育或宗教,都可以公平回答,如果他们具备相关技能,就没有差别待遇或影响。

客户使用Vervoe评估的责任

客户有责任确保他们的评估符合平等就业机会委员会的指导方针,并将筛选过程中的差异影响或任何潜在歧视最小化。

Vervoe不承担由个人雇主创建的评估的责任,也不支持根据应聘者的工作能力以外的因素对其进行有意筛选的评估。

雇主有责任根据《美国残疾人法》或其他同等法律的要求,为提出要求的候选人提供替代的筛选方法。

使用Vervoe既定评估的雇主理解将评估作为筛选过程的一部分的局限性,并同意仅使用适合被聘用职位的评估。

此外,雇主必须确保所有的评估都符合平等就业机会委员会关于公平和公正招聘的指导方针