审核员工作指南
220428 v1.0
为了进一步确保SpaCE2022评测数据集的质量,现需要审核人员根据审核操作指南对标注人员提交数据进行质量审核,旨在及时发现标注中的问题,规范标注工作,提高标注一致性,进而提高标注数据的质量。该审核工作会根据需要进行,待大家标注一致性提高后,审核工作就停止。
参与者
标注员
小组长(标签为 manager)
审核员(标签为 inspector)
0、打开工作网址:https://2030nlp.github.io/Sp22Annotator/master ,填写姓名、密码。
1、数据刷新。
点击「只显示我管理的人员」按钮,可以屏蔽不由自己管理的人员,再次点击时恢复。
点击「xx 升序/降序」按钮,可对人员列表进行排序。
1、在人员列表中,可查看要审核的人员的信息,找到其中的「标注详情」按钮并点击,进入该人员的标注详情小窗口。
2、在小窗顶部区域,可查看该人员目前的通过率(含已审核数量)和标注进度。
3、在小窗顶部区域,可筛选要审核的任务类型及任务批次。点击「排序」后生效。
4、每次点击「排序」按钮,都可将已审核的条目排列到列表最上方,方便查看。
5、每个待审核列表的条目分为上中下三块,分别是:
① 任务信息,包括「task#id」按钮、任务批次,以及该任务的提交情况(已提交人数/总分配人数)。点击「task#id」按钮,可查看此任务更详细的信息。
② 语料信息,包括「entry#id」按钮、「📥」按钮,以及语料内容。其中,语料内容需点击「📥」按钮之后才会显示。点击「entry#id」按钮则可查看此语料更详细的信息。
③ 标注信息,包括「name 的标注 #id」按钮、「审批」按钮、「🔄」按钮、审批结果,以及一条或多条该标注的具体内容。
6、点击「审批」按钮,首先会触发对此条标注的刷新,待页面提示「执行成功」,方可进行后续操作。点击「审批」按钮后,审批结果区域会变为下述4个部分:
7、审批结果的颜色说明:
1、审核抽检率确定。
审核初期:抽检率不低于15%。例如,某一批次的条目一共40条,应该抽检6条以上。
审核中后期:抽检率不低于8%。
2、审核步骤。
一批次任务提交后,接到组长通知再开始进行审批,"否决"标注者选项时,务必在备注框中给出明确理由。
待标注员针对反馈进行修改提交后,审核员及时进行复审,直至本批次审核通过率为1。
3、审核周期。
3、审核员决定「通过」或「否决」时,遵循的原则是:
a. 如果自己很确定“正确答案”是什么,那就按照自己的“正确答案”判断:
b. 如果自己也觉得当前句子的归属不那么清晰,那就不干涉标注员的答案,直接"跳过",进行其他句子的审核。与此同时,记录一下这条语料的情况及不能做出明确判断的原因,及时反馈组长进行讨论。
c. 点击「entry#id」按钮,可以查看该语料对应两位标注员的标注结果(当且仅当两位标注员都完成了标注),综合两位的标注结果,进行审核。