阿里达摩院获中国法律智能技术评测两项冠军,参赛模型底座已在魔搭社区开放

电科技辛雯02-03 10:59

2月3日消息,由最高人民法院司改办和中国中文信息学会指导的中国法律智能技术评测(CAIL 2022)于日前公布比赛结果,阿里巴巴达摩院在八项任务中获得两个冠军,是唯一获得多项第一的参赛团队。据介绍,此次参赛使用的预训练大模型底座通义AliceMind-structBERT已在魔搭社区开放(https://www.modelscope.cn/models/damo/nlp_structbert_backbone_base_law/summary),该模型是法律AI领域首个亿级数据规模的大模型。

近年来,用AI辅助司法工作者提升案件处理的效率和公正性,逐渐成为法律领域的趋势。作为国内最权威的法律AI竞赛,CAIL已连续举办5届比赛。 据介绍,CAIL 2022设置了司法考试、事件检测、文书校对、类案检索、涉法舆情摘要、论辩理解、信息抽取、可解释类案匹配八项任务,共吸引2053支高校、企业和组织队伍参赛。最终,达摩院在众多参赛队伍中脱颖而出,获得文书校对和可解释类案匹配两项任务的最高分。

图片1.png文书校对任务成绩榜单

文书校对主要用于辅助司法人员检出并纠正法律文书中存在的错误,例如错别字、冗余、缺失、乱序等类型错误。此次比赛,达摩院采用了序列到编辑和序列到序列两种主流的模型结构,并且采用编辑级别投票的方式对二者进行集成,其可以尝试将错误的句子翻译成正确的句子,同时对错误位置进行插入、修改、删除等编辑动作。此外,为解决训练数据不足的问题,达摩院还采用数据增强的方法生成了大量的训练语料,有效提升模型的纠错能力,最终该模型以81.759分的成绩获得第一。

 图片2.png可解释类案匹配任务成绩榜单

可解释类案匹配可以为待决案件的裁判提供参考和依据。参赛队伍需要针对系统给定的两个案件信息,来判断两个案件是“匹配”、“部分匹配”还是“不匹配”关系。达摩院基于法律特征句,构建了句-段-案件的类案匹配体系,最终判断出案件匹配程度,而其中的句子和段落则可成为类案匹配的依据,从而达到模型的可解释性。并且对案件匹配任务进行了细粒度的拆解,针对不同匹配性质选用不同文本输入,有效提升模型匹配的鲁棒性。最终总成绩为0.801,位列第一位。

目前,达摩院在法律AI领域已发表数十篇国际顶会论文,团队辅助研发的AI法官助理“小智”已在浙江省高院、黑龙江高院等法院上线应用,可将简单案件庭审效率提升50%以上,已辅助审理案件超10000件。

电科技(www.diankeji.com)是一家专注于全球TMT行业的领先资讯媒体。

作为今日头条青云计划、百家号百+计划获得者,2019百度数码年度作者、百家号科技领域最具人气作者、2019搜狗科技文化作者、2021百家号季度影响力创作者,曾荣获2013搜狐最佳行业媒体人、2015中国新媒体创业大赛北京赛季军、 2015年度光芒体验大奖、2015中国新媒体创业大赛总决赛季军、2018百度动态年度实力红人等诸多大奖。

投稿、商务合作请联络微信公众号

声明:本站原创文章文字版权归电科技所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表电科技立场,图文版权归原作者所有。如有侵权,请联系我们删除。

//59087780b049bbb54ef4ba547ea51910