“AI+金融” 计算机视觉入门与实践课程技术考核:手写体 OCR 识别

主办方: AI 人才特训营 - 当前服务器时间 十一月 22, 2024, 9:16 a.m. UTC+8
参赛提交

上一阶段

考试
四月 18, 2022, 8 a.m. UTC+8

当前阶段

考试
四月 18, 2022, 8 a.m. UTC+8

终止阶段

Competition Ends
六月 1, 2022, 8 a.m. UTC+8

考核注意事项:

1. 欢迎你来到考核,这证明你已完成了课程所需的必修内容,并有充足的信心来完成接下来的挑战

2. 请你首先点击页面上的「参赛提交」标签,你会看到要求你勾选一项用户协议并报名,请点击注册完成报名。这是系统默认必须完成的操作

3. 接下来请同学们回到「比赛详情」这个标签下,你会在左侧面板看到有一项 baseline 的标签,请点击它

4.在 baseline 页面里,你可以下载到本考核题目的基线程序(你可能在学习最后一节必修课程时已经下载了)

5. 你的任务就是利用这个基线程序,完成这个考题的任务,并达到至少「admin」账户的分数

6. 当你用模型跑出结果了,请记得将结果文件按照下方的要求命名,并直接将文件压缩为 ZIP 包,确保 ZIP 包解压后直接能够得到该文件而非有文件夹的嵌套。

7. 你此时可以在此点击「参赛提交」,并在左侧面板找到「submit」标签

8. 在 submit 页面,你会看到右侧有一个长条的submit按钮,点击它选择你的压缩包上传

9. 正常情况下,此时你在按钮下方会看到你的压缩包已经上传,并且点击「刷新按钮」会看到状态从submitting - submitted - running - finished

10 你也可以不用去手工刷新,可以直接点击上方的「排名结果」标签,你会看到本考核的成绩榜单

11 现在找到你的名字,看看你的分数有达到或者 admin 吗?没成功,可以再尝试,反复提交!

 

一、任务描述

本次考核将提供手写体图像切片数据集,要求建立模型通过识别技术,获得对应的识别结果。即:

输入:手写体图像切片数据集

输出:对应的识别结果

 

二、数据描述

1. 训练集:8 千张图像,包含年份、金额2种信息

2. 测试集:2 千张图像 

3. 原始手写体图像共分为三类,分别涉及银行名称、年月日、金额三大类,分别示意如下:

4. 相应图片切片中可能混杂有一定量的干扰信息

三、提交要求

1. 识别结果 JSON 在训练集中的格式如下:

json 文件内容规范:

{

  "image1": "陆万捌千零贰拾伍元整",

  "image2": "付经管院工资",

  "image3": "",

  ...

}

2. 结果提交的内容和要求:

本平台要求所有提交内容统一打包为 zip 文件上传(请参见「参赛提交」tab下「下载」板块提供的提交样例),其内包含:

 

模型输入测试集后输出的结果文件,文件格式统一为json,名称必须统一为answer.json

 

json 文件内容规范:

{

  "image1": {

      "result": "陆万捌千零贰拾伍元整",

      "confidence": 0.94

  },

  "image2": {

    "result": "付经管院工资",

      "confidence": 0.96

  },

  "image3": {...},

  ...

}

其中,image对应每一张图片,result对应识别结果,confidence对应其置信度。

 

评价方式

通过漏检率、误检率、AP 值三项指标衡量人工智能算法应用效果,采用的计算公式如下:

算法评价值 = AP值*40% + 检出率*30% +(1-误检率)*30%

(1)检出率

计算公式如下:

http://www.aiinnovation.com.cn/updatafile/upfile/20210803/20210803181209_%E5%BE%AE%E4%BF%A1%E5%9B%BE%E7%89%87_20210803181151.png

其中,T为验证图片中标注为目标类设备总个数;

M1为参赛队伍实际检测出来且正确的目标类设备总个数。

(2)误检率

计算公式如下:

http://www.aiinnovation.com.cn/updatafile/upfile/20210803/20210803181225_%E5%BE%AE%E4%BF%A1%E5%9B%BE%E7%89%87_202108031811511.png

其中,M2为参赛队伍实际检测出来的目标类设备总个数(含正确和错误)。

(3)AP值

AP值为准确率-召回率曲线面积,按VOC标准计算。巡检影像在0.5IoU条件下计算AP值。其中IoU为识别框与标注框的重合度指标,按如下公式计算:

http://www.aiinnovation.com.cn/updatafile/upfile/20210803/20210803181237_%E5%BE%AE%E4%BF%A1%E5%9B%BE%E7%89%87_202108031811512.png

 

 

1. 本考核不限制单天的提交次数

2. 请用报名课程的账号完成分数提交

3. 分数达到基线后,会有一定延迟来判定是否通过考核

4. 考核通过后,证书发放等事宜请等待通知

 

1. baseline 的获取地址为 https://aistudio.baidu.com/aistudio/projectdetail/2612313

2. 你可以在 aistudio 上注册账号,利用其线上免费算力完成你的考核

3. 你也可以在左侧面板找到合作工具 devcloud,在 devcloud 完成注册,利用其完成考核

 

 

我们推荐你通过 Intel DevCloud 平台利用其线上环境和算力完成本竞赛的建模

DevCloud:http://devcloud.intel.com/

 

 

 

 

 

考试

Start: 四月 18, 2022, 8 a.m.

概述: 尝试根据 baseline 的讲解,对 baseline 程序调优,提高分数吧!

比赛结束

六月 1, 2022, 8 a.m.

请登陆来参加比赛

登入
# 用户名 分数
1 mambashunli 0.984
2 moonquakes 0.982
3 Kanzaki 0.965