关于发布2020年安徽省大数据与人工智能应用竞赛赛项规程的通知
各有关高校:
按照《安徽省教育厅关于进一步规范老员工学科和技能竞赛管理的意见》(皖教秘高〔2020〕67号)要求,由大赛组委会提交的《2020年安徽省大数据与人工智能应用竞赛赛项规程》,经安徽省老员工创新创业教育办公室审定通过,现将赛项规程予以公布。大赛组委会要严格按照规程开展各项竞赛组织工作。请各高校按照规程要求,积极组织符合条件的员工参赛。
安徽省老员工创新创业教育办公室
2020年9月9日
2020年安徽省大数据与人工智能应用竞赛
赛项规程
一、竞赛名称
中文名称:安徽省大数据与人工智能应用竞赛
英文名称:Anhui Big Data and Artificial Intelligence Application Competition
竞赛组别:本科组、高职组
二、竞赛组织机构
主办单位:安徽省教育厅
承办单位:安徽工业经济职业技术学院、合肥工业大学、合肥学院
(一)组织委员会
主 任:
储常连 安徽省教育厅副厅长
执行主任:
梁 樑 合肥工业大学董事长
副主任:
梁祥君 安徽省教育厅高教处处长
陈小军 安徽工业经济职业技术学院经理
委 员:
朱永国 安徽省教育厅高教处副处长
李军鹏 合肥工业大学本科生院副经理、创新创业教育处处长
胡学钢 教育部大学计算机类专业教学指导委员会委员
佘 东 安徽工业经济职业技术学院计算机与艺术学院经理
夏 娜 合肥工业大学计算机与信息学院(人工智能学院)副经理
薛 峰 合肥工业大学软件学院副经理
(二)专家委员会
主 任:
王 浩 教育部大学计算机课程教学指导委员会委员、合肥工业大学教授
委 员:
朴松昊 哈尔滨工业大学教授
韩江洪 合肥工业大学教授
岳丽华 中国科学技术大学教授
郑利平 合肥工业大学教授
张润梅 安徽建筑大学教授
孟 浩 安徽农业大学教授
钟秋波 宁波工程学院教授
高先和 合肥学院教授
(三)仲裁委员会
主 任:
孙怡宁 中科院合肥物质科学研究院研究员
委 员:
郑召丽 合肥工业大学纪委办公室副主任
关 柯 《模式识别与人工智能》编辑部主任副研究员
(四)秘书处
秘书长:
胡学钢 教育部计算机类专业教学指导委员会委员、合肥工业大学教授
秘书处办公室设在合肥工业大学计算机与信息学院
三、竞赛目的
本竞赛致力于推动安徽省各高校大数据与人工智能相关专业的建设,培养安徽省老员工大数据与人工智能技能、数据科学思维、实践能力和协作能力,提高老员工的大数据与人工智能的创新创业能力,以适应大数据与人工智能技术应用领域快速增长的人才需求。
四、竞赛内容
1.竞赛分组
本次竞赛分为“本科组”和“高职组”。本科组竞赛内容分为大数据平台部署、大数据预处理、大数据分析、大数据可视化、人工智能技术应用以及综合应用等;高职组竞赛内容分为大数据平台搭建、运维与优化、语言代码处理、大数据工具使用、大数据处理及分析、人工智能技术应用以及文档编写等。
2.竞赛方案
参赛选手首先在指定的时间内参加初赛(网络赛),初赛规则:参赛队伍在规定时间内,登录竞赛平台,根据平台内的预选赛题目在参赛队本地机器上部署环境并完成相应操作(组委会提供竞赛需要的镜像环境,参赛队也可以使用自己的环境);大赛工作人员会分布在每个学校内,对初赛进行网络直播,同时维护比赛现场秩序。比赛结束,参赛队伍按照题目要求将运行结果截图保存到文档,并将最终答题文档提交到竞赛平台。
经过初赛预选后,成功晋级的队伍将参加网络决赛,每队在自己学校内进行比赛,每队拥有三台计算机,在规定的时间内,参赛队根据题目要求完成竞赛内容,大赛工作人员会分布在每个学校内,对比赛进行网络直播,同时维护比赛现场秩序,答题结束,按照题目要求将运行结果截图保存到文档,并将最终答题文档提交到竞赛平台。
五、竞赛方式
本次竞赛采用初赛(网络赛)+决赛(网络赛)的形式。
六、竞赛流程
2019年11月,召开专家(由专家组遴选,组委会认定)会议对比赛内容及形式进行遴选并确认。2020年8月召开竞赛规则研讨和赛前教练会,并在比赛官方网站上进行报名。2020年9月举行初赛,2020年10月举行决赛。
七、比赛赛题
本科组竞赛赛题涵盖大数据平台部署、大数据预处理、大数据分析、大数据可视化、人工智能技术应用以及综合应用,具体包括:
大数据平台部署:参赛选手根据题目要求完成大数据平台的部署,包括但不限于Hadoop、HBase、Hive、Spark、Zookeeper、Sqoop等,并能够根据要求对部署的平台参数进行调整以及测试平台可用性。
大数据预处理:参赛选手根据题目要求对给定的数据(数据可能不完整、不一致、重复、含噪音等)进行预处理,使得数据准确、完整、一致、可用,并能够对数据格式进行转换。
大数据分析:参赛选手根据题目要求在已搭建好的大数据平台上进行数据的分析。
大数据可视化:参赛选手根据题目要求对给定数据进行可视化展示,并能对可视化结果进行解释说明。
人工智能技术应用:参赛选手根据题目要求完成人工智能算法的调用以及特征,并能够根据要求对算法选用进行评估。
综合应用:对给定的数据集,参赛选手综合应用大数据预处理、大数据分析与挖掘等技术,求解一个给定的问题。
高职组竞赛赛题涵盖大数据平台搭建、运维与优化、编程及大数据工具使用、大数据处理及分析、人工智能技术应用以及文档编写,具体包括:
大数据平台搭建、运维与优化:在试验机部署Hadoop、SPARK集群;实现HIVE,Hbase数据库部署,并实现数据存储;实现其他大数据组件部署,并实现相关功能。
编程及大数据工具使用:使用python、java语言实现数据爬取(数据抽取)、数据字段梳理、数据去重、数据统计分析;使用数据分析工具实现数据抽取、数据字段梳理、数据去重、数据统计分析;
大数据处理及分析:根据竞赛题目,实现数据源获取(数据清洗、数据统计、数据挖掘、数据展现;利用提供的D3.js、Echarts、大数据BI分析工具、python相关图形库等方式进行多种方式的可视化展现。
人工智能技术应用:参赛选手根据题目要求完成人工智能算法的调用以及特征,并能够根据要求对算法选用进行评估。
文档编写:编写数据分析方法文档和数据分析结果文档。
八、竞赛规则
1. 报名资格和要求
比赛以队为参赛基础,每支参赛队由1-3名参赛员工(队员)和1-2名指导教师组成。参赛学校可另设领队1名(可由指导教师兼任)。领队和指导教师必须是参赛学校的在职教师,本科组参赛队员必须是参赛学校的在读本科生、研究生,高职组参赛队员必须是当年度参赛学校的专科生。同一教师指导的队伍总数不得超过4支,其中作为第一指导老师不得超过2支。员工参与比赛可以无指导教师。每个学校报名参加初赛队伍不限,每个学校初赛成绩最好的队进入决赛,其余名额将依据初赛成绩在参赛队伍中选拔,决赛队伍数为60支,每个学校不超4支队伍。
为保证竞赛公平公正,竞赛组委会、专家委员会、仲裁委员会成员、秘书处成员及竞赛相关工作人员不得作为参赛指导教师。参赛队员是否符合本规则关于学历的规定,由竞赛组委会负责解释。
参赛学校必须提前通过竞赛组委会指定的网络报名系统向组委会报名注册,并在决赛时提交由参赛学院及以上部门盖章的参赛承诺书,不接受个人报名。
2. 赛前准备
赛前开展比赛规则研讨,并对比赛规则进行进一步解读。各参赛队伍师生依据比赛规则和要求进行比赛准备。
3. 竞赛期间
参赛队必须在指定的位置就坐和操作指定的计算机。
参赛队员可以携带诸如书、手册、程序清单等参考资料。
参赛队员不能携带任何可用计算机处理的软件或数据(不允许任何私人携带的U盘、磁盘或计算器)。
参赛队员不能携带任何类型的通讯工具,包括无线电接收器、移动电话。
在竞赛中,参赛队员根据题目要求完成相关工作,参赛队员不得和竞赛组委会指定工作人员以外的人员交谈,现场工作人员只能回答和处理与平台系统相关的问题。
参赛队员出现妨碍比赛正常进行的行为,诸如擅自移动赛场中的设备,未经授权修改比赛软硬件,干扰他人比赛等,取消其参赛资格。
竞赛的预定时间为4小时,但当竞赛进行一定时间后,竞赛专家组可以因为出现不可预见的事件而调整比赛时间长度,一旦比赛时间长度发生改变,将会以及时并且统一的方式通告所有参赛队员。
4. 成绩公布
竞赛结束后,由竞赛评测专家(由专家组遴选,组委会认定)进行评测,最终成绩将在大赛官网进行公示。公示无异议后,上报安徽省老员工创新创业教育办公室,并在高教网再次进行公示。待公示期满后,颁发获奖证书。
九、竞赛地点和环境
决赛地点定于安徽工业经济职业技术学院,参赛队员根据竞赛要求,使用指定的竞赛用电脑和竞赛平台。
操作系统:Centos
编程语言:Python、Java。
Python语言开发环境采用PyCharm,Java语言开发环境采用Eclipse。
十、成绩评定
大数据与人工智能应用竞赛(本科组)评分标准如下:
竞赛内容 | 竞赛考核要求 | 成绩占比 |
大数据平台部署 | 根据要求完成大数据平台的部署,并能够对部署的平台参数进行调整以及测试平台可用性 | 10% |
大数据预处理 | 对给定的数据(数据可能不完整、不一致、重复、含噪音等)进行预处理,使得数据准确、完整、一致、可用,并能够对数据格式进行转换 | 20% |
大数据分析 | 在已搭建好的大数据平台上进行数据的分析 | 20% |
大数据可视化 | 对给定数据进行可视化展示,并能对可视化结果进行解释说明 | 15% |
人工智能技术应用 | 根据题目要求完成人工智能算法的调用以及特征理解,并能够根据要求对算法选用进行评估 | 20% |
综合题 | 对给定的数据集,参赛选手综合应用大数据预处理、大数据分析与挖掘等技术,求解一个给定的问题 | 15% |
大数据与人工智能应用竞赛(高职组)评分标准如下:
竞赛模块 | 竞赛考核内容 | 成绩占比 |
大数据平台搭建与运维 | 搭建分布式hadoop平台,hdfs,hbase,hive,spark模块,并测试可用性,对参数进行调整,实现优化目标;对提供的文件和部分数据,采用相关hadoop和spark命令和算法包,进行处理;hdfs,hadoop计算包,sqoop命令转换,hbase相关数据查询和处理,hive数据查询和处理,spark计算语法和处理 | 25% |
编程 | 对比赛数据进行爬取,去重,清洗,统计(对提供样本目标进行爬取,去重,清洗和统计);对提供的样本数据进行排序,二次排序,平均值,分类统计计数,join联接,倒排索引等基本算法分析,并完成其他要求的统计分析;从基础数据开始自行设计完成一个完整的项目分析过程 | 25% |
数据可视化 | 根据环境提供的通用python图形库,echart库,d3.js库,BI工具等实现如下内容: 数据静态分析可视化:利用提供平台对数据进行静态分析得到相应的分析结果,并进行数据呈现的解释 数据动态展示可视化:利用提供的平台和框架进行可选择动态变化数据源的动态展示,或者实时图形分析展示 自由可视化题:提供一个已完成的数据,重点综合利用可视化的设计学只是,选择怎样的可视化,更加直观和可行,并进行分析 | 25% |
人工智能技术应用 | 根据题目要求完成人工智能算法的调用以及特征理解,并能够根据要求对算法选用进行评估 | 20% |
数据分析文档编写 | 将比赛中涉及到的要求的分析部分,按照合理的方式对分析方法,分析流程和分析结果进行适当的分析。 | 5% |
十一、奖项设定
本次竞赛以初赛有效参赛队伍的数量为基数,按决赛参赛队成绩排序,分别设置一等奖(不超过基数10%)、二等奖(不超过基数20%)、三等奖(不超过基数30%)。
十二、疫情防控措施及安全要求
1. 疫情防控
鉴于今年的特殊情况,组委会、参赛院校、参赛队所有成员在竞赛期间必须遵守各级政府和所在学校的疫情防控要求。
组委会按照安徽省教育系统新冠肺炎疫情防控工作相关文件精神,结合安徽工业经济职业技术学院疫情防控方案,制定相应竞赛防控方案。整个赛事期间,参赛选手无须到现场。组委会根据需要,在作品评审环节,采用线上或线下的形式开展工作。
各参赛学校、参赛队在初赛、决赛等环节,必须严格做好疫情防控工作,如无必要,不得开展大规模人员聚集的相关活动。确需开展小规模线下活动,必须按照相关防控要求向所在学校疫情防控机构报备,活动期间按照要求佩戴口罩、人员之间保持一米以上距离。各参赛队不得以竞赛特殊需要为借口,违反疫情防控相关规定。
一旦发现参赛队员、指导老师违反疫情防控规定,将取消该作品的参赛资格,并将情况通报所在学校;组委会相关工作人员、评委等必须严格遵守疫情防控规定,确保赛事的顺利进行。
2. 比赛环境
竞赛场地(含机房、体育馆、多媒体教室等)用电应报备学校后勤管理部门,赛前会针对竞赛场地电线路进行检查,充分保障场地用电安全。同时配备后勤管理机动人员1名,用于竞赛过程现场用电安全维护。
3. 组队责任
参赛院校必须安排一名领队负责参会师生的人身安全。各校指导老师应充分保证员工安全,指导员工训练,引导员工以正确的心态参加竞赛,营造良好的参赛氛围。
4. 应急处理
比赛期间赛场设备若发生技术故障或其他紧急情况,发现者应第一时间报告赛项组委会,同时采取措施避免事态扩大。赛项出现重大安全问题可以停赛,是否停赛由赛项组委会决定。
5. 处罚措施
竞赛期间对于不能严格执行竞赛规则,违反竞赛规定的参赛队员取消及参赛资格及成绩,并禁止参加下一年度的比赛。
十三、竞赛须知
1. 参赛队伍、参赛指导教师、领队须知
各参赛队需凭参赛证件进入比赛现场;各参赛队在决赛时需要提交学校教务部门或院系以上单位的推荐意见(需签章);参赛学校领队对报名资料的真实性和参赛指导老师、员工排序负责。
指导教师熟悉竞赛规程,为参赛队伍提供指导;指导教师及领队贯彻执行大赛各项规定,竞赛期间不私自接触裁判;
领队负责做好本参赛学校大赛期间的管理工作,负责本校的参赛组织和与大赛的联络,准时参加赛前领队会议,并认真传达落实会议精神,确保参赛选手准时参加各项比赛及活动;领队在比赛时需密切留意参赛选手的比赛时间,安排充足人员进行调度,避免出现因迟到而被取消比赛资格的现象;领队应负责赛事活动期间本队所有选手的人身及财产安全,如发现意外事故,应及时向组委会报告;只有领队才有权向仲裁委员会提出仲裁请求。
2. 参赛选手须知
各参赛选手凭大赛组委会颁发的参赛证和有效身份证件参加比赛及相关活动。参赛选手应自觉遵守赛场纪律,服从裁判、听从指挥。
3. 工作人员和志愿者须知
必须服从组委会统一指挥,认真履行职责,做好比赛服务工作;要按照分工准时到岗,尽职尽责做好分内各项工作,保证大赛顺利进行;真检查、核准证件,非参赛选手不准进入赛场。同时,要协调好领队、指导教师休息及食宿;比赛出现技术问题(包括设备、器材)时,应及时与比赛负责人联系,及时处理;如遇突发事件,及时向组委会报告,同时做好疏导工作,避免重大事故发生,确保大赛圆满成功;要认真组织好参赛选手的赛前准备工作,遇到重大问题及时与组委会联系,协商解决办法。
十四、申诉与仲裁
参赛队对比赛结果如有异议,可以由参赛学校领队在比赛结束2小时内向组委会提出书面申诉,申诉材料须有参赛队员、领队和教练的签名。仲裁委员会在接到申诉后2小时内组织复议,并及时反馈复议结果。该仲裁结果为最终结果。
十五、联系方式
本次竞赛的相关联系信息如下:
1. 联系人
本科组联系人:吕俊伟(181-5630-0268)lvjw_hfut@163.com
高职组联系人:朱晓彦(134-8570-1120)47731950@qq.com
赛事赛务联系人:杨兴明(139-6666-9525)xmyang168@163.com
2. 竞赛官网地址
http://ahrobot.thunder10.com
3. 竞赛交流QQ群
大数据与人工智能应用类(本科组)竞赛QQ群号:702551705
大数据与人工智能应用类(高职组)竞赛QQ群号:318962514
各参赛学校可指派1-2指导教师加入。
用户登录