通知公告

通知公告

当前位置: 首页> 新闻中心> 通知公告> 正文

关于举办2025中国高校计算机大赛—大数据挑战赛通知

发布日期:2025-07-08

一、 大赛简介

2016年,教育部高等学校计算机类专业教学指导委员会、教育部高等学校软件工程专业教学指导委员会、教育部高等学校大学计算机课程教学指导委员会、全国高等学校计算机教育研究会联合创办了“中国高校计算机大赛”(ChinaCollegiateComputingContest,简称C4),目前“中国高校计算机大赛”继续由全国高等学校计算机教育研究会主办。大数据挑战赛是其中的一项重要赛事,在2018-2024年均入选全国普通高校学科竞赛排行榜,获得社会各界的高度关注和广泛好评。

2025中国高校计算机大赛——大数据挑战赛(以下简称“大赛”)由清华大学、大数据系统软件国家工程研究中心联合举办。由上海和今信息科技有限公司提供竞赛平台支持。大赛是以实际数据为基础、面向全球开放的高端算法竞赛。

大赛旨在通过竞技的方式,提升人们对数据分析与处理的算法研究与技术应用能力,探索大数据的核心科学与技术问题,尝试创新大数据技术,推动大数据的产学研用。

本次大赛面向全球开放,不限年龄国籍,高等院校在校学生(包括高职高专、本科生、研究生)以及科研机构和企业从业人员均可报名参赛。参赛队伍根据赛题要求设计相应的算法进行数据分析和处理,比赛结果按照指定的评价指标使用在线评测数据进行评测和排名,得分最优者获胜。

二、 竞赛规程

本次大赛聚焦于时间序列数据的建模与预测,通过构建基于真实金融市场数据的任务场景,旨在推动前沿算法在实际复杂环境中的落地应用。时间序列数据广泛存在于金融、交通、能源、医疗等领域,具有强烈的时序依赖性和动态变化特征。股价作为典型的时间序列对象,表现出高波动性、高频率、强非线性和多因素驱动等复杂特性,对建模技术提出了严峻挑战。

本次竞赛选择中国A股市场的股价数据作为研究对象,是基于其高度代表性和数据质量的综合考量。A股市场是中国资本市场的核心组成部分,包含上千家上市公司,涵盖多个行业和市值层级,拥有丰富的历史数据与活跃的交易行为。其股价受宏观经济政策、行业发展、企业基本面、市场情绪等多重因素影响,为时间序列预测模型的特征提取、机制建模、异常识别与动态调整提供了良好的实践平台。同时,A股股价数据在时间维度上既具备微观的高频波动,也蕴含中长期的趋势变化,有助于推动参赛者设计多尺度、分层次的预测方法,提升模型的综合表现。

从更宏观的视角来看,A股市场在中国经济发展与全球资本格局中的地位日益重要。近年来,随着注册制改革的全面推进、新兴科技企业的持续上市、以及资本市场对外开放步伐的加快,A股正逐步从融资市场向资源配置市场转变,承担起更为核心的经济调节与资源优化职能。在国家大力发展数字经济、推动金融科技融合创新的背景下,围绕A股市场构建智能化分析与预测工具,不仅能够服务于投资决策与风险控制,也具有提升金融体系智能化水平、促进技术成果转化的现实意义。

2.1赛题设置

本次大赛的题目是“基于历史数据预测未来股价涨跌”,具体说明详见附件“赛题描述”。其目标是基于沪深300指数成分股的历史股价数据,通过建立机器学习模型来预测未来股价涨跌幅最大和最小的股票。选手需通过构建模型、训练和调优,预测并输出给定数据后一个交易日沪深300指数成分股的涨跌幅最大和最小各10支股票,以此进行排名。

2.2参赛对象

本次大赛面向全球开放,不限年龄国籍,高等院校在校学生(包括高职高专、本科、研究生)以及科研机构和企业从业人员均可参赛。具体要求如下:

可以自由组队参赛,具体组队要求见后文相关说明;

参赛选手应保证报名信息准确有效,如队伍中的选手信息不符合要求,组委会有权取消整个队伍的参赛资格及奖励。

2.3赛制说明

本次大赛分为报名&组队、线上赛和决赛等三个阶段,其中线上赛均由参赛队伍下载数据在本地进行算法设计和调试,并通过大赛报名官网提交结果文件及模型代码;决赛要求参赛者进行现场演示和答辩。

(1)报名&组队(5月20日–7月15日)

参赛选手须在竞赛平台报名并且组队参赛(即使单人参赛也要组建单人队伍),大赛不收取任何报名费用。大赛报名系统开放时间为北京时间2025年5月20日10:00,截止时间为北京时间2025年7月15日中午12:00。

报名方式:登录竞赛平台,完成个人信息注册,即可报名参赛;

每个选手可单人成队或2-3人组队参赛;

参赛队伍(包括队长及全体队伍成员)需要在竞赛平台完成实名认证,未完成认证的队伍将无法参加正式比赛。

大赛官方渠道主要包括:

大赛官网:https://nercbds.tsinghua.edu.cn/bdc.html

竞赛平台:https://www.heywhale.com/home/

大赛邮箱:data@tsinghua.edu.cn

大赛QQ群:762146461/901317172

报名截止之后,不再允许添加或更改任何队伍成员。如有中途退出情况,只允许在参赛队伍内部更换队长或删除队员。参赛队伍须应在决赛开始前向大赛组委会提交成员更换申请,由参赛队伍全部成员亲笔签名,经由大赛组委会审核后变更生效。

(2)线上赛(5月20日–7月20日)

参赛队伍可从竞赛平台下载数据,在本地进行算法调试,并在线提交结果及模型代码。若参赛队伍在一天内多次提交结果,新结果版本将覆盖旧版本。

线上赛A阶段:5月20日10:00–7月18日20:00,每个参赛队伍每天可以进行2次结果提交,系统立即进行评测并返回成绩。排行榜实时进行更新,将选择参赛队伍在本阶段的历史最优成绩进行排名展示。请确保结果可复现。

线上赛B阶段:7月19日–7月20日23:59,每个参赛队伍提交整理好的模型代码,要求详见“代码规范”文档。

线上赛C阶段:7月28日,系统将在7月28日20:00更换训练数据和推理数据,并运行选手模型代码获得结果文件进行计算排名展示。

线上赛结束后,排名前70名的参赛队伍以及排名在71-110之间前30支学生队伍将进行代码审核。组委会将审核并剔除没有机器学习算法贡献的队伍,并取消存在违反比赛规定队伍的比赛资格,空缺名额不再替补。所有通过审核的队伍将获得线上赛名次证书。

(3)决赛(8月中下旬)

决赛将以现场答辩会的形式进行,具体要求和安排另行通知。受邀参加决赛的选手在决赛期间的食宿由大赛组委会负责,其他费用自理。

2.4奖项设置

大赛的奖金池总额为5万元人民币,所有奖金均为税前金额。

(1)线上赛奖项(以大赛官网线上赛最终排行榜为准)

线上赛通过代码审核的100支队伍将颁发线上赛名次证书。

(2)决赛奖项(以大赛官网决赛结果为准)

奖励对象

数量

奖励办法

决赛第一名队伍

1

奖金2万元,决赛名次证书

决赛第二名队伍

1

奖金1万元,决赛名次证书

决赛第三名队伍

1

奖金0.8万元,决赛名次证书

决赛第四名队伍

2

奖金0.4万元,决赛名次证书

(3)在校学生队伍奖项

在校学生队伍要求所有参赛队员必须全部为在校学生,如果队伍中有一名在职人员,则整个队伍视为在职人员队伍。其中,中国大陆在校学生提供学信网的教育部学籍在线验证报告编号进行身份验证,其余学生提供相关在读证明进行身份验证,在校学籍以2025年5月30日为准。

此奖项仅颁发给在校学生队伍,要求队伍通过代码审核,并根据在校学生队伍成绩的单独排名结果进行颁发。

奖励对象

数量

对象

全国一等奖

5

单独排名第1-5名

全国二等奖

10

单独排名第6-15名

全国三等奖

15

单独排名第16-30名

2.5违规处理

此奖项仅颁发给在校学生队伍,要求队伍通过代码审核,并根据在校学生队伍成绩的单独排名结果进行颁发。

参赛者应本着诚实、公平的态度参加比赛,如在以下情况出现违规,大赛组织委员会(简称“组委会”)有权取消参赛者所在队伍的参赛资格,情节严重者将通报参赛者所在单位并追究其违法责任。

(1)账号使用

参赛者所用的账号必须是使用本人信息注册的,并有义务保证账号所有信息的真实性和有效性,且账号仅限于参赛者本人使用;参赛者禁止使用多账号参赛,同一参赛者不可使用多个账号进行提交、刷分操作;如根据判断认为参赛账号存在异常或违背正常使用条例,组委会可以单方面暂停或终止该账号登录大赛平台。

(2)比赛成果

 严禁参赛队伍之间相互抄袭。如不同参赛队伍提交结果高度相似,经判定存在抄袭行为的,组委会将取消相关参赛队伍的参赛资格,相关参赛成绩无效。

 参赛者应保证其在比赛过程中所产出的所有成果未侵犯任何第三方的知识产权、商业秘密及其他合法权益。如第三方因为参赛者侵权行为提出索赔、诉讼等,参赛者应承担由此产生的全部责任及损失。

 如大赛主办方及其关联公司有意取得参赛者在本次大赛中独立开发的依约定享有完整知识产权的研究成果,参赛者同意大赛主办方及其关联公司在同等条件下享有优先受让权,相关转让事宜由双方另行协商确定。

(3)数据使用

对于大赛提供的数据(数据集),参赛者须仅在比赛场景下使用,并应妥善保存已下载的数据(数据集),避免泄露;在完成比赛使用后应及时销毁已下载数据(数据集);如使用比赛之外的任何数据应获得组委会许可。对于不提供下载的比赛数据,参赛者不得以任何形式擅自复制、下载或获取。参赛者如发现任何出现数据未授权访问的可能,应立即通知组委会并积极提供相关信息。如参赛者泄露已下载的数据(数据集),或未及时销毁已下载的数据(数据集)导致已下载的数据(数据集)泄露,参赛者应承担由此产生的全部责任及损失。

(4)代码分享

在大赛举办期间,未经组委会同意,参赛者禁止公开分享与赛事相关的数据、模型和代码;大赛结束之后,参赛者可以在拥有模型和代码的知识产权的情况下自行选择公开分享,但需要确保此类公开共享不会侵犯任何第三方的知识产权、商业秘密及其他合法权益。

(5)参赛者若在参赛过程中发现相关规则漏洞或技术漏洞,有义务及时告知组委会相关漏洞的信息,组委会将对提供相关信息的参赛者表示感谢;若参赛者利用相关漏洞进行参赛,经判断查证后,成绩将会被判断为无效成绩。

2.6申诉与仲裁

(1)参赛团队或选手对不符合大赛规定的设备、工具和软件,有失公正的评判和奖励以及工作人员的违规行为等,均可向大赛组委会提出申诉。组委会负责受理比赛中提出的申诉并进行调解仲裁,以保证大赛的顺利进行和大赛结果的公平公正。组委会作出的仲裁结果为终局决定。

(2)申诉报告应明确申诉内容,指定一名成员作为联系人,通过大赛邮箱以邮件发送,否则申诉将不予受理。

(3)组委会将在收到申诉之日起5个工作日之内受理,并认真核查和处理。

2.7其他

(1)为了确保整个大赛顺利、公正地进行,以及保证参赛选手的合法权益,参赛选手报名时应阅读和确认大赛官网上的《参赛协议》,自觉遵守协议规定。

(2)在大赛举办过程中,竞赛规程可能会有少量的变更和调整,大赛组委会将本着公平、公正、公开的原则在大赛官网公告,所有内容均以大赛官网为准。


附件1:2025大数据挑战赛-赛题描述.pdf

附件2:2025大数据挑战赛-代码规范.pdf


大赛校园组(青岛科技大学)委会联系人:张坤鹏

邮箱:kp.zhang@qust.edu.cn