6月13日,在第八届北京智源大会上,由北京智源人工智能研究院、众智FlagOS社区联合主办的FlagOS开放计算全球挑战赛(赛季一)举行了颁奖仪式。现场公示并颁发了赛道一、赛道三两大赛道奖项,赛道二的最终结果预计于7月中旬集中公布。
FlagOS开放计算全球挑战赛是面向全球AI技术开发者的多赛季、综合性赛事,聚焦AI系统软件栈创新与技术落地实践,旨在破解AI芯片编程复杂难题、挖掘底层技术创新潜力,助力全球开放计算生态高质量发展。
本届大赛凭借专业的赛题设置、硬核的技术赛道与丰厚的赛事资源,吸引了全球1127支队伍踊跃报名参赛,成为当下开放计算领域极具影响力的技术创新赛事。
在本次大赛中,赛道一聚焦算子底层开发与跨平台优化,围绕 FlagOS体系下通用算子库 FlagGems 的实际应用场景,设置 8 道简单、8 道中等、4道困难共计 20道梯度化赛题,从基础数学通用算子到前沿复杂场景算子,层层递进考察参赛者的算子实现、性能极致优化能力。

赛道一获奖队伍
赛道二主打大模型推理吞吐性能全栈优化,要求参赛者基于 FlagOS 体系专属vllm-plugin-FL 推理框架、FlagGems 高性能算子库,针对 Qwen3-4B模型开展极限性能调优,需综合利用并行策略、显存管理、计算内核及采样算法等全栈技术,在指定框架与硬件上挖掘最大性能潜力。
赛道三聚焦探索大语言模型在超长上下文范式下的数据标注能力,参赛者需基于Qwen3-4B 模型与组委会统一提供的数据集,设计高效 ICL自动数据标注方案进行自动数据标注,并在统一评测数据集上进行推理验证。

赛道三获奖队伍
北京智源人工智能研究院(BAAI)副院长兼总工程师林咏华分享了本次大赛的规划和初衷:“青年开发者是行业未来的核心力量,这也是我们举办赛事、吸纳广大学生群体参与的重要原因。这次大赛让选手可以在多款芯片上去做算子开发、大模型推理优化、数据集标注等,主要源于面向多芯片系统软件栈FlagOS的跨平台适配能力。相比过往其他聚焦单一芯片赛事,FlagOS开放计算全球挑战赛,让开发者基于多款芯片创作,打破计算壁垒,真正地实现开放计算。”

北京智源人工智能研究院(BAAI)副院长兼总工程师林咏华
在会后的采访中,林咏华进一步解释道:“第一,对新技术的推演是很重要的,因为新技术推出就是希望有很多开发者能够知道和使用,所以大赛是很重要的一环,尤其是会吸引到大学生,他们是未来最重要的一波开发力量;第二,现在全球很多相关的大赛,其实往往只用英伟达或AMD的芯片,我们通过大赛,可以帮助更多的AI芯片厂商去壮大他们在开发者中的力量,把他们也放到开发者的视野之中,我相信今天通过FlagOS48小时算子挑战赛,所有参赛选手都知道了这七款芯片;第三,对大模型厂商来说,他们也希望自己大模型里创新的这些算子或模型,能够被广大的开发者注意到,投入精力帮助他们一起去创新。”
同时,她也分享了大赛在推动全球开放计算生态建设等方面的思考:“我们希望参赛选手在实战中感受FlagOS技术栈跨芯片适配、高性能运行的优势,同时鼓励获奖优质算子成果全部开源,反哺社区算子库迭代升级。也期待本届参赛者持续扎根开源领域,壮大国内开放计算开发者队伍。”
本次参赛过程中,选手们直面各类技术难题,也在基于FlagOS软件栈的开发实践中积累了宝贵经验。赛道三选手岑子翰还是一名在校学生,来参加大赛的初衷是学习:“因为我其实本身研究的方向也是跟大模型相关的,然后想学习比如说提示词工程、超长上下文工程、Agent多轮调用的知识,以比赛的形式促进我自己的学习和研究,往后也可以把在比赛过程中学习到的一些知识和工程经验结合到我以后的论文学习中。”
对于比赛中的技术难点,他表示:“赛道三数据标注任务的难点集中在问答、自然语言生成代码两大题型。Qwen3-4B小模型无法调用外部检索工具,问答能力受限,团队通过指令注入、Top K采样与后处理优化,将模型性能提升约10%;而超长上下文场景下模型易出现语义理解偏差、代码命名错乱问题,我们借助多轮模型调用与内容审查机制,让代码生成任务编译通过率达到80% 以上。”

赛道三选手岑子翰
同为赛道三获奖选手的崔超来自浪潮集团,他的重点落在技术落地上。“因为我是来自产业界的,我比较关心我们做的比赛成果能不能沉淀到我们的产品里面,所以我们不想用八个代码去解决八个问题,我们想用一套框架去把这八个问题一起解决掉。我们认为当前比较具备推广性的,就用智能体的方式。但这样的话,小模型的性能很差,尤其是多轮对话时它的记忆不够好,整体的规划也不够好。所以我们做了一些相关的优化,针对每个任务去设计了一些相应的工具,把记忆和思路能够整合的更好,我们也用强化学习的思路去做结合,把经验放到智能体的记忆里,在一定程度上实现了扩展性。”

赛道三获奖选手崔超
赛道一获奖选手Yunyi Liu则表示:“赛道一算子开发面临边缘测试用例难以全覆盖、算子功能实现门槛高的问题,同时同赛道选手同台竞技,对算子性能、完成速度都提出了极高要求,需要先熟悉主流框架算子逻辑,再逐步完成迁移开发,并设计足量测试用例保障兼容性。”

赛道一获奖选手Yunyi Liu
采访中他们也结合实际开发体验,分享了使用 FlagOS软件栈进行开发的不同之处:FlagOS开源友好、上手门槛低,既保留充足的算法优化空间,还支持一键部署,使用体验十分便捷。在跨硬件迁移方面表现突出,推理程序在不同芯片平台间迁移流程顺畅,并且面对高负载任务时运行稳定,极少出现报错、重启等问题。
据了解,未来赛事将持续依托智源研究院技术积淀与FlagOS开源生态优势,持续聚焦前沿技术赛道,汇聚全球开发者力量,持续赋能中国开放计算产业高质量发展,构建开源、开放、创新的AI技术生态新格局。



