智能座舱的演进本质上是一场人车关系的重构。过去几年,中国智能汽车市场经历了从硬件竞赛到语音普及的阶段,但用户仍需迁就机器——记忆固定唤醒词、背诵标准指令、分步骤下达任务。座舱多停留在被动响应层面,缺乏对复杂意图的理解力、跨场景规划力及基于感知的主动服务能力。
深层挑战来自两方面:一是技术落地鸿沟,包括大模型上车的云端依赖导致延迟与隐私隐患、端侧算力与模型大小的平衡难题、多模态感知与执行闭环的打通;二是全球化新课题,中国汽车出口量跃居世界第一,但智能座舱出海远不止语言翻译,还需应对不同文化背景下的交互习惯差异、语义理解偏差及本地生态服务缺失等问题。
在行业深水区,科大讯飞于北京车展推出系统级解决方案:星火新一代多模态智能座舱提供端侧多模态大模型SparkAuto-EMM与智能体生态,推动座舱从工具进化为“会办事的管家”;iFLYSOUND氮化镓母带级声学系统及超30项全链自研车载音频算法,以软硬一体方案重塑听觉体验;海外星火大模型则打通语言与文化壁垒,支撑中国智能汽车全球化交互适配。
星火新一代多模态智能座舱的核心突破在于端侧部署的多模态大模型。SparkAuto-EMM不依赖预置指令模板,而是通过语义表征能力理解用户真实意图。例如用户说“有点闷”,系统结合车内外温度、车窗状态、天气及历史偏好,自主判断应开窗或开空调,涉及模糊语义消歧、上下文感知与多模态信息融合。端侧部署保障断网可用、数据不出车,规避云端方案在隧道、地下车库等弱网场景失效风险。针对不同车型算力差异,科大讯飞提供0.5B至7B阶梯式模型矩阵,实现芯片资源最优匹配。
传统语音系统仅支持单步指令,而真实需求常具多步骤、多条件特征。如用户指令“先加油再去机场,路上找一家川菜馆”,系统需拆解为三个子任务,调用地图、兴趣点搜索等服务,完成路线规划与偏好排序,形成“理解-规划-执行”闭环。该能力使座舱首次具备类似智能助手的任务编排能力。
智能体生态是“办事”能力延伸至车外服务的关键。科大讯飞构建三层架构:第一层围绕高频刚需场景,自研或深度定制精品智能体,覆盖全家出行娱乐与信息需求;第二层集成生态伙伴面向车端优化的多端通用智能体,如美团美食推荐、智能排号、在线订座,实现全程座舱内闭环;第三层以解决方案形式集成优质长尾场景智能体,保障能力边界可扩展。该生态以大模型为调度中枢,按需组合不同智能体能力响应复合意图,严格遵循车载约束:驾驶场景下要求首轮命中率高、任务路径短、安全优先、支持离线或弱网运行。
海外星火助理构建母语级交互体系,覆盖32种语言、60个国家和地区,已量产交付100多款明星车型。中国出海前十车企中8家与科大讯飞合作。其差异化体现在由母语者构建的语料库、52个高质量TTS发音人、多轮专家交叉校验机制,确保交互地道性而非仅语法正确性。同时整合全球主流车机生态,涵盖导航、音乐、体育、新闻等服务,提供本土数字生活体验。
iFLYSOUND声学系统打破“好声音=高价格”的行业潜规则。传统车载功放采用硅基MOSFET器件,受限于功率密度低,高保真输出需增大体积与散热结构,推高重量与成本。科大讯飞采用氮化镓(GaN)材料,结合ARM+ADSP协同SOC架构与首创氮化镓音频功放架构,实现单通道300W峰值输出,可驱动8欧姆影院级重低音单元。辅以红宝石薄膜电容/电感技术与低密度翅片专利散热设计,在音质提升20%、重量降低30%前提下有效控制硬件成本。该方案获行业首个QQ音乐臻品音质认证,达高解析度音频播放标准。
iFLYSOUND全链自研超30项车载音频算法,覆盖麦克风收音、主动降噪、声场重建至扬声器驱动全链路。“好听、好用、好玩”三层框架拓展智能边界:音乐厅模式追求真实声场还原,电影院模式强化低频与人声;声场分区解决驾乘者多任务冲突,导航语音与乘客音乐互不干扰;声场智导赋予导航与警示音方位感,降低视觉依赖;无麦K歌、露营空间、随行DJ等功能增强社交娱乐属性,其中随行DJ依据车速、油门深度等实时数据自动混音,实现音乐与驾驶行为动态呼应。
iFLYSOUND已落地超120万辆车,北京车展发布的魏牌V9X、东风日产NX8、2026款极氪007GT、奇瑞星途EX7、奇瑞风云T9L、昊铂S600等新车均搭载相关技术。座舱交互与车载声学共同构成“听懂—办好—体验好”完整闭环:星火大模型负责意图理解与能力调度,iFLYSOUND提供高品质且可变的感官体验,二者协同支撑主动式AI座舱价值主张——在用户表达感受甚至尚未表达时即提供恰当服务与氛围。
科大讯飞在汽车行业角色演变与智能座舱技术迭代同频:从早期语音合成上车,到国内车载语音市场份额领先,再到当前端侧大模型与全栈声学系统量产落地。其积累源于数百万辆量产车交付、数亿条真实交互数据反馈,以及与车企联合攻关的大量工程难题。相较将通用大模型简单封装后推向车市的消费级AI产品,科大讯飞更精准掌握方向盘后用户在高速行驶时所需的最短交互路径、夜间驾驶时语音反馈的音量与亮度调节逻辑,以及海外用户对礼貌程度与语速的文化期待。其核心价值在于将大模型通用能力深度打磨为真正懂车、懂驾驶者、懂全球用户的车规级智能体。
科大讯飞此次北京车展发布的产品传递明确信号:智能座舱竞争已进入系统级智能体能力比拼时代。单点功能堆砌无法构建核心竞争力,唯有将理解、规划、执行、感知、情感等能力深度融合,才能让座舱从冰冷硬件进化为有温度的数字伴侣。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



