马斯克 xAI 展示首个多模态模型 Grok-1.5V：可将流程图转成 Python 代码- DoNews

DoNews > 公司新闻 > 马斯克 xAI 展示首个多模态模型 Grok-1.5V：可将流程图转成 Python 代码

马斯克 xAI 展示首个多模态模型 Grok-1.5V：可将流程图转成 Python 代码

IT之家 2024-04-13 13:35:07

马斯克旗下人工智能公司 xAI 于 3 月下旬推出 Grok-1.5 大语言模型之后，近日再次推出首个多模态模型 Grok-1.5 Vision。

xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision（Grok-1.5V），不仅能理解文本，还能处理文档、图表、截图和照片中的内容。

xAI 表示：“Grok-1.5V 在多学科推理、文档理解、科学图表、表格处理、屏幕截图和照片等多个领域都能媲美现有的前沿多模态模型”。

xAI 在官方新闻稿中演示了 7 个 Grok-1.5V 案例，，包括将白板上的流程图草图转化为 Python 代码、根据孩子的绘画生成睡前故事、解释流行语、将表格转化为 CSV 文件格式等等。

xAI 还分享了 Grok-1.5V 的跑分情况，在 RealWorldQA 基准测试中，比 GPT-4V、Claude 3Sonnet、Claude 3 Opus 和 Gemini Pro 1.5 等主流竞争对手更为优异。

IT之家附上参考地址

Grok-1.5 Vision Preview

本文转载自IT之家，转载目的在于传递更多信息，并不代表本站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请联系IT之家通知我方删除，我方将在收到通知后第一时间删除内容！本文只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。

蔚来汽车 2025 年 Q1 营收 120.35 亿元同比增长 21.5% 蔚来2025年Q1营收120.3亿元，同比增长21.5%，净亏损67.5亿元；交付4.2万辆车，增长40.1%，预计Q2交付7.2万至7.5万辆。

花大力气做一部极有可能「看不懂」的先锋剧，值得吗？｜专访《在人间》导演张卓、徐添跟创作者对暗号。

科技、女频、新国风，优酷动漫又有大动作优酷动漫的“爆款进击之旅”。

董明珠和孟羽童“再次合体”，必须看懂的流量密码企业家和网红为什么要“姐妹情深”？

抢购DeepSeek一体机：狂热、理性和未来一件“国运级”的重器，你愿意花多少钱买回去？

大疆新品曝光：Romo、Mini 5 Pro、Avata 3、Neo 2、Nano、Mic 3、M400A等大疆多款新品将发布：扫拖机器人Romo、Mini5 Pro无人机、Avata 3无人机、Osmo Nano运动相机等，性能全面提升。

长城汽车×清华大学美术学院公开课：东方美学成为世界表达内外兼修方能人车共鸣

华为WATCH 5官宣发布时间，端、软、云协同重构行业技术标准随着6月3日华为穿戴技术沟通会的召开，华为终端官方微博发布华为WATCH 5产品预热海报，并官宣鸿蒙AI智能手表华为WTACH 5将于6月11日发布

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号