前沿早聚焦｜9.11和9.9哪个大？小学数学题难倒大模型

大模型集体失智！“9.11和9.9哪个大”这样简单的问题，居然把主流大模型都难倒了？？

从ChatGPT-4o到豆包、kimi，一众大模型都坚定地认为9.11更大，简直要怀疑是全世界AI联合起来欺骗人类了。

其实在这背后，大模型数学能力较差是长期存在的问题，有行业人士认为，生成式的语言模型从设计上就更像文科生而不是理科生。不过，针对性的语料训练或许能在未来逐步提升模型的理科能力。

在人工智能领域，大模型的开源和闭源也是一个备受关注的话题。

在最近闭幕的2024WAIC上，除了“十八金刚”人形机器人集体出道，“百模大战”热度不减，更有各位业界大佬们的重磅发言。其中百度CEO李彦宏称：模型开源和代码开源是两个概念，模型开源只能拿到一堆参数，做不到真正的共享；

在此前采访中，朱啸虎表示：开源模型最终会赶上闭源模型，因为开源有更广泛的贡献者和验证。360公司创始人周鸿祎也站开源：如果企业能够专注于特定领域，并利用其独有的数据资源进行深入的专业训练，那么这些模型完全有可能在特定领域的能力上超越GPT-4。

当然除了开源派、闭源派，也有中间派。百川智能 CEO 王小川称关于开闭源之争，核心是要看谁在开源。从To B角度，开源闭源其实都需要。二者不是竞争关系，而是在不同产品中互补的关系。

那么，围绕大模型和开源闭源之争，有哪些精彩的观点碰撞？开源PK闭源，哪个更强？你是开源派还是闭源派？接下来，我们邀请了香港城市大学协理学务副校长、电机工程学系教授——张泽松、远望资本合伙人——程浩、特约评论员——王西贝来谈谈他们的看法！

AI界的“超级辩论”

开源PK闭源，哪个更强？

香港城市大学协理学务副校长、电机工程学系教授——张泽松

开源的优势很清晰，是一个比较开放透明的平台，这些代码全球都能看到。它的共同合作的平台方式非常强。同时对于同一个问题，它会提出不同的答案去做很多分支，这样也会有更多产品的创新性在里面，能够去推动起来。

但是开源的软件一般来讲会比较零碎化，可能它软件整合程度没有我们看到闭源的软件这么强。闭源的软件可能是以公司的形式去推动的，所以它整合的整个系统一般来说都会比较清晰，同时也比较专业。一般闭源来讲，它们会有知识产权的部分，透明度一般是没有开源这么清晰。同时维护保护的资金链也会比较提高一点。

特约评论员——王西贝

现在市面上讲的开闭源大模型基本指的是纯文本交互的大语言模型，全称是Large Language Model，它们的开闭源比较下来，是一

提到闭源的代表，像国外的GPT4 Claude，国内的文心一言、Kimi等。那么开源的代表像Llama和通义千问等。除了大语言模型外，其实还有多模态大模型，多模态是指除了文字内容外，还有包括语音、图片、视频这种多形式内容上做交互。如果在多模态上比较，闭源大模型像Open AI和谷歌的技术，我认为还是更超前些的。

我是开源派的，因为我们在大学里面做科研，会开发一些软件去做实验。软件做开源以后，在全球的认可度会提升。其次，你也会得到很多的意见，这些意见都是可以编成我们下一篇文章的一些起步点。

我们看到大学里面有一些初创的公司，我们也是非常鼓励我们的学生会带着他们的科研成果能够做一些转化。2021年开始的时候，“HK Tech 300”大学的创业计划希望去推动香港的300所公司。但是过去三年，已经有700家公司拿了我们10万块，有150到200家的公司拿了100万的天使资金。同学们或者社会的公司去用我们开源的IP，去启动他们的事业。这些都会为社会带来很大量的价值。

百度CEO（首席执行官）李彦宏近期提出的“开源是一种智商税”的观点，我们怎么看待呢？

除了对开闭源的争论，业界的讨论也还聚焦在了应用上。

没有应用，开源闭源都一文不值？

深圳卫视科创最前沿

，赞13

远望资本合伙人——程浩

我完全同意，没有应用的话，你做这个有什么价值呢？其实这不光是对于大模型，对所有的科技都是。你做这个东西再炫，如果没有商业价值、没有应用场景的，这个都没意义。

大语言模型基本上他的能力达到一个新的阶段，他会解锁一些新的应用。我觉得今天这个大语言模型的智能，真正解锁的就是搜索这类应用，有一个比较专业的术语叫RAG（检索增强生成）。

到了夏天，大家对身材管理愈发重视起来，减肥就成了绕不开的话题。随着人工智能技术的快速发展，现在AI也加入到了减肥这一领域。那么使用AI减肥，会更科学有效吗？AI减肥会不会带来哪些潜在的风险？欢迎扫码进群讨论。你的深刻见解将有机会出现在我们下一期的节目当中，成为我们宝贵的声音。

如果你拥有独到的见解或深入的分析，甚至有机会成为《科创最前沿》的特约评论员。

欢迎进入“深圳卫视科创圈”，唠唠科技圈那点新鲜事儿。

网友热评

@rainnnyyy

开源大模型一定会像安卓、Linux一样，遍布在每个服务器上。

@Fullaaa_y

AI大模型成本那么贵，不用闭源先盈利，难道真的是靠爱发电吗？

阿里云 CTO 周靖人：通义千问拉平了开源、闭源模型之间的差距

近日，阿里云在上海世界人工智能大会现场交出了一份亮眼的成绩单。

据阿里云官方介绍，近 2 个月来，通义千问开源模型下载量增长 2 倍，突破 2000 万次，阿里云百炼服务客户数从 9 万增长至 23 万，涨幅超 150%。

借此，阿里云 CTO 周靖人也重申了阿里云拥抱开源开放的坚定立场：

两年前，我们在世界人工智能大会上发布通义大模型系列，当时我们公布，通义核心模型将开源开放。

到今天，通义千问已经实现真正意义上的全尺寸、全模态开源，拉平了开源、闭源模型之间的差距。

整合资料来源：腾讯科技、APPSO、量子位

今晚21:20

前沿聚焦 AI 肥胖

你好，我是《科创最前沿》

《科创最前沿》是中国首档运用XR技术日播的AIGC榜单资讯解读节目，节目由深圳市科技创新局特别支持，AI内容由深圳广电人工智能联合实验室与国内多家知名大模型共同推出，来自全球的顶级科学家、知名产经人士、年轻活力的科技博主们组成千人智库，每晚陪你打破科创信息差。记得，每晚21：20打开深圳卫视，共同奔赴科创最前沿！