Scaling Law、多模态、价格战，智源大会成AI春晚

2025-06-18万象ai

6月14日至15日，“2024北京智源大会”在京举行。现场，OpenAI sora负责人Aditya Ramesh（阿迪提亚·拉梅什）进行技术分享，零一万物CEO、创新工场董事长李开复与中国工程院院士张亚勤炉边对话，国内大模型创业公司“四小龙”罕见同台。

智源研究院是在国家科学技术部和北京市委市**的指导下，由北京市科委和海淀区**于2018年11月成立的新型研发机构。2023年，原院长黄铁军从张宏江理事长手上接过理事长的“接力棒”，新任院长由王仲远出任，后者曾是快手技术副总裁。一年一度的智源大会被行业称为“AI春晚”。

现场，科技部战略规划司副司长康相武表示，当前，人工智能正处在群体性技术变革的起点，正迈向多智能融合的新阶段，将成为第四次工业革命的标配，引发社会发展深远变革。人工智能的大规模跨界应用也将带来多重安全风险挑战。如何预期共存且在确保安全可控前提下更好造福人类社会，成为全球人类共同面对的重大议题。

逼近GPT4之后的布局

采访中王仲远表示，国产大模型已经到了能够去支撑应用的阶段，所以他个人预测，未来两三年可以看到大量大模型应用的产生。至于具体分类，王仲远认为B端应用非常明确，几乎覆盖了所有行业。至于C端，行业普遍期待看到C端的爆款级应用。但类比移动互联网时代，当一个新技术或技术革命出现时，都需要一定的周期，需要天时地利人和，需要有技术能力。

具体到大模型落地C端产品，王仲远认为还需要模型足够低价好用，同时解决用户的真实痛点，因此对C端爆款应用需要保持一定耐心，“即使在大洋彼岸，也还没有出现C端的爆款应用。”王仲远称。

如果AGI时代到来，可能发生的技术演进路线是怎样的呢？王仲远认为，过去几年，绝大部分的科研关注度，包括产业的关注度，都在大语言模型的突破，目前大语言模型依然是单语言的模型，但除了文本数据外，还存在大量图像、视频、音频等多模态数据。当多模态大模型能够理解和感知、决策这个世界时，它就有可能进入到物理世界。如果进入到宏观世界与硬件结合，这就是具身大模型的发展方向；如果进入到微观世界去理解和生成生命分子，这就是AI For Science。

OpenAISora团队负责人Aditya Ramesh在与纽约大学助理教授谢赛宁的对话环节中表示，对于构建更加智能的具有推理能力的系统来说，语言模态确实十分重要，但从某种意义上来说，将语言信息以某种通用接口融入视觉信号中或许可以实现模拟任何事物的能力。随着模型规模的增大，其对于语言的依赖也会降低。

近期，海内外多模态领域更新频繁，包括AI初创公司Luma AI发布视频生成模型Dream Machine，短视频公司快手推出Kling大模型。对于行业现状，Aditya Ramesh表示，团队目前最关心的是视频生成模型的安全性及其对社会的影响，希望人们不要用Sora来发布错误的信息，也希望模型的行为符合人类的期望。很开心看到有其他实验室和公司从事视频生成模型的研发，有大量的人尝试使用不同的方法对于激发艺术和扩散模型领域的创新很重要。而“提高可控性”和“减少随机性”是Sora团队目前从合作方收到的最重要的功能需求。

AI安全是此次智源大会另一个重要议题，杨植麟同样认为AI安全非常重要，虽然不一定是当前最急迫的，但是一个需要提前去准备的事情。因为随着模型的进展，Scaling Law的发展是每N个月算力乘以10倍，智能会得到提升。杨植麟认为AI安全包括模型本身因用户而产生的恶意意图，以及在模型底层注入AI“宪法”框定模型的行为。

李大海认为，现阶段安全主要聚焦在基础安全与内容安全两个方向上，现在的大模型本质上是只读的，权重是固定的，推理不会影响权重。未来当用户将模型部署到机器人等终端上，模型能够去动态更新自己的权重后，安全问题将变成一个非常重要的问题。

对于近期的价格战问题，王小川表示，降价让更多个人与企业入场，同时令很多企业开始清醒，不再参与做大模型，而是“退”回来成为大模型的用户，减少资源浪费。

逼近GPT4之后的布局

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表本站立场。文章及其配图仅供学习分享之

1396

681

上一篇：跑分性能比肩GPT-4o？大模型价格“屠夫”DeepSeek发布最新开源模型