关于光速光合基金成员企业智谱携基座大模型GLM-4-Plus亮相KDD

ningxueqin2 · 2025-5-26 13:05:28

　　在 KDD 国际数据挖掘与知识发现大会上，智谱 GLM 团队介绍了新一代基座大模型GLM-4-Plus。GLM-4-Plus 是智谱全自研 GLM 大模型的最新版本，它标志着智谱继续瞄准通用人工智能，持续推进大模型技术的独立自主创新。
　　主要更新：
　　关于光速光合基金语言基座模型 GLM-4-Plus：在语言理解、指令遵循、长文本处理等方面性能得到全面提升，保持了国际领先水平。
　　文生图模型 CogView-3-Plus：具备与当前最优的 MJ-V6 和 FLUX 等模型接近的性能。
　　图像/视频理解模型 GLM-4V-Plus：具备卓越的图像理解能力，并具备基于时间感知的视频理解能力。该模型将上线开放平台（ bigmodel.cn ），并成为国内首个通用视频理解模型 API 。
　　视频生成模型 CogVideoX：在发布并开源 2B 版本后，5B 版本也正式开源，其性能进一步增强，是当前开源视频生成模型中的最佳选择。
　　智谱开源模型累计下载量已突破 2000 万次，为开源社区的发展做出了重要贡献。
　　最新基座大模型 GLM-4-Plus上线
　　GLM-4-Plus 使用了大量模型辅助构造高质量合成数据以提升模型性能；利用 PPO 有效提升模型推理（数学、代码算法题等）表现，更好反应人类偏好。
　　下面是 benchmark 对比：
　　语言文本能力方面，GLM-4-Plus 和 GPT-4o 及 405B 参数量的 Llama3.1 相当。
　　长文本能力比肩国际先进水平。通过更精准的长短文本数据混合策略，取得了更强的长文本的推理效果。
　　Long Context evaluation
　　GLM-4V-Plus 在图像和视频理解能力方面位居前列。GLM-4V-Plus 还可以理解网页内容，并将其转换为 html 代码。
　　Vision capabilities
　　GLM-4V-Plus 能够理解并分析复杂的视频内容，同时具备时间感知能力。上线开放平台后，将提供国内首个通用视频理解模型 API 。
　　Video analysis
　　文生图模型迎来最新版本CogView-3-Plus，其效果接近目前最佳的 MJ-V6 及 FLUX 等模型，并支持图片编辑功能。
　　图片示例：
　　GLM-4-Plus 现已在智谱大模型开放平台 bigmodel.cn 部署，开发者即日起就能通过 API 方式调用这一智谱最新基座大模型。
　　清言 app 迎来重要更新
　　全新的“视频通话”功能来了！
　　智谱很高兴宣布清言 app 迎来“视频通话”功能，这也是国内首个面向 C 端开放的视频通话功能。
　　清言作为第一批 C 端上线的大模型产品，过去的一年，常常以文字和语音的形式和大家交流。但从今天起，清言也有了眼睛，解锁了 AI 新体验。
　　清言视频通话跨越了文本模态、音频模态和视频模态，并具备实时推理的能力。现在，用户拨打清言的视频通话窗口，即可与它进行流畅通话，即便频繁打断它也能迅速反应。只要打开摄像头，我们看到的画面，清言也可以看到，同时可以听懂指令并准确执行。这样的体验就如同和真人视频通话一样。

关于光速光合基金成员企业智谱携基座大模型GLM-4-Plus亮相KDD

官方客服