体验 | GLM-4成功避坑，欢迎体验

文章来源：企鹅号 - wisemodel开源社区

始智AI wisemodel.cn开源社区

始智AI wisemodel.cn社区将努力打造成huggingface之外最活跃的中立开放的AI开源社区。“源享计划”即开源共享计划，各类开源模型、数据集、代码等，欢迎发布到wisemodel.cn社区。wisemodel社区持续招募志愿者，欢迎通过《加入wisemodel社区志愿者团队》了解详情。

近期智谱AI的GLM-4模型API正式开放，始智AI wisemodel.cn开源社区也上线了GLM-4的API体验。大家可以通过始智AI的开放平台（wisemodel.cn）的体验空间来体验。欢迎各位开发者和人工智能爱好者加入我们wisemodel的开源社区，一起探索GLM-4模型的强大功能。

一、GLM-4

新一代基座大模型GLM-4，整体性能相比GLM3全面提升60%，逼近GPT-4；支持更长上下文；更强的多模态；支持更快推理速度，更多并发，大大降低推理成本；同时GLM-4增强了智能体能力。这一模型在自然语言处理（NLP）领域具有多项突破性技术，能够提供更加精准、高效的语言理解和生成能力。GLM-4模型的设计旨在更好地理解和生成自然语言，从而在各种应用场景中提供支持，包括但不限于文本生成、机器翻译、情感分析等。

基础能力（英文）：GLM-4 在 MMLU、GSM8K、MATH、BBH、HellaSwag、HumanEval等数据集上，分别达到GPT-4 94%、95%、91%、99%、90%、100%的水平。

指令跟随能力：GLM-4在IFEval的prompt级别上中、英分别达到GPT-4的88%、85%的水平，在Instruction级别上中、英分别达到GPT-4的90%、89%的水平。

对齐能力：GLM-4在中文对齐能力上整体超过GPT-4。

长文本能力：在LongBench（128K）的相关评测中，数据显示，GLM-4性能超过 Claude 2.1；在「大海捞针」（128K）实验中，GLM-4的测试结果为 128K以内全绿，做到100%精准召回。

GLM-4内测数据表现惊艳：在内测阶段，首批体验 GLM-4 模型API的开发者表现出极高的热情，调用次数逐日快速递增，开发者们对 GLM-4 模型的推理效果和性能给予高度评价。

GLM-4 实现自主根据用户意图，自动理解、规划复杂指令，自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型，以完成复杂任务。

简单来讲，即只需一个指令，GLM-4会自动分析指令，结合上下文选择决定调用合适的工具。

二、wisemodel上GLM-4的有趣体验

考一考GLM-4：“林黛玉倒拔垂杨柳的典故听说过吗？”GLM-4的回答还是挺好的，没有掉坑里。

GLM-3-turbo的回答开始掉坑里了，但后面的回答还是自己纠正了一下。

但GLM3-6B的模型就没有那么强的表现了，直接掉坑里去了。

在日常生活中突发奇想，在GLM-4上一搜索就能知道。

在学习上遇到问题，找GLM-4帮忙

生活上需要帮助，GLM-4也能迅速给你答案

发表于: 2024-03-162024-03-16 17:00:00
原文链接：https://page.om.qq.com/page/OQixoVxegc9ZEFLkS02liBuw0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

体验 | GLM-4成功避坑，欢迎体验

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐