GLM-4.5-Flash是智谱AI发布的开源基础模型,采用混合专家(MoE)架构,提供思考/非思考双推理模式,支持工具调用与多框架兼容。适用于智能体开发、代码生成及复杂推理,MIT协议允许商用,性价比高。

AI 模型
聚合主流模型能力入口,适合选型、对比和快速检索。
当前显示第 1 / 1 页,共 16 条结果,本页区间为 1-16,当前标签为 GLM。
GLM-4.5-X是基于GLM-4.5架构的开源混合专家(MoE)大语言模型,总参数量3550亿,激活参数量320亿,采用89层深层结构与160专家设计。支持思维/直接响应双模式切换,擅长智能体任务、复杂推理及代码生成,在TAU-Bench(70.1%)、AIME 24(91.0%)等基准测试中表现优异,适用于科研、工程开发及智能系统构建。
GLM-4.5-AirX是智谱AI推出的轻量级混合推理大模型,总参数1060亿(激活参数120亿),采用MoE架构,原生融合推理、编码和智能体能力,支持思考(复杂推理/工具使用)与非思考(即时响应)双模式,适用于智能体开发、本地部署及多语言处理,MIT协议开源可商用。
GLM-4.5是开源混合专家(MoE)大语言模型,总参3550亿(激活320亿),支持思维与直接响应混合推理。23万亿Token训练后,在智能体、推理和编码任务表现优异,如TAU-Bench得分70.1%、AIME 24达91.0%、SWE-bench Verified 64.2%。有3550亿参数版及轻量1060亿参数版,适用于复杂推理、工具调用及快速响应场景。
GLM-4.5-Air是清华智谱推出的轻量级千亿参数大语言模型,采用MoE架构(1060亿总参数/120亿激活参数),主打混合推理能力,支持复杂任务的思考模式与快速响应的非思考模式切换。其量化版本(如4-bit AWQ)模型文件仅64GB,适配本地部署与边缘设备,平衡性能与效率。适用于智能代理开发、工具调用及资源受限场景,已开源并开放API接口。
GLM-Z1-Air是智谱AI推出的32B参数开源大模型,主打高速推理与深度思考能力。其推理速度达200+Tokens/s,较主流模型提升8倍,成本仅为1/30,支持消费级硬件部署。具备强大数理逻辑推理与多步决策能力,适用于复杂问题求解、代码生成、AI智能体开发等场景,可通过Z.ai平台免费体验。
GLM-Z1-Flash是智谱AI发布的轻量级快速推理模型,为GLM-Z1系列成员,基于GLM-4-Flash基座优化,遵循MIT开源协议且完全免费调用。其通过算法优化实现高效资源调度,保持与更大规模模型相近的推理性能(如代码生成、数学推理),特点为更轻量、高速,适用于轻量级实时交互场景。
GLM-Z1-AirX是智谱AI推出的32B参数推理模型,定位“瞬时”极速版,推理速度达200 Tokens/s,比常规模型快8倍,具备更高性价比(速度优先)。适用于代码生成、数学推理、智能客服等实时交互场景。
GLM-4-9B是由智谱AI推出的开源大语言模型,属GLM-4系列。具备多模态能力,支持26种语言,上下文处理达1M token(约200万字),中文对齐和代码能力提升40%,可调用外部工具,适用于长文本处理、多语言交互和复杂任务协作。
GLM-4-Long是智谱AI推出的长文本大模型,支持1M tokens(约150-200万字)上下文,100万tokens仅需1元。适用于小说创作、学术综述、代码文档生成等场景,提供“构思-初稿-润色”全流程支持。
GLM-4-Plus 是智谱AI于2024年推出的大语言模型,属GLM-4系列增强版。采用合成数据优化与PPO算法提升推理能力,在SuperCLUE测评中位列国内第一梯队,与GPT-4o差距小于2分。支持API调用,适用于文本生成、智能问答等场景,需通过智谱开放平台接口使用。
GLM-4-Assistant是智谱AI开发的多模态对话大模型,支持128K上下文(部分版本达1M token),中文对齐能力超GPT-4,可动态调用多工具协同处理复杂任务。适用于学术解析、长文档处理、智能客服等场景。
GLM-4-AllTools是智谱AI推出的智能体优化型大语言模型,基于GLM-4架构强化工具调用能力。特点包括自主规划工具使用(支持联网搜索、代码解释器、文生图等)、多模态任务处理及超长上下文理解。适用于复杂推理、数据分析、智能开发等场景,部分任务表现优于GPT-4 All Tools。
GLM-4-Flash是智谱AI推出的高效能大语言模型,基于10T多语言数据训练,采用FP8技术提升效率。特点包括128K长上下文推理、72.14 token/s生成速度,支持多轮对话与工具调用。适用于智能助手、内容生成、RAG知识库等场景,提供免费API。
GLM-4-FlashX是智谱AI开发的GLM-4系列语言模型,定位为高性能推理模型,具备超快推理速度与高并发处理能力,主打极致性价比以降低使用门槛。适用于智能对话、文本处理等场景,通过API接口提供服务,需通过智谱MaaS平台调用。
GLM-4是智谱AI研发的第四代通用预训练大语言模型,基于Transformer架构,2024年推出基础版,2025年迭代至GLM-4.6版本。其核心特点包括:在中英文基准测试(如MMLU、GSM8K)中性能接近GPT-4,中文指令理解和对齐度超越GPT-4;支持200K上下文窗口,长文本处理能力媲美GPT-4 Turbo;智能工具调用能力(Web搜索、代码解释器等)超越GPT-4 All Tools;推理效率提升,Token消耗减少30%,并适配国产芯片降低部署成本。应用场景涵盖代码开发、智能体构建、长文本分析及国产化AI解决方案,已开源并通过MaaS平台提供API服务。