CogVideoX-3是智谱AI推出的视频生成模型,支持文生视频、图生视频,采用3D变分自编码器和3D RoPE技术,提升帧间连贯性,避免闪烁。适用于广告制作、电影剪辑、短视频创作等场景。

AI 模型
聚合主流模型能力入口,适合选型、对比和快速检索。
当前显示第 7 / 10 页,共 300 条结果,本页区间为 181-210。
GLM-Z1-Air是智谱AI推出的32B参数开源大模型,主打高速推理与深度思考能力。其推理速度达200+Tokens/s,较主流模型提升8倍,成本仅为1/30,支持消费级硬件部署。具备强大数理逻辑推理与多步决策能力,适用于复杂问题求解、代码生成、AI智能体开发等场景,可通过Z.ai平台免费体验。
Baichuan-M2-32B是百川智能2025年8月发布的开源医疗增强大模型,基于Qwen2.5-32B架构,创新性引入大型验证器系统,通过真实医疗数据强化学习。在HealthBench评测中以60.1分超越GPT-OSS120B等模型,支持RTX4090单卡部署,成本降低57倍,适用于医疗影像分析、病历诊断等场景,兼顾通用能力与医疗垂直领域需求。
GLM-Z1-Flash是智谱AI发布的轻量级快速推理模型,为GLM-Z1系列成员,基于GLM-4-Flash基座优化,遵循MIT开源协议且完全免费调用。其通过算法优化实现高效资源调度,保持与更大规模模型相近的推理性能(如代码生成、数学推理),特点为更轻量、高速,适用于轻量级实时交互场景。
GLM-Z1-AirX是智谱AI推出的32B参数推理模型,定位“瞬时”极速版,推理速度达200 Tokens/s,比常规模型快8倍,具备更高性价比(速度优先)。适用于代码生成、数学推理、智能客服等实时交互场景。
Qwen_v2.5_0.5b_base是阿里云Qwen2.5系列的0.5B参数基础预训练语言模型,采用Transformer架构,预训练数据达18万亿tokens。特点为轻量级、支持量化版本,需通过提示工程使用,适用于资源受限场景的基础NLP任务及专业模型训练底座。
Qwen_v2.5_3b_base是30亿参数量的轻量级语言模型,适配移动端/边缘设备,需单卡T4(16GB)部署。MMLU测试得分超65,优于同规模Gemma2-2.6B,主打资源受限场景的高效推理。
Qwen_v2.5_1.5b_base是阿里云Qwen团队开发的1.54B参数开源基础语言模型,支持32K上下文窗口,采用Transformer解码器架构与GQA、SwiGLU等技术。具备多语言能力(中英为主),需通过提示工程优化输出,适用于企业定制化开发、边缘计算及低资源场景的NLP任务预训练。
MiniMax Hailuo-02 1080P是MiniMax发布的视频生成模型,支持原生1080P高清视频直接输出,在场景快速变换中动作流畅且具备细微表情,拥有较强时空一致性和物理逻辑性,实现SOTA指令遵循,适用于视频创作等场景。
MiniMax Hailuo-02 512P是MiniMax公司开发的多模态视频生成模型,采用创新NCR架构,参数和训练数据量分别提升3倍和4倍,效率提升2.5倍,擅长处理体操、杂技等复杂物理场景,支持生成6秒768P/1080P或10秒768P超清视频,在全球视频模型排名第二,价格低于国际同类产品,适用于创意内容制作、广告营销等场景。
MiniMax Hailuo-02 768P是MiniMax推出的AI视频生成模型,为Hailuo 01升级版,支持768P/1080P分辨率视频生成,最长10秒。采用全新DiT架构,指令响应率85%,可处理杂技等高难度物理场景,图生视频/文生视频能力全球排名第二。训练推理效率提升2.5倍,成本低,适用于科普动画、企业宣传等场景。
Hunyuan-Vision是腾讯推出的多模态视觉大模型,其最新版本Hunyuan-Vision-1.5-Thinking在2025年10月LMArena全球榜单中位列第三、国内第一。该模型具备领先的多语言多模态理解与推理能力,可通过多轮反思深入解析视觉内容,支持图表解释、文档解析、几何问题求解等复杂任务,已开放API接口供开发者使用。
Pangu-NLP-N1-128K-3.2.36 是华为云于2025年1月发布的自然语言处理模型,支持128K序列长度推理,4个推理单元可实现8并发。该模型需通过全量微调或LoRA微调(8个训练单元起训)后部署,适用于长文本处理场景。
Pangu-NLP-N1-32K-3.2.36是华为云2025年1月发布的NLP大模型,支持32K序列长度训练及4K/32K推理,8单元起训、1单元即可部署,4K/32K均支持256并发。具备文章写作、文本分析、代码编写等能力,适用于智能文档处理、专业问答等场景。
Pangu-NLP-N2-32K-3.1.35是华为云于2024年12月发布的NLP大模型,支持8K训练、4K/32K推理序列长度,全量微调需32训练单元起训,LoRA微调8单元起训,4推理单元即可部署,4K/32K均支持64并发,具备预训练与INT8量化特性。
ERNIE X1.1 Preview是百度文心基于文心4.5开发的深度思考模型,采用迭代式混合强化学习框架,在智能体、工具调用、指令遵循及事实性上显著提升。支持通用任务与人机协作,官方评测显示其效果与GPT-5、Gemini 2.5 Pro持平,领先DeepSeekR1-0528,可通过文心一言官网等平台使用。
Pangu-NLP-N4-32K-2.5.35是华为云2025年3月发布的NLP大模型,支持32K序列长度的训练与推理,全量微调需96卡起训,LoRA微调64卡起训,8卡即可部署并支持64并发,具备预训练、DPO训练及INT8/INT4量化特性。
Hunyuan-Standard-Vision(混元-标准-视觉模型)是腾讯(Tencent)的混元大模型系列中,专为处理和理解视觉信息而设计的一个模型版本。
Hunyuan-Large-Longcontext是腾讯开源的大语言模型,属MoE架构,总参389B、激活参52B,支持256K超长文本序列,Instruct模型支持128K。采用CLA结构与FP8量化优化,节省显存并提升吞吐,适配vLLM推理框架与Hugging Face生态,可用于长文档处理、代码生成等场景。
Hunyuan-Lite-Vision(混元-精简-视觉模型)是腾讯(Tencent)混元大模型系列中,针对视觉任务推出的一个轻量级、高效率版本。
o1-pro 是 OpenAI 推出的 O1 系列升级版推理模型,基于 Transformer 架构,强化复杂逻辑推理能力。特点:采用蒙特卡洛树搜索与自注意力机制,支持多模态输入,提供结构化输出与函数调用,推理深度提升但速度较慢。适用场景:数学竞赛、编程开发、科学研究等高精度任务。
OpenAI o1是由OpenAI开发的专业化推理大模型,采用强化学习和思维链技术,专注于复杂逻辑推理。其核心特点是模拟人类思考过程,在数学、科学、编码等领域实现高精度推理,例如在AIME数学竞赛中解决率高达93%。该模型通过“模拟推理”技术支持自主调用外部工具,并在推理密集型任务上显著优于GPT-4o。目前处于Beta阶段,主要面向ChatGPT Plus和Team用户开放,适用于需要深度逻辑分析的科研、工程开发等场景。
商汤日日新SenseNova V6是多模态融合大模型,视频理解能力国内领先,支持10分钟中长视频解析及音视频混合模态分析,基础性能逼近Gemini 2.5 Turbo,64K思维链助力深度推理,可应用于教育、医疗、金融、内容创作等领域。
SenseNova V6 Pro是商汤科技2025年推出的原生多模态通用大模型,采用6200亿参数混合专家(MoE)架构,支持文本、图像、视频的原生融合。其特点为多模态融合能力突出,综合性能对标行业先进水平,适用于智能客服、内容分析、教育培训等需要跨模态交互与推理的场景。
Baichuan2-53B是百川智能2023年9月发布的闭源大模型,数学和逻辑推理能力显著提升,通过高质量数据体系和搜索增强极大降低模型幻觉,是国内“幻觉”问题最低的大模型,已开放API接口进军企业级市场。
SenseNova V6 Reasoner是商汤科技2025年4月发布的6000亿参数多模态MoE大模型,具备强推理、强交互、长记忆特点,可处理文本与多模态任务,适用于实时音视频交互、深度内容分析等场景。
Step-2是阶跃星辰自研的万亿参数MoE架构语言大模型,综合能力较Step-1提升近50%,在数理逻辑、编程等多维度逼近GPT-4,指令跟随能力国际榜单居首。有轻量级mini版(快、省、性价比高)和文学大师版(强创作、去AI味),适用于智能助手、开发API及创作类应用。
ERNIE 4.5 Turbo VL是百度推出的多模态视觉语言模型,具备高效图文理解与推理能力。其采用MoE架构,支持动态激活参数(如47B/424B),兼顾性能与效率,可部署于普通设备。适用于OCR、文档解析、跨模态问答等场景,能处理高分辨率视觉输入并支持多语言交互。
Step-2-mini 是阶跃星辰推出的极速大模型,基于自研 MFA 注意力架构,以 3% 参数量实现 Step-2 模型 80% 性能,上下文长度 32k,代码能力突出。具备高吞吐、低时延(4000 tokens 输入首字时延 0.17 秒)及高性价比(输入 1 元/百万 token,输出 2 元/百万 token),适用于通用任务处理,API 接口已开放调用。
Baichuan2-Turbo-192k是百川智能发布的大模型,具备192K超长上下文窗口,可处理约35万字,支持搜索增强知识库,用户能上传资料创建专属知识库。适用于企业智能解决方案,已与财经媒体、律所等合作,助力长文档处理等场景。