十两 AI 导航

AI 模型

聚合主流模型能力入口，适合选型、对比和快速检索。

全部文本阿里通义 AI 模型腾讯混元 Qwen 百度视频智谱 GLM Google Hunyuan Qwen3 图像 OpenAI Pangu 字节豆包 Doubao GLM Gemma

当前显示第 7 / 10 页，共 300 条结果，本页区间为 181-210。

Cogvideox 3

CogVideoX-3是智谱AI推出的视频生成模型，支持文生视频、图生视频，采用3D变分自编码器和3D RoPE技术，提升帧间连贯性，避免闪烁。适用于广告制作、电影剪辑、短视频创作等场景。

GLM Z1 Air

GLM-Z1-Air是智谱AI推出的32B参数开源大模型，主打高速推理与深度思考能力。其推理速度达200+Tokens/s，较主流模型提升8倍，成本仅为1/30，支持消费级硬件部署。具备强大数理逻辑推理与多步决策能力，适用于复杂问题求解、代码生成、AI智能体开发等场景，可通过Z.ai平台免费体验。

Baichuan M2 32B

Baichuan-M2-32B是百川智能2025年8月发布的开源医疗增强大模型，基于Qwen2.5-32B架构，创新性引入大型验证器系统，通过真实医疗数据强化学习。在HealthBench评测中以60.1分超越GPT-OSS120B等模型，支持RTX4090单卡部署，成本降低57倍，适用于医疗影像分析、病历诊断等场景，兼顾通用能力与医疗垂直领域需求。

GLM Z1 Flash

GLM-Z1-Flash是智谱AI发布的轻量级快速推理模型，为GLM-Z1系列成员，基于GLM-4-Flash基座优化，遵循MIT开源协议且完全免费调用。其通过算法优化实现高效资源调度，保持与更大规模模型相近的推理性能（如代码生成、数学推理），特点为更轻量、高速，适用于轻量级实时交互场景。

GLM Z1 AirX

GLM-Z1-AirX是智谱AI推出的32B参数推理模型，定位“瞬时”极速版，推理速度达200 Tokens/s，比常规模型快8倍，具备更高性价比（速度优先）。适用于代码生成、数学推理、智能客服等实时交互场景。

Qwen V2.5 0.5b Base

Qwen_v2.5_0.5b_base是阿里云Qwen2.5系列的0.5B参数基础预训练语言模型，采用Transformer架构，预训练数据达18万亿tokens。特点为轻量级、支持量化版本，需通过提示工程使用，适用于资源受限场景的基础NLP任务及专业模型训练底座。

Qwen V2.5 3b Base

Qwen_v2.5_3b_base是30亿参数量的轻量级语言模型，适配移动端/边缘设备，需单卡T4（16GB）部署。MMLU测试得分超65，优于同规模Gemma2-2.6B，主打资源受限场景的高效推理。

Qwen V2.5 1.5b Base

Qwen_v2.5_1.5b_base是阿里云Qwen团队开发的1.54B参数开源基础语言模型，支持32K上下文窗口，采用Transformer解码器架构与GQA、SwiGLU等技术。具备多语言能力（中英为主），需通过提示工程优化输出，适用于企业定制化开发、边缘计算及低资源场景的NLP任务预训练。

Minimax Hailuo 02 1080P

MiniMax Hailuo-02 1080P是MiniMax发布的视频生成模型，支持原生1080P高清视频直接输出，在场景快速变换中动作流畅且具备细微表情，拥有较强时空一致性和物理逻辑性，实现SOTA指令遵循，适用于视频创作等场景。

Minimax Hailuo 02 512P

MiniMax Hailuo-02 512P是MiniMax公司开发的多模态视频生成模型，采用创新NCR架构，参数和训练数据量分别提升3倍和4倍，效率提升2.5倍，擅长处理体操、杂技等复杂物理场景，支持生成6秒768P/1080P或10秒768P超清视频，在全球视频模型排名第二，价格低于国际同类产品，适用于创意内容制作、广告营销等场景。

Minimax Hailuo 02 768P

MiniMax Hailuo-02 768P是MiniMax推出的AI视频生成模型，为Hailuo 01升级版，支持768P/1080P分辨率视频生成，最长10秒。采用全新DiT架构，指令响应率85%，可处理杂技等高难度物理场景，图生视频/文生视频能力全球排名第二。训练推理效率提升2.5倍，成本低，适用于科普动画、企业宣传等场景。

Hunyuan Vision

Hunyuan-Vision是腾讯推出的多模态视觉大模型，其最新版本Hunyuan-Vision-1.5-Thinking在2025年10月LMArena全球榜单中位列第三、国内第一。该模型具备领先的多语言多模态理解与推理能力，可通过多轮反思深入解析视觉内容，支持图表解释、文档解析、几何问题求解等复杂任务，已开放API接口供开发者使用。

Pangu NLP N1 128K 3.2.36

Pangu-NLP-N1-128K-3.2.36 是华为云于2025年1月发布的自然语言处理模型，支持128K序列长度推理，4个推理单元可实现8并发。该模型需通过全量微调或LoRA微调（8个训练单元起训）后部署，适用于长文本处理场景。

Pangu NLP N1 32K 3.2.36

Pangu-NLP-N1-32K-3.2.36是华为云2025年1月发布的NLP大模型，支持32K序列长度训练及4K/32K推理，8单元起训、1单元即可部署，4K/32K均支持256并发。具备文章写作、文本分析、代码编写等能力，适用于智能文档处理、专业问答等场景。

Pangu NLP N2 32K 3.1.35

Pangu-NLP-N2-32K-3.1.35是华为云于2024年12月发布的NLP大模型，支持8K训练、4K/32K推理序列长度，全量微调需32训练单元起训，LoRA微调8单元起训，4推理单元即可部署，4K/32K均支持64并发，具备预训练与INT8量化特性。

ERNIE X1.1 Preview

ERNIE X1.1 Preview是百度文心基于文心4.5开发的深度思考模型，采用迭代式混合强化学习框架，在智能体、工具调用、指令遵循及事实性上显著提升。支持通用任务与人机协作，官方评测显示其效果与GPT-5、Gemini 2.5 Pro持平，领先DeepSeekR1-0528，可通过文心一言官网等平台使用。

Pangu NLP N4 32K 2.5.35

Pangu-NLP-N4-32K-2.5.35是华为云2025年3月发布的NLP大模型，支持32K序列长度的训练与推理，全量微调需96卡起训，LoRA微调64卡起训，8卡即可部署并支持64并发，具备预训练、DPO训练及INT8/INT4量化特性。

Hunyuan Standard Vision

Hunyuan-Standard-Vision（混元-标准-视觉模型）是腾讯（Tencent）的混元大模型系列中，专为处理和理解视觉信息而设计的一个模型版本。

Hunyuan Large Longcontext

Hunyuan-Large-Longcontext是腾讯开源的大语言模型，属MoE架构，总参389B、激活参52B，支持256K超长文本序列，Instruct模型支持128K。采用CLA结构与FP8量化优化，节省显存并提升吞吐，适配vLLM推理框架与Hugging Face生态，可用于长文档处理、代码生成等场景。

Hunyuan Lite Vision

Hunyuan-Lite-Vision（混元-精简-视觉模型）是腾讯（Tencent）混元大模型系列中，针对视觉任务推出的一个轻量级、高效率版本。

O1 Pro

o1-pro 是 OpenAI 推出的 O1 系列升级版推理模型，基于 Transformer 架构，强化复杂逻辑推理能力。特点：采用蒙特卡洛树搜索与自注意力机制，支持多模态输入，提供结构化输出与函数调用，推理深度提升但速度较慢。适用场景：数学竞赛、编程开发、科学研究等高精度任务。

OpenAI o1是由OpenAI开发的专业化推理大模型，采用强化学习和思维链技术，专注于复杂逻辑推理。其核心特点是模拟人类思考过程，在数学、科学、编码等领域实现高精度推理，例如在AIME数学竞赛中解决率高达93%。该模型通过“模拟推理”技术支持自主调用外部工具，并在推理密集型任务上显著优于GPT-4o。目前处于Beta阶段，主要面向ChatGPT Plus和Team用户开放，适用于需要深度逻辑分析的科研、工程开发等场景。

Sensenova V6 Turbo

商汤日日新SenseNova V6是多模态融合大模型，视频理解能力国内领先，支持10分钟中长视频解析及音视频混合模态分析，基础性能逼近Gemini 2.5 Turbo，64K思维链助力深度推理，可应用于教育、医疗、金融、内容创作等领域。

Sensenova V6 Pro

SenseNova V6 Pro是商汤科技2025年推出的原生多模态通用大模型，采用6200亿参数混合专家（MoE）架构，支持文本、图像、视频的原生融合。其特点为多模态融合能力突出，综合性能对标行业先进水平，适用于智能客服、内容分析、教育培训等需要跨模态交互与推理的场景。

Baichuan2 53B

Baichuan2-53B是百川智能2023年9月发布的闭源大模型，数学和逻辑推理能力显著提升，通过高质量数据体系和搜索增强极大降低模型幻觉，是国内“幻觉”问题最低的大模型，已开放API接口进军企业级市场。

Sensenova V6 Reasoner

SenseNova V6 Reasoner是商汤科技2025年4月发布的6000亿参数多模态MoE大模型，具备强推理、强交互、长记忆特点，可处理文本与多模态任务，适用于实时音视频交互、深度内容分析等场景。

Step 2

Step-2是阶跃星辰自研的万亿参数MoE架构语言大模型，综合能力较Step-1提升近50%，在数理逻辑、编程等多维度逼近GPT-4，指令跟随能力国际榜单居首。有轻量级mini版（快、省、性价比高）和文学大师版（强创作、去AI味），适用于智能助手、开发API及创作类应用。

ERNIE 4.5 Turbo VL

ERNIE 4.5 Turbo VL是百度推出的多模态视觉语言模型，具备高效图文理解与推理能力。其采用MoE架构，支持动态激活参数（如47B/424B），兼顾性能与效率，可部署于普通设备。适用于OCR、文档解析、跨模态问答等场景，能处理高分辨率视觉输入并支持多语言交互。

Step 2 Mini

Step-2-mini 是阶跃星辰推出的极速大模型，基于自研 MFA 注意力架构，以 3% 参数量实现 Step-2 模型 80% 性能，上下文长度 32k，代码能力突出。具备高吞吐、低时延（4000 tokens 输入首字时延 0.17 秒）及高性价比（输入 1 元/百万 token，输出 2 元/百万 token），适用于通用任务处理，API 接口已开放调用。

Baichuan2 Turbo 192k

Baichuan2-Turbo-192k是百川智能发布的大模型，具备192K超长上下文窗口，可处理约35万字，支持搜索增强知识库，用户能上传资料创建专属知识库。适用于企业智能解决方案，已与财经媒体、律所等合作，助力长文档处理等场景。