十两 AI 导航

AI 模型

聚合主流模型能力入口，适合选型、对比和快速检索。

全部文本阿里通义 AI 模型腾讯混元 Qwen 百度视频智谱 GLM Google Hunyuan Qwen3 图像 OpenAI Pangu 字节豆包 Doubao GLM Gemma

当前显示第 8 / 9 页，共 257 条结果，本页区间为 211-240，当前标签为文本。

ERNIE 4.5 21B A3B Thinking

ERNIE-4.5-21B-A3B-Thinking是百度开源的深度思考模型，采用混合专家（MoE）架构，总参数210亿，每token激活30亿参数。支持128K上下文窗口，适用于长文本推理、逻辑数学科学任务、代码生成及工具调用，实现高效复杂任务自动化处理。

Kimi Thinking Preview

kimi-thinking-preview是月之暗面推出的多模态思考模型，具备多模态推理与通用推理能力，擅长深度推理。作为k系列最新思考模型，可通过更换model或openai SDK使用，目前处于预览版阶段，暂不支持工具调用、联网搜索等功能。

O1 Mini

o1-mini是OpenAI推出的轻量级STEM推理优化模型，基于强化学习训练，成本较o1-preview低80%，延迟更低且速率限制更高。专为数学、编码等复杂推理任务设计，在AIME数学竞赛中达70%正确率，适合学术研究、技术开发等场景，但非STEM事实知识表现较弱。

O1 Preview

o1-preview是OpenAI推出的专业化推理大模型预览版，采用强化学习和思维链技术，通过内部思路链生成实现复杂逻辑推理，在数学、科学、编码等领域表现突出，如AIME数学竞赛解决率达93%。适用于多步骤问题解决、代码编写等场景，但成本较高、速度较慢，目前向ChatGPT Plus等付费用户开放。

ERNIE 4.5 300B A47B Paddle

ERNIE-4.5-300B-A47B-Paddle是百度文心大模型4.5系列中的300B参数多模态模型，采用异构MoE架构，单次推理激活470亿参数，支持128K超长上下文，通过2-bit压缩技术实现低资源部署。适用于医疗影像分析、长文档解析、工业质检等复杂场景，兼顾高性能与部署效率。

ERNIE 4.5 21B A3B Paddle

ERNIE-4.5-21B-A3B-Paddle是百度推出的文本混合专家（MoE）语言大模型，总参数量210亿，每个token激活30亿参数。采用异构MoE架构与模态隔离路由技术，依托飞桨框架优化，适配智能对话、内容创作等轻量化场景，提供ERNIEKit微调与FastDeploy部署工具链，基于Apache 2.0协议开源。

Kimi K2 Turbo Preview

kimi-k2-turbo-preview是月之暗面（Moonshot AI）推出的Kimi K2高速版大语言模型，为混合专家（MoE）架构，总参数1万亿、激活参数320亿，上下文窗口达256K。输出速度60-100Token/s，为普通版6倍，适用于代码生成、长文本处理、工具调用等场景，在开源模型中性能领先。

Kimi K2 0905 Preview

kimi-k2-0905-preview是混合专家架构的开源基础模型，编程能力突出，Agentic Coding能力在测试和任务中表现佳，上下文长度扩展至256K，有高速版API。适用于AI编程工具、云服务部署等场景。

Gemini 1.5 Flash 8B

Gemini 1.5 Flash 8B是谷歌推出的轻量级多模态语言模型，参数规模80亿，支持文本、图像、音频等多模态处理。特点为低成本（100万输入令牌0.0375美元）、高效率，适用于大容量低复杂度任务。使用场景包括初创企业AI开发测试、基础多模态应用等。

ERNIE 4.5 VL 424B A47B Paddle

ERNIE-4.5-VL-424B-A47B-Paddle是百度文心4.5系列多模态大模型，采用异构MoE架构，支持""思考/非思考""双模式，在MathVista等多模态基准测试中表现比肩OpenAI-o1，已部署于工业质检等边缘设备场景。

ERNIE 4.5 VL 28B A3B

ERNIE-4.5-VL-28B-A3B是百度开源的280亿参数多模态模型，具备文本与图像/视频理解能力。特点包括工程图纸理解准确率98.2%、降低40%误检率，支持从图表到报告全流程生成。应用于新闻出版（效率提升3倍）、制造业质检、法律文书分析等场景，已适配英特尔等硬件加速卡。

ERNIE 4.5 0.3B

ERNIE-4.5-0.3B是百度推出的0.36B参数轻量级语言大模型，基于PaddlePaddle框架，支持SFT、DPO等基础微调，采用卷积编码量化技术实现4位/2位无损压缩，适配多芯片边缘部署，适用于对话、创作及轻量化文本处理场景，开源协议为Apache 2.0。

Grok 2

Grok-2是xAI开发的多模态大模型，支持文本、图像、视频交互，具备实时信息获取（DeepSearch模式）、代码生成与代理任务能力，强调逻辑推理与客观性。适用于科学查询、创意生成、编程开发及特斯拉车载交互等场景，支持网页和移动应用访问。

Grok 2 Mini

Grok-2 mini 是 xAI 推出的轻量化 AI 模型，基于 Grok-2 优化，特点为快速响应、文本交互友好，适用于简单文本任务。支持多语言处理，可集成实时检索能力，应用于问答、信息检索及基础文本生成。

Moonshot V1 128k Vision Preview

moonshot-v1-128k-vision-preview 是 Moonshot AI 推出的多模态视觉模型，支持 128k 上下文长度，可理解图片内容并输出文本。具备多轮对话、流式输出、工具调用及 JSON 模式等特性，适用于大规模图像处理、实时交互等场景。暂不支持联网搜索和带图片的 Context Caching。

Moonshot V1 32k Vision Preview

moonshot-v1-32k-vision-preview是一个具备视觉理解能力的大语言模型，上下文长度32k，可处理图片内容并输出文本，适用于图文结合的长文本生成场景。

Moonshot V1 8k Vision Preview

moonshot-v1-8k-vision-preview 是 Moonshot AI 推出的多模态视觉模型，支持 8k 上下文长度，可理解图片内容并输出文本，适用于图像描述、图文问答等场景。

GPT 4o Mini

GPT-4o mini是OpenAI推出的轻量化多模态大语言模型，支持文本/图像输入，较GPT-3.5-turbo更智能且速度相当，响应迅速，适用于基础文本生成、简单信息查询等日常任务，免费用户可自动切换使用，简化了数据分析等高级功能。

Kimi K2 0711 Preview

kimi-k2-0711-preview是北京月之暗面科技开发的基于MoE架构的万亿参数开源语言模型，代码、搜索、创作、推理能力全面提升，速度更快，适用于编程、数据分析、内容创作、文件解读等复杂任务，赋能程序员、科研人员等专业人士。

Hunyuan Role

Hunyuan-Role是腾讯混元系列大模型中专注于角色扮演场景的优化版本，属于对话式语言模型。其核心特点包括：基于丰富角色扮演数据训练，在互动语气、剧情推进、多轮对话等场景表现优于通用模型；支持长指令（最大输入28K）和角色设定遵循，可还原人设并主动引导话题；已应用于互动内容平台，作为“亲密朋友”类虚拟角色核心能力，满足情感陪伴与精神寄托需求。

Gemma 2 9B

Gemma 2 9B是谷歌DeepMind开发的开源轻量级大语言模型，属Gemini技术体系，90亿参数规模。特点：采用滑动窗口注意力与知识蒸馏技术，8万亿token训练，性能超Llama 3 8B；支持多框架部署，适配边缘设备与云端。适用于边缘AI、文档问答、代码生成等场景。

Gemma 2 27B

Gemma 2 27B是谷歌开源的轻量级文本生成大模型，基于Transformer架构，性能媲美LLaMA3 70B。支持单GPU/TPU高效推理，适配家用电脑及云端部署，适用于低成本AI开发与本地部署场景。

PP UIE 7B

PP-UIE-7B是通用信息抽取大模型，具备零样本和小样本学习能力，通过输入格式与样例提升输出准确性和规范性，适用于多领域信息抽取任务。

PP UIE 14B

PP-UIE-14B是PaddleNLP推出的14B参数通用信息抽取大模型，属UIE系列，支持实体识别、关系抽取等NLP任务，零样本和小样本性能突出，CMeEE数据集小样本F1值达0.588，适配本地化部署，适用于需要高效信息抽取的开发场景。

Paddlemix PP DocBee

PP-DocBee是百度飞桨推出的文档图像理解多模态大模型，基于ViT+MLP+LLM架构，具备强大中文文档解析能力，可高效处理文字、表格、图表等内容，推理性能优化，响应快且输出质量高，适用于文档问答、复杂文档解析，支持多种部署方式。

Claude 3.5 Sonnet

Claude 3.5 Sonnet是Anthropic发布的多模态大语言模型，属中等尺寸，性能介于Haiku和Opus间。特点是编码能力领先，修复64%代码错误，支持计算机使用功能，可模拟人类操作完成多步骤任务，运行速度为前代Opus两倍，能理解细微指令与复杂数据，生成自然类人内容，擅长图表解释和低质量图像文本转录。适用于客户支持、多步骤工作流、代码开发、创意写作及数据洞察分析等场景。

GLM 4 9B

GLM-4-9B是由智谱AI推出的开源大语言模型，属GLM-4系列。具备多模态能力，支持26种语言，上下文处理达1M token（约200万字），中文对齐和代码能力提升40%，可调用外部工具，适用于长文本处理、多语言交互和复杂任务协作。

Moonshot V1 128k

moonshot-v1-128k是Moonshot AI推出的大语言模型，核心特点为128k超长上下文长度（含输入与输出），专注于超长文本生成任务。其与同系列模型效果无差异，主要通过上下文长度区分，供用户按需选择。

Moonshot V1 8k

Moonshot-v1-8k是由月之暗面（Kimi）开发的语言模型，具备8K上下文窗口（约8192 token），适用于短文本生成。支持内容创作、代码生成、摘要、对话等任务，需通过明确指令和范例优化输出。

Moonshot V1 32k

Moonshot-v1-32k是Moonshot AI推出的千亿参数语言模型，支持32K上下文窗口，具备优秀语义理解、指令遵循和文本生成能力，适用于长文本理解与生成，应用于内容创作、代码生成、文本摘要等场景。