十两 AI 导航

AI 模型

聚合主流模型能力入口，适合选型、对比和快速检索。

全部文本阿里通义 AI 模型腾讯混元 Qwen 百度视频智谱 GLM Google Hunyuan Qwen3 图像 OpenAI Pangu 字节豆包 Doubao GLM Gemma

当前显示第 10 / 10 页，共 300 条结果，本页区间为 271-300。

Gemma 2 9B

Gemma 2 9B是谷歌DeepMind开发的开源轻量级大语言模型，属Gemini技术体系，90亿参数规模。特点：采用滑动窗口注意力与知识蒸馏技术，8万亿token训练，性能超Llama 3 8B；支持多框架部署，适配边缘设备与云端。适用于边缘AI、文档问答、代码生成等场景。

Gemma 2 27B

Gemma 2 27B是谷歌开源的轻量级文本生成大模型，基于Transformer架构，性能媲美LLaMA3 70B。支持单GPU/TPU高效推理，适配家用电脑及云端部署，适用于低成本AI开发与本地部署场景。

PP UIE 7B

PP-UIE-7B是通用信息抽取大模型，具备零样本和小样本学习能力，通过输入格式与样例提升输出准确性和规范性，适用于多领域信息抽取任务。

PP UIE 14B

PP-UIE-14B是PaddleNLP推出的14B参数通用信息抽取大模型，属UIE系列，支持实体识别、关系抽取等NLP任务，零样本和小样本性能突出，CMeEE数据集小样本F1值达0.588，适配本地化部署，适用于需要高效信息抽取的开发场景。

Paddlemix PP DocBee

PP-DocBee是百度飞桨推出的文档图像理解多模态大模型，基于ViT+MLP+LLM架构，具备强大中文文档解析能力，可高效处理文字、表格、图表等内容，推理性能优化，响应快且输出质量高，适用于文档问答、复杂文档解析，支持多种部署方式。

Claude 3.5 Sonnet

Claude 3.5 Sonnet是Anthropic发布的多模态大语言模型，属中等尺寸，性能介于Haiku和Opus间。特点是编码能力领先，修复64%代码错误，支持计算机使用功能，可模拟人类操作完成多步骤任务，运行速度为前代Opus两倍，能理解细微指令与复杂数据，生成自然类人内容，擅长图表解释和低质量图像文本转录。适用于客户支持、多步骤工作流、代码开发、创意写作及数据洞察分析等场景。

GLM 4 9B

GLM-4-9B是由智谱AI推出的开源大语言模型，属GLM-4系列。具备多模态能力，支持26种语言，上下文处理达1M token（约200万字），中文对齐和代码能力提升40%，可调用外部工具，适用于长文本处理、多语言交互和复杂任务协作。

Moonshot V1 128k

moonshot-v1-128k是Moonshot AI推出的大语言模型，核心特点为128k超长上下文长度（含输入与输出），专注于超长文本生成任务。其与同系列模型效果无差异，主要通过上下文长度区分，供用户按需选择。

Moonshot V1 8k

Moonshot-v1-8k是由月之暗面（Kimi）开发的语言模型，具备8K上下文窗口（约8192 token），适用于短文本生成。支持内容创作、代码生成、摘要、对话等任务，需通过明确指令和范例优化输出。

Moonshot V1 32k

Moonshot-v1-32k是Moonshot AI推出的千亿参数语言模型，支持32K上下文窗口，具备优秀语义理解、指令遵循和文本生成能力，适用于长文本理解与生成，应用于内容创作、代码生成、文本摘要等场景。

Yi Medium

Yi-Medium是零一万物（01.AI）推出的大模型API产品，支持超长文本处理，具备200K上下文窗口，可一次性解读20万字文本，适用于文档分析、知识库构建等场景。其API接口支持轻量化数学分析、代码生成及文本聊天，兼顾性能与效率。

Yi Large

Yi-Large是零一万物推出的旗舰级闭源大模型，对标早期GPT-4，具备16k上下文长度，指令遵从与综合性能优异，中英文能力突出（AlpacaEval 2.0英语第二、SuperCLUE中文榜首），适用于复杂NLP、智能助手、决策支持及深度内容创作，但代码生成能力待提升。

Cogview 3 Plus

CogView-3-Plus是智谱推出的文本生成图像模型，为CogView3的DiT版本，性能达领先T2I模型水平。采用DiT框架、Zero-SNR调度及文本-图像联合注意力机制，支持512 - 2048像素生成，兼顾效果与成本。可用于广告设计、新闻配图、出版物插画等场景。

GLM 4 Long

GLM-4-Long是智谱AI推出的长文本大模型，支持1M tokens（约150-200万字）上下文，100万tokens仅需1元。适用于小说创作、学术综述、代码文档生成等场景，提供“构思-初稿-润色”全流程支持。

Yi Large RAG

Yi-Large-RAG 是零一万物 (01.AI) 公司推出的 Yi-Large 模型与检索增强生成 (RAG) 技术相结合的一种应用模式或解决方案。

Cogview 3 Flash

CogView-3-Flash是智谱推出的免费AI图像生成模型，支持文本生成高质量图像，具备多分辨率（如1024x1024等）、快速推理及创意多样性特点，适用于广告设计、艺术创作、教育等场景。

Yi Large Turbo

Yi-Large-Turbo是零一万物Yi系列大模型中的高性价比版本，定位为平衡性能、速度与成本的通用语言模型。其特点是在保持接近旗舰模型Yi-Large性能的同时，通过高精度调优实现更优推理效率，适用于全场景、高品质的文本生成及推理任务。该模型已通过阿里云百炼平台开放API服务，支持企业及开发者接入使用。

GLM 4 Plus

GLM-4-Plus 是智谱AI于2024年推出的大语言模型，属GLM-4系列增强版。采用合成数据优化与PPO算法提升推理能力，在SuperCLUE测评中位列国内第一梯队，与GPT-4o差距小于2分。支持API调用，适用于文本生成、智能问答等场景，需通过智谱开放平台接口使用。

GLM 4 Assistant

GLM-4-Assistant是智谱AI开发的多模态对话大模型，支持128K上下文（部分版本达1M token），中文对齐能力超GPT-4，可动态调用多工具协同处理复杂任务。适用于学术解析、长文档处理、智能客服等场景。

GLM 4 AllTools

GLM-4-AllTools是智谱AI推出的智能体优化型大语言模型，基于GLM-4架构强化工具调用能力。特点包括自主规划工具使用（支持联网搜索、代码解释器、文生图等）、多模态任务处理及超长上下文理解。适用于复杂推理、数据分析、智能开发等场景，部分任务表现优于GPT-4 All Tools。

GLM 4 Flash

GLM-4-Flash是智谱AI推出的高效能大语言模型，基于10T多语言数据训练，采用FP8技术提升效率。特点包括128K长上下文推理、72.14 token/s生成速度，支持多轮对话与工具调用。适用于智能助手、内容生成、RAG知识库等场景，提供免费API。

GLM 4 FlashX

GLM-4-FlashX是智谱AI开发的GLM-4系列语言模型，定位为高性能推理模型，具备超快推理速度与高并发处理能力，主打极致性价比以降低使用门槛。适用于智能对话、文本处理等场景，通过API接口提供服务，需通过智谱MaaS平台调用。

Grok 1.5V

Grok-1.5V是xAI推出的多模态AI模型，支持文本、图像等处理，具备128K长上下文与高级推理能力，数学、编码任务表现优异。适用于专业问题解决、日常交互，未来或集成于特斯拉车辆。

Grok 1.5

Grok-1.5是xAI于2024年3月发布的语言模型，基于优化训练系统提升推理能力，支持128K令牌上下文，在数学（MATH 50.6%、GSM8K 90%）和代码生成（HumanEval 74.1%）任务表现突出，面向X平台早期测试者提供长文本理解与高级推理功能。

Yi 9B 200K

Yi-9B-200K是零一万物推出的90亿参数量开源大语言模型，具备200K超长上下文窗口，支持处理约10万汉字或40万字符的长文本。其特点包括量化友好设计（4/8位量化性能损失小于3%）、3.8T训练tokens带来的较强数学推理能力（GSM8K基准65.5%），以及动态位置编码与FlashAttention-2优化的长文本处理效率。适用于长篇文档理解、学术论文分析、代码生成等场景。

Yi 9B

Yi-9B是零一万物开源的8.8B参数大语言模型，主打代码与数学能力，综合性能超越Mistral-7B等同类模型。支持4K上下文，可在消费级显卡部署，适用于开发与轻量化应用。

Gemini 1.5 Pro

Gemini 1.5 Pro是谷歌DeepMind开发的多模态大模型，采用稀疏混合专家架构，支持文本、图像、音频、视频及代码理解，上下文窗口达128万token，推理效率较前代提升40%。适用于电商客服、推荐系统等通用场景，可与Google Maps等生态集成，性价比均衡但中文术语处理需优化。

GLM 4

GLM-4是智谱AI研发的第四代通用预训练大语言模型，基于Transformer架构，2024年推出基础版，2025年迭代至GLM-4.6版本。其核心特点包括：在中英文基准测试（如MMLU、GSM8K）中性能接近GPT-4，中文指令理解和对齐度超越GPT-4；支持200K上下文窗口，长文本处理能力媲美GPT-4 Turbo；智能工具调用能力（Web搜索、代码解释器等）超越GPT-4 All Tools；推理效率提升，Token消耗减少30%，并适配国产芯片降低部署成本。应用场景涵盖代码开发、智能体构建、长文本分析及国产化AI解决方案，已开源并通过MaaS平台提供API服务。

Cogview 3

CogView-3 是智谱AI开发的级联扩散文本生成图像模型，基于GLM技术栈，分三阶段生成高分辨率图像，较SDXL人工评估优77%且推理时间仅为其1/10，支持1024x1024等多分辨率，适用于设计、广告、艺术创作等场景，已开源并上线“智谱清言”平台。

Baichuan2 13B Chat

Baichuan2-13B-Chat是百川智能开发的开源大语言模型，逻辑推理、知识百科等基础能力居200亿参数量级国内模型首位，可私有化部署，适用于内容创作、智能客服及垂直行业，低算力终端亦可运行。