Gemini 2.5 Pro Preview 06-05是谷歌Gemini 2.5系列的全能力旗舰大模型,支持文本、图像、音视频等多模态输入,具备百万级上下文处理能力(输入超100万tokens,输出64K tokens),采用动态推理预算机制优化复杂任务准确率。适用于学术研究、软件开发、创意工作及企业数据分析等场景。

AI 模型
聚合主流模型能力入口,适合选型、对比和快速检索。
当前显示第 5 / 10 页,共 300 条结果,本页区间为 121-150。
""QianfanHuijin-Reason-70B""即百度千帆慧金金融推理增强大模型70B版本,是面向金融行业的大参数模型。基于数百亿tokens高质量金融语料训练,支持32K上下文输入,擅长复杂推理与多轮任务规划,适用于投研辅助、策略分析等场景,金融Benchmark得分超千亿参数通用模型。
QianfanHuijin-70B(千帆慧金-70B)是百度智能云推出的金融行业大模型,基于Llama 3.1架构,参数量700亿,支持32K上下文与思维链推理。特点为金融知识增强与推理优化,适用于投研分析、风险管控等复杂任务,实测辅助金融销售成单率提升25%,报告解读错误率下降60%。
盘古-NLP-N4-Reasoner-128K-3.0.1.2是华为盘古3.0系列NLP基础大模型,属L0层通用模型,支持128K上下文长度,具备逻辑推理能力,可处理文本问答、文案生成、代码创作等任务,适用于通用及行业场景下的长文本理解与生成。
盘古-NLP-N2-Reasoner-128K-5.0.0.1是华为盘古系列NLP大模型,属基于逻辑推理的AI模型,支持128K上下文长度,可接入预训练文本、多轮问答等文本数据集,适用于智能客服、文本解析、行业知识检索等场景,提供API接口支持多语言开发。
华为盘古NLP大模型Pangu-NLP-N1-Reasoner-128K-3.0.1.1,2025年6月发布,属自然语言处理模型。支持128K序列长度推理,4推理单元384并发。具备逻辑推理等能力,可用于智能文档搜索等场景。
Pangu-NLP-N2-Reasoner-32K-3.0.1.1是华为盘古系列NLP大模型,属专业推理型,支持32K上下文窗口,2025年6月发布。具备强逻辑推理与结构化输出能力,支持INT8量化,适配云API与本地部署,适用于智能客服、金融分析等复杂文本处理场景。
Pangu-NLP-N4-Reasoner-32K-3.0.1.2是华为云盘古系列NLP大模型,属N4大参数量(718B MOE)版本,支持32K序列长度推理,需8个推理单元部署,聚焦逻辑推理任务,适用于企业级知识处理与智能决策场景。
Pangu-AgentExpert-N2-0.0.2(盘古-AgentExpert-N2-0.0.2)是华为云盘古 NLP(自然语言处理)大模型系列下的一个垂直领域专精模型。
Pangu-AgentExpert-N1-0.0.2是基于华为盘古NLP大模型微调的Agent场景模型,2025年6月发布,支持32K序列长度,1推理单元部署,256并发。具备意图识别、提问器功能,算法优化后性能较传统模型提升显著,适用于智能交互、自动化任务处理等场景。
Claude Sonnet 4 是Anthropic于2025年5月推出的Claude 4系列通用型大语言模型,定位高性能均衡型,支持文本/图像输入与200K上下文窗口,以动态混合推理机制平衡效率与成本。其特点为编码效率突出(SWE-bench达72.7%)、响应速度快且支持多工具调用,适用于编程辅助、AI Agent开发、日常开发、内容生成及数据分析等场景,对免费用户开放基础功能。
Claude Opus 4是Anthropic公司2025年推出的大语言模型,属Claude 4系列高端版本,擅长编码与复杂问题解决,性能远超同系列Sonnet模型。支持网页端/APP使用(付费),适用于编程开发、科研分析及复杂任务处理。
Gemini Diffusion是Google DeepMind推出的实验性文本扩散语言模型,采用扩散技术通过逐步优化噪声生成输出,非传统自回归逐词预测。其特点为生成速度快(2000token/秒),支持迭代纠错与编辑,编程和数学任务表现出色。适用于快速文本生成、代码编写及数学问题解决等场景。
GPT-4o是OpenAI开发的多模态大语言模型,于2024年5月发布,“o”代表“全能”,支持文本、图像等多模态处理。性能高效,应用于对话、内容生成、图像理解等场景,2025年3月更新后图像生成能力媲美专业工具,优化指令解析与创造力。
Qwen3-8B是阿里开源的82亿参数因果语言模型,具备双模式切换功能,思考模式适用于数学计算、代码生成等复杂推理任务,非思考模式优化日常对话与信息检索的响应速度。原生上下文长度32K,支持100+种语言,推理速度比LLaMA3-8B快25.8%,显存占用仅8-10GB,适用于企业级部署与开发者高效开发。
Qwen3-32B是阿里开源的320亿参数推理大模型,2025年4月发布,支持128K上下文,中英文均衡,逻辑推理、代码生成能力强。Apache 2.0协议免费商用,适合企业本地化部署,用于智能引擎、长文本处理等场景。
Qwen-Omni-Turbo-Realtime是通义千问推出的实时音视频聊天模型,能同时理解流式音频与图像输入(如视频流连续图像帧),并实时输出高质量文本与音频,适用于实时音视频交互场景。
Qianfan-Llama-VL-8B是百度千帆团队开发的80亿参数多模态大语言模型,基于Llama 3.1架构与InternViT视觉编码器,支持32k上下文窗口。具备三大核心特点:支持思维链推理,可处理复杂图表理解与数学解题;OCR与文档理解能力突出,能精准识别手写体及复杂版面;适配服务器端部署,兼顾性能与效率。主要应用于通用视觉语言任务及企业级微调场景。
hunyuan-functioncall 是 混元最新 MOE 架构 FunctionCall 模型,经过高质量的 FunctionCall 数据训练,上下文窗口达 32K,增强了复杂指令和多轮理解能力,增强了开源 BenchMark 的效果,在多个维度的评测指标上处于领先。
o4-mini是OpenAI推出的小型推理模型,优化了速度与成本,擅长数学、编程及视觉任务,支持20万Token上下文与工具调用,适用于高吞吐量场景。
o3是OpenAI推出的最强推理模型,属深度学习驱动的通用人工智能模型。特点是能调用工具整合信息,多步骤推理解决复杂问题,在编码、数学、科学及视觉任务表现突出,如Codeforces等基准测试创最佳成绩,比o1少20%重大错误。适用于编程开发、商业咨询、创意构思、科学研究等场景。
GPT-4.1是OpenAI推出的多规格大语言模型,包括GPT-4.1、Mini和Nano版本,主打编码优化,较GPT-4o提升60%,支持百万token长上下文,指令遵循更精准,退化行为减少,适用于复杂编程、结构化文档分析与多跳推理,供开发者通过API调用。
GPT-4.1 nano是OpenAI推出的超小型语言模型,定位为速度最快、成本最低的""小核""产品,支持百万token上下文,适用于自动补全、分类、信息提取等低延迟边缘场景,MMLU得分80.1%,部分性能超GPT-4o mini,API调用成本极低。
Qwen2-72B-Instruct是阿里云通义千问团队开源的720亿参数指令微调大语言模型,支持128K上下文长度,采用GQA机制优化推理效率。具备跨29种语言能力,代码生成HumanEval评分85.1%,数学推理GSM8K达89.7%,适用于知识问答、复杂指令处理、多语言翻译等场景。
腾讯混元Turbo是腾讯于2024年9月发布的新一代大语言模型,采用MoE(混合专家)架构,总参数达万亿级别。其特点包括推理效率提升100%、成本降低50%,在数学推理、文本创作等任务上对标GPT-4o,支持AI搜索联网插件及SearchGPT功能。主要应用于腾讯内部近700个业务场景,如腾讯云、QQ、微信读书等,并通过腾讯云API向企业开放。
华为盘古图生视频模型Pangu-MM-M2-AIGVideo-1.0.0,支持多比例5秒视频生成与96帧续写,8推理单元部署
Pangu-MM-M2-Text2Video-1.0.0是华为云2025年4月发布的文本转视频模型,支持16:9、9:16等5种长宽比,可生成5秒时长视频,需8个推理单元部署,适用于多场景短视频创作。
Pangu-MM-M1-Txt2Img-1.0.0是2025年4月发布的文本生成图像模型,支持1024*1024分辨率,涵盖写实、油画、动漫等数十种风格,需8个推理单元部署。
Pangu-RAG-N1-32K-4.3.2 是华为云盘古系列的检索增强生成(RAG)模型,支持32K上下文窗口,云上部署需1个推理单元。具备零代码开发能力,可配置知识库与插件实现智能问答,适用于电商客服、教育答疑等场景,通过工具调用提升复杂任务处理效率。
""qwen-omni-turbo""是阿里云通义千问推出的多模态大模型,支持文本、图像、语音、视频输入,流式输出文本与语音,提供4种对话音色。具备119种文本语言、19种语音输入及10种语音输出能力,适用于智能交互、内容生成等场景,可通过API调用,免费额度100万Tokens。