ERNIE-4.5-21B-A3B-Thinking是百度开源的深度思考模型,采用混合专家(MoE)架构,总参数210亿,每token激活30亿参数。支持128K上下文窗口,适用于长文本推理、逻辑数学科学任务、代码生成及工具调用,实现高效复杂任务自动化处理。

AI 模型
聚合主流模型能力入口,适合选型、对比和快速检索。
当前显示第 8 / 9 页,共 257 条结果,本页区间为 211-240,当前标签为 文本。
kimi-thinking-preview是月之暗面推出的多模态思考模型,具备多模态推理与通用推理能力,擅长深度推理。作为k系列最新思考模型,可通过更换model或openai SDK使用,目前处于预览版阶段,暂不支持工具调用、联网搜索等功能。
o1-mini是OpenAI推出的轻量级STEM推理优化模型,基于强化学习训练,成本较o1-preview低80%,延迟更低且速率限制更高。专为数学、编码等复杂推理任务设计,在AIME数学竞赛中达70%正确率,适合学术研究、技术开发等场景,但非STEM事实知识表现较弱。
o1-preview是OpenAI推出的专业化推理大模型预览版,采用强化学习和思维链技术,通过内部思路链生成实现复杂逻辑推理,在数学、科学、编码等领域表现突出,如AIME数学竞赛解决率达93%。适用于多步骤问题解决、代码编写等场景,但成本较高、速度较慢,目前向ChatGPT Plus等付费用户开放。
ERNIE-4.5-300B-A47B-Paddle是百度文心大模型4.5系列中的300B参数多模态模型,采用异构MoE架构,单次推理激活470亿参数,支持128K超长上下文,通过2-bit压缩技术实现低资源部署。适用于医疗影像分析、长文档解析、工业质检等复杂场景,兼顾高性能与部署效率。
ERNIE-4.5-21B-A3B-Paddle是百度推出的文本混合专家(MoE)语言大模型,总参数量210亿,每个token激活30亿参数。采用异构MoE架构与模态隔离路由技术,依托飞桨框架优化,适配智能对话、内容创作等轻量化场景,提供ERNIEKit微调与FastDeploy部署工具链,基于Apache 2.0协议开源。
kimi-k2-turbo-preview是月之暗面(Moonshot AI)推出的Kimi K2高速版大语言模型,为混合专家(MoE)架构,总参数1万亿、激活参数320亿,上下文窗口达256K。输出速度60-100Token/s,为普通版6倍,适用于代码生成、长文本处理、工具调用等场景,在开源模型中性能领先。
kimi-k2-0905-preview是混合专家架构的开源基础模型,编程能力突出,Agentic Coding能力在测试和任务中表现佳,上下文长度扩展至256K,有高速版API。适用于AI编程工具、云服务部署等场景。
Gemini 1.5 Flash 8B是谷歌推出的轻量级多模态语言模型,参数规模80亿,支持文本、图像、音频等多模态处理。特点为低成本(100万输入令牌0.0375美元)、高效率,适用于大容量低复杂度任务。使用场景包括初创企业AI开发测试、基础多模态应用等。
ERNIE-4.5-VL-424B-A47B-Paddle是百度文心4.5系列多模态大模型,采用异构MoE架构,支持""思考/非思考""双模式,在MathVista等多模态基准测试中表现比肩OpenAI-o1,已部署于工业质检等边缘设备场景。
ERNIE-4.5-VL-28B-A3B是百度开源的280亿参数多模态模型,具备文本与图像/视频理解能力。特点包括工程图纸理解准确率98.2%、降低40%误检率,支持从图表到报告全流程生成。应用于新闻出版(效率提升3倍)、制造业质检、法律文书分析等场景,已适配英特尔等硬件加速卡。
ERNIE-4.5-0.3B是百度推出的0.36B参数轻量级语言大模型,基于PaddlePaddle框架,支持SFT、DPO等基础微调,采用卷积编码量化技术实现4位/2位无损压缩,适配多芯片边缘部署,适用于对话、创作及轻量化文本处理场景,开源协议为Apache 2.0。
Grok-2是xAI开发的多模态大模型,支持文本、图像、视频交互,具备实时信息获取(DeepSearch模式)、代码生成与代理任务能力,强调逻辑推理与客观性。适用于科学查询、创意生成、编程开发及特斯拉车载交互等场景,支持网页和移动应用访问。
Grok-2 mini 是 xAI 推出的轻量化 AI 模型,基于 Grok-2 优化,特点为快速响应、文本交互友好,适用于简单文本任务。支持多语言处理,可集成实时检索能力,应用于问答、信息检索及基础文本生成。
moonshot-v1-128k-vision-preview 是 Moonshot AI 推出的多模态视觉模型,支持 128k 上下文长度,可理解图片内容并输出文本。具备多轮对话、流式输出、工具调用及 JSON 模式等特性,适用于大规模图像处理、实时交互等场景。暂不支持联网搜索和带图片的 Context Caching。
moonshot-v1-32k-vision-preview是一个具备视觉理解能力的大语言模型,上下文长度32k,可处理图片内容并输出文本,适用于图文结合的长文本生成场景。
moonshot-v1-8k-vision-preview 是 Moonshot AI 推出的多模态视觉模型,支持 8k 上下文长度,可理解图片内容并输出文本,适用于图像描述、图文问答等场景。
GPT-4o mini是OpenAI推出的轻量化多模态大语言模型,支持文本/图像输入,较GPT-3.5-turbo更智能且速度相当,响应迅速,适用于基础文本生成、简单信息查询等日常任务,免费用户可自动切换使用,简化了数据分析等高级功能。
kimi-k2-0711-preview是北京月之暗面科技开发的基于MoE架构的万亿参数开源语言模型,代码、搜索、创作、推理能力全面提升,速度更快,适用于编程、数据分析、内容创作、文件解读等复杂任务,赋能程序员、科研人员等专业人士。
Hunyuan-Role是腾讯混元系列大模型中专注于角色扮演场景的优化版本,属于对话式语言模型。其核心特点包括:基于丰富角色扮演数据训练,在互动语气、剧情推进、多轮对话等场景表现优于通用模型;支持长指令(最大输入28K)和角色设定遵循,可还原人设并主动引导话题;已应用于互动内容平台,作为“亲密朋友”类虚拟角色核心能力,满足情感陪伴与精神寄托需求。
Gemma 2 9B是谷歌DeepMind开发的开源轻量级大语言模型,属Gemini技术体系,90亿参数规模。特点:采用滑动窗口注意力与知识蒸馏技术,8万亿token训练,性能超Llama 3 8B;支持多框架部署,适配边缘设备与云端。适用于边缘AI、文档问答、代码生成等场景。
Gemma 2 27B是谷歌开源的轻量级文本生成大模型,基于Transformer架构,性能媲美LLaMA3 70B。支持单GPU/TPU高效推理,适配家用电脑及云端部署,适用于低成本AI开发与本地部署场景。
PP-UIE-7B是通用信息抽取大模型,具备零样本和小样本学习能力,通过输入格式与样例提升输出准确性和规范性,适用于多领域信息抽取任务。
PP-UIE-14B是PaddleNLP推出的14B参数通用信息抽取大模型,属UIE系列,支持实体识别、关系抽取等NLP任务,零样本和小样本性能突出,CMeEE数据集小样本F1值达0.588,适配本地化部署,适用于需要高效信息抽取的开发场景。
PP-DocBee是百度飞桨推出的文档图像理解多模态大模型,基于ViT+MLP+LLM架构,具备强大中文文档解析能力,可高效处理文字、表格、图表等内容,推理性能优化,响应快且输出质量高,适用于文档问答、复杂文档解析,支持多种部署方式。
Claude 3.5 Sonnet是Anthropic发布的多模态大语言模型,属中等尺寸,性能介于Haiku和Opus间。特点是编码能力领先,修复64%代码错误,支持计算机使用功能,可模拟人类操作完成多步骤任务,运行速度为前代Opus两倍,能理解细微指令与复杂数据,生成自然类人内容,擅长图表解释和低质量图像文本转录。适用于客户支持、多步骤工作流、代码开发、创意写作及数据洞察分析等场景。
GLM-4-9B是由智谱AI推出的开源大语言模型,属GLM-4系列。具备多模态能力,支持26种语言,上下文处理达1M token(约200万字),中文对齐和代码能力提升40%,可调用外部工具,适用于长文本处理、多语言交互和复杂任务协作。
moonshot-v1-128k是Moonshot AI推出的大语言模型,核心特点为128k超长上下文长度(含输入与输出),专注于超长文本生成任务。其与同系列模型效果无差异,主要通过上下文长度区分,供用户按需选择。
Moonshot-v1-8k是由月之暗面(Kimi)开发的语言模型,具备8K上下文窗口(约8192 token),适用于短文本生成。支持内容创作、代码生成、摘要、对话等任务,需通过明确指令和范例优化输出。
Moonshot-v1-32k是Moonshot AI推出的千亿参数语言模型,支持32K上下文窗口,具备优秀语义理解、指令遵循和文本生成能力,适用于长文本理解与生成,应用于内容创作、代码生成、文本摘要等场景。