Gemma 2 9B是谷歌DeepMind开发的开源轻量级大语言模型,属Gemini技术体系,90亿参数规模。特点:采用滑动窗口注意力与知识蒸馏技术,8万亿token训练,性能超Llama 3 8B;支持多框架部署,适配边缘设备与云端。适用于边缘AI、文档问答、代码生成等场景。

AI 模型
聚合主流模型能力入口,适合选型、对比和快速检索。
当前显示第 10 / 10 页,共 300 条结果,本页区间为 271-300。
Gemma 2 27B是谷歌开源的轻量级文本生成大模型,基于Transformer架构,性能媲美LLaMA3 70B。支持单GPU/TPU高效推理,适配家用电脑及云端部署,适用于低成本AI开发与本地部署场景。
PP-UIE-7B是通用信息抽取大模型,具备零样本和小样本学习能力,通过输入格式与样例提升输出准确性和规范性,适用于多领域信息抽取任务。
PP-UIE-14B是PaddleNLP推出的14B参数通用信息抽取大模型,属UIE系列,支持实体识别、关系抽取等NLP任务,零样本和小样本性能突出,CMeEE数据集小样本F1值达0.588,适配本地化部署,适用于需要高效信息抽取的开发场景。
PP-DocBee是百度飞桨推出的文档图像理解多模态大模型,基于ViT+MLP+LLM架构,具备强大中文文档解析能力,可高效处理文字、表格、图表等内容,推理性能优化,响应快且输出质量高,适用于文档问答、复杂文档解析,支持多种部署方式。
Claude 3.5 Sonnet是Anthropic发布的多模态大语言模型,属中等尺寸,性能介于Haiku和Opus间。特点是编码能力领先,修复64%代码错误,支持计算机使用功能,可模拟人类操作完成多步骤任务,运行速度为前代Opus两倍,能理解细微指令与复杂数据,生成自然类人内容,擅长图表解释和低质量图像文本转录。适用于客户支持、多步骤工作流、代码开发、创意写作及数据洞察分析等场景。
GLM-4-9B是由智谱AI推出的开源大语言模型,属GLM-4系列。具备多模态能力,支持26种语言,上下文处理达1M token(约200万字),中文对齐和代码能力提升40%,可调用外部工具,适用于长文本处理、多语言交互和复杂任务协作。
moonshot-v1-128k是Moonshot AI推出的大语言模型,核心特点为128k超长上下文长度(含输入与输出),专注于超长文本生成任务。其与同系列模型效果无差异,主要通过上下文长度区分,供用户按需选择。
Moonshot-v1-8k是由月之暗面(Kimi)开发的语言模型,具备8K上下文窗口(约8192 token),适用于短文本生成。支持内容创作、代码生成、摘要、对话等任务,需通过明确指令和范例优化输出。
Moonshot-v1-32k是Moonshot AI推出的千亿参数语言模型,支持32K上下文窗口,具备优秀语义理解、指令遵循和文本生成能力,适用于长文本理解与生成,应用于内容创作、代码生成、文本摘要等场景。
Yi-Medium是零一万物(01.AI)推出的大模型API产品,支持超长文本处理,具备200K上下文窗口,可一次性解读20万字文本,适用于文档分析、知识库构建等场景。其API接口支持轻量化数学分析、代码生成及文本聊天,兼顾性能与效率。
Yi-Large是零一万物推出的旗舰级闭源大模型,对标早期GPT-4,具备16k上下文长度,指令遵从与综合性能优异,中英文能力突出(AlpacaEval 2.0英语第二、SuperCLUE中文榜首),适用于复杂NLP、智能助手、决策支持及深度内容创作,但代码生成能力待提升。
CogView-3-Plus是智谱推出的文本生成图像模型,为CogView3的DiT版本,性能达领先T2I模型水平。采用DiT框架、Zero-SNR调度及文本-图像联合注意力机制,支持512 - 2048像素生成,兼顾效果与成本。可用于广告设计、新闻配图、出版物插画等场景。
GLM-4-Long是智谱AI推出的长文本大模型,支持1M tokens(约150-200万字)上下文,100万tokens仅需1元。适用于小说创作、学术综述、代码文档生成等场景,提供“构思-初稿-润色”全流程支持。
Yi-Large-RAG 是零一万物 (01.AI) 公司推出的 Yi-Large 模型与 检索增强生成 (RAG) 技术相结合的一种应用模式或解决方案。
CogView-3-Flash是智谱推出的免费AI图像生成模型,支持文本生成高质量图像,具备多分辨率(如1024x1024等)、快速推理及创意多样性特点,适用于广告设计、艺术创作、教育等场景。
Yi-Large-Turbo是零一万物Yi系列大模型中的高性价比版本,定位为平衡性能、速度与成本的通用语言模型。其特点是在保持接近旗舰模型Yi-Large性能的同时,通过高精度调优实现更优推理效率,适用于全场景、高品质的文本生成及推理任务。该模型已通过阿里云百炼平台开放API服务,支持企业及开发者接入使用。
GLM-4-Plus 是智谱AI于2024年推出的大语言模型,属GLM-4系列增强版。采用合成数据优化与PPO算法提升推理能力,在SuperCLUE测评中位列国内第一梯队,与GPT-4o差距小于2分。支持API调用,适用于文本生成、智能问答等场景,需通过智谱开放平台接口使用。
GLM-4-Assistant是智谱AI开发的多模态对话大模型,支持128K上下文(部分版本达1M token),中文对齐能力超GPT-4,可动态调用多工具协同处理复杂任务。适用于学术解析、长文档处理、智能客服等场景。
GLM-4-AllTools是智谱AI推出的智能体优化型大语言模型,基于GLM-4架构强化工具调用能力。特点包括自主规划工具使用(支持联网搜索、代码解释器、文生图等)、多模态任务处理及超长上下文理解。适用于复杂推理、数据分析、智能开发等场景,部分任务表现优于GPT-4 All Tools。
GLM-4-Flash是智谱AI推出的高效能大语言模型,基于10T多语言数据训练,采用FP8技术提升效率。特点包括128K长上下文推理、72.14 token/s生成速度,支持多轮对话与工具调用。适用于智能助手、内容生成、RAG知识库等场景,提供免费API。
GLM-4-FlashX是智谱AI开发的GLM-4系列语言模型,定位为高性能推理模型,具备超快推理速度与高并发处理能力,主打极致性价比以降低使用门槛。适用于智能对话、文本处理等场景,通过API接口提供服务,需通过智谱MaaS平台调用。
Grok-1.5V是xAI推出的多模态AI模型,支持文本、图像等处理,具备128K长上下文与高级推理能力,数学、编码任务表现优异。适用于专业问题解决、日常交互,未来或集成于特斯拉车辆。
Grok-1.5是xAI于2024年3月发布的语言模型,基于优化训练系统提升推理能力,支持128K令牌上下文,在数学(MATH 50.6%、GSM8K 90%)和代码生成(HumanEval 74.1%)任务表现突出,面向X平台早期测试者提供长文本理解与高级推理功能。
Yi-9B-200K是零一万物推出的90亿参数量开源大语言模型,具备200K超长上下文窗口,支持处理约10万汉字或40万字符的长文本。其特点包括量化友好设计(4/8位量化性能损失小于3%)、3.8T训练tokens带来的较强数学推理能力(GSM8K基准65.5%),以及动态位置编码与FlashAttention-2优化的长文本处理效率。适用于长篇文档理解、学术论文分析、代码生成等场景。
Yi-9B是零一万物开源的8.8B参数大语言模型,主打代码与数学能力,综合性能超越Mistral-7B等同类模型。支持4K上下文,可在消费级显卡部署,适用于开发与轻量化应用。
Gemini 1.5 Pro是谷歌DeepMind开发的多模态大模型,采用稀疏混合专家架构,支持文本、图像、音频、视频及代码理解,上下文窗口达128万token,推理效率较前代提升40%。适用于电商客服、推荐系统等通用场景,可与Google Maps等生态集成,性价比均衡但中文术语处理需优化。
GLM-4是智谱AI研发的第四代通用预训练大语言模型,基于Transformer架构,2024年推出基础版,2025年迭代至GLM-4.6版本。其核心特点包括:在中英文基准测试(如MMLU、GSM8K)中性能接近GPT-4,中文指令理解和对齐度超越GPT-4;支持200K上下文窗口,长文本处理能力媲美GPT-4 Turbo;智能工具调用能力(Web搜索、代码解释器等)超越GPT-4 All Tools;推理效率提升,Token消耗减少30%,并适配国产芯片降低部署成本。应用场景涵盖代码开发、智能体构建、长文本分析及国产化AI解决方案,已开源并通过MaaS平台提供API服务。
CogView-3 是智谱AI开发的级联扩散文本生成图像模型,基于GLM技术栈,分三阶段生成高分辨率图像,较SDXL人工评估优77%且推理时间仅为其1/10,支持1024x1024等多分辨率,适用于设计、广告、艺术创作等场景,已开源并上线“智谱清言”平台。
Baichuan2-13B-Chat是百川智能开发的开源大语言模型,逻辑推理、知识百科等基础能力居200亿参数量级国内模型首位,可私有化部署,适用于内容创作、智能客服及垂直行业,低算力终端亦可运行。