十两 AI 导航

AI 模型

聚合主流模型能力入口，适合选型、对比和快速检索。

全部文本阿里通义 AI 模型腾讯混元 Qwen 百度视频智谱 GLM Google Hunyuan Qwen3 图像 OpenAI Pangu 字节豆包 Doubao GLM Gemma

当前显示第 1 / 1 页，共 17 条结果，本页区间为 1-17，当前标签为 Doubao。

Doubao Seed Translation

Doubao-Seed-Translation是字节跳动火山引擎推出的多语言翻译大模型，基于Transformer架构，支持28种语言互译。具备高准确性（BLEU评分42.5）和流畅度，适用于跨境电商、国际合作、教育学习等通用文本翻译场景。

Doubao Seed 1.6

Doubao-Seed-1.6是字节跳动2025年6月发布的多模态大模型系列，包含主力模型及Flash、Thinking等版本，支持256K上下文，具备深度思考、多模态理解与图形操作能力，已在豆包APP及火山引擎ToB场景上线。

Doubao Seedream 4.0

Doubao - Seedream - 4.0是国产多模态生图模型，支持文本与图像组合输入，能深度理解提示词，避免元素分离与拼凑问题，可生成4K高清图像。适用于设计师、插画师、广告及影视分镜创作等场景。

Doubao Seedream 3.0 T2i

Doubao - Seedream - 3.0 - t2i是字节跳动推出的中英双语图像生成基础模型，属文生图第一梯队。特点：2k原生高分辨率，小字生成准、排版优，指令遵循力强，美感与结构佳，响应速度快，EvalMuse等多测试排名第一。适用于设计、创意等场景。

Doubao SeedEdit 3.0 I2i

Doubao-SeedEdit-3.0-i2i是图像编辑模型，支持通过自然语言提示进行复杂视觉操作，如背景移除、光线调整和姿势改变，具备随机数种子控制生成随机性的特点，专为商业用途设计，应用于广告、内容创作和电子商务领域。

Doubao 1.5 Pro 32k

Doubao-1.5-pro-32k是字节跳动豆包大模型系列产品，为AI大模型。采用稀疏MoE架构，硬件成本低、推理效率高，多模态能力强，支持视觉理解和实时语音交互，在知识、代码、推理等测评中表现优于GPT-4o等模型，适用于文案生成、智能交互等场景。

Doubao Seed 1.6 Flash

Doubao-Seed-1.6-flash是豆包大模型1.6系列的极速响应型模型，主打低延迟（TPOT仅10ms），支持256K上下文与多模态理解，视觉能力媲美旗舰模型。适用于智能座舱交互、高频咨询、智能硬件等实时场景，助力企业降低延迟60%、成本70%。

Doubao Seedance 1.0 Pro

Doubao-Seedance-1.0-pro是字节跳动推出的视频生成大模型，支持文生/图生视频，输出1080P分辨率，最长10秒。特点：多镜头无缝切换，动态效果自然，主体运动稳定，生成速度快（5秒视频约40秒），成本低（5秒1080P视频3.6元左右）。应用于创意内容制作、营销视频、社交娱乐等场景，通过即梦AI、火山引擎等平台开放。

Doubao Seed 1.6 Vision

Doubao-Seed-1.6-vision 是字节跳动发布的多模态视觉深度思考模型，支持 256K 上下文窗口与工具调用，可自动调用旋转、放大等图像处理工具。适用于视频理解、医疗影像分析、制造业质检等场景，已在豆包 APP 及火山引擎开放。

Doubao Seed 1.6 Thinking

Doubao-Seed-1.6-thinking 是豆包大模型1.6系列的深度思考强化版本，属代码与逻辑推理优化型大语言模型。特点为支持256K超长上下文，在数学推理、代码编写等基础能力上显著提升，复杂推理测试达全球前列水平，可独立规划并使用搜索工具完成深度研究任务。适用于复杂业务场景落地，如快速生成专业调研报告、高考级数学解题、高精度代码开发等需强逻辑分析的场景。

Doubao 1.5 Thinking Pro

Doubao-1.5-thinking-pro 是字节跳动自研的 200B 参数 MoE 架构大语言模型，具备深度推理与低延迟特性。采用「先思后言」路径提升编程、数学等领域推理能力，20 毫秒延迟优化交互流畅度，适用于开发协作、复杂问题求解等场景。

Doubao 1.5 UI TARS

豆包1.5·UI-TARS是火山引擎发布的GUI Agent大模型，整合屏幕视觉理解、逻辑推理、界面元素定位与操作能力，突破传统自动化工具依赖预设规则的局限，可驱动图形用户界面交互完成复杂任务，已在火山方舟平台上线。

Doubao 1.5 Thinking Vision Pro

Doubao-1.5-thinking-vision-pro是多模态AI模型，具备视觉理解与深度思考能力，支持图文、语音交互，适用于专业领域推理与创意任务。

Doubao 1.5 Vision Lite

Doubao-1.5-vision-lite是火山引擎推出的性价比多模态大模型，支持任意分辨率和极端长宽比图像识别，增强视觉推理、文档识别、细节理解和指令遵循能力，适用于图像分析、文档处理等场景。

Doubao 1.5 Vision Pro 32k

Doubao-1.5-vision-pro-32k是字节跳动推出的多模态大模型，支持文本、图像输入与输出，具备任意分辨率及极端长宽比图像识别能力，增强视觉推理、文档识别、细节理解和指令遵循能力，最大思维链内容长度32k，适用于复杂视觉任务与长文本交互场景。

Doubao 1.5 Lite 32k

Doubao-1.5-lite-32k是字节跳动推出的轻量级通用大模型，属豆包1.5系列。采用MoE架构，以轻量版成本实现原专业版性能，响应快、推理准，适合对时延敏感的简单任务。

Doubao Embedding

Doubao-embedding是字节跳动研发的语义向量化模型，支持中英双语，输出稠密向量维度2048（可降维至512/1024），适用于语义搜索、推荐系统等场景。其240715版本提升中英文检索效果，升级版Doubao-embedding-large在MTEB和BRIGHT榜单达SOTA，优化推理密集型检索任务。