Doubao-Seed-Translation是字节跳动火山引擎推出的多语言翻译大模型,基于Transformer架构,支持28种语言互译。具备高准确性(BLEU评分42.5)和流畅度,适用于跨境电商、国际合作、教育学习等通用文本翻译场景。

AI 模型
聚合主流模型能力入口,适合选型、对比和快速检索。
当前显示第 1 / 1 页,共 17 条结果,本页区间为 1-17,当前标签为 Doubao。
Doubao-Seed-1.6是字节跳动2025年6月发布的多模态大模型系列,包含主力模型及Flash、Thinking等版本,支持256K上下文,具备深度思考、多模态理解与图形操作能力,已在豆包APP及火山引擎ToB场景上线。
Doubao - Seedream - 4.0是国产多模态生图模型,支持文本与图像组合输入,能深度理解提示词,避免元素分离与拼凑问题,可生成4K高清图像。适用于设计师、插画师、广告及影视分镜创作等场景。
Doubao - Seedream - 3.0 - t2i是字节跳动推出的中英双语图像生成基础模型,属文生图第一梯队。特点:2k原生高分辨率,小字生成准、排版优,指令遵循力强,美感与结构佳,响应速度快,EvalMuse等多测试排名第一。适用于设计、创意等场景。
Doubao-SeedEdit-3.0-i2i是图像编辑模型,支持通过自然语言提示进行复杂视觉操作,如背景移除、光线调整和姿势改变,具备随机数种子控制生成随机性的特点,专为商业用途设计,应用于广告、内容创作和电子商务领域。
Doubao-1.5-pro-32k是字节跳动豆包大模型系列产品,为AI大模型。采用稀疏MoE架构,硬件成本低、推理效率高,多模态能力强,支持视觉理解和实时语音交互,在知识、代码、推理等测评中表现优于GPT-4o等模型,适用于文案生成、智能交互等场景。
Doubao-Seed-1.6-flash是豆包大模型1.6系列的极速响应型模型,主打低延迟(TPOT仅10ms),支持256K上下文与多模态理解,视觉能力媲美旗舰模型。适用于智能座舱交互、高频咨询、智能硬件等实时场景,助力企业降低延迟60%、成本70%。
Doubao-Seedance-1.0-pro是字节跳动推出的视频生成大模型,支持文生/图生视频,输出1080P分辨率,最长10秒。特点:多镜头无缝切换,动态效果自然,主体运动稳定,生成速度快(5秒视频约40秒),成本低(5秒1080P视频3.6元左右)。应用于创意内容制作、营销视频、社交娱乐等场景,通过即梦AI、火山引擎等平台开放。
Doubao-Seed-1.6-vision 是字节跳动发布的多模态视觉深度思考模型,支持 256K 上下文窗口与工具调用,可自动调用旋转、放大等图像处理工具。适用于视频理解、医疗影像分析、制造业质检等场景,已在豆包 APP 及火山引擎开放。
Doubao-Seed-1.6-thinking 是豆包大模型1.6系列的深度思考强化版本,属代码与逻辑推理优化型大语言模型。特点为支持256K超长上下文,在数学推理、代码编写等基础能力上显著提升,复杂推理测试达全球前列水平,可独立规划并使用搜索工具完成深度研究任务。适用于复杂业务场景落地,如快速生成专业调研报告、高考级数学解题、高精度代码开发等需强逻辑分析的场景。
Doubao-1.5-thinking-pro 是字节跳动自研的 200B 参数 MoE 架构大语言模型,具备深度推理与低延迟特性。采用「先思后言」路径提升编程、数学等领域推理能力,20 毫秒延迟优化交互流畅度,适用于开发协作、复杂问题求解等场景。
豆包1.5·UI-TARS是火山引擎发布的GUI Agent大模型,整合屏幕视觉理解、逻辑推理、界面元素定位与操作能力,突破传统自动化工具依赖预设规则的局限,可驱动图形用户界面交互完成复杂任务,已在火山方舟平台上线。
Doubao-1.5-thinking-vision-pro是多模态AI模型,具备视觉理解与深度思考能力,支持图文、语音交互,适用于专业领域推理与创意任务。
Doubao-1.5-vision-lite是火山引擎推出的性价比多模态大模型,支持任意分辨率和极端长宽比图像识别,增强视觉推理、文档识别、细节理解和指令遵循能力,适用于图像分析、文档处理等场景。
Doubao-1.5-vision-pro-32k是字节跳动推出的多模态大模型,支持文本、图像输入与输出,具备任意分辨率及极端长宽比图像识别能力,增强视觉推理、文档识别、细节理解和指令遵循能力,最大思维链内容长度32k,适用于复杂视觉任务与长文本交互场景。
Doubao-1.5-lite-32k是字节跳动推出的轻量级通用大模型,属豆包1.5系列。采用MoE架构,以轻量版成本实现原专业版性能,响应快、推理准,适合对时延敏感的简单任务。
Doubao-embedding是字节跳动研发的语义向量化模型,支持中英双语,输出稠密向量维度2048(可降维至512/1024),适用于语义搜索、推荐系统等场景。其240715版本提升中英文检索效果,升级版Doubao-embedding-large在MTEB和BRIGHT榜单达SOTA,优化推理密集型检索任务。