传播典范创造价值

电讯

详细内容

产业调查 | 字节豆包视觉理解模型发布

图片3.jpg

仟江水商业电讯（12月23日北京产业调查）字节跳动豆包大模型全面升级，并发布豆包视觉理解模型，千tokens输入价格仅为3厘，为行业价格的15%。

在12月18日举办的火山引擎Force大会上，豆包大模型家族迎来了全面升级，并正式发布豆包视觉理解模型，为企业提供极具性价比的多模态大模型能力。对比5月15日发布以来，豆包通用模型pro在综合能力上提升32%，数学能力提升43%，专业知识提升54%，推理能力提升13%，其日均tokens调用量也呈现快速增长的趋势，截至12月15号，豆包大模型日均tokens使用量突破4万亿，自发布以来7个月的时间里增长超过33倍。此次发布的视觉理解模型作为一款多模态基础模型，擅长处理复杂视觉任务，如图像识别、物体检测及场景理解，确保对图像信息的全面捕捉与理解，并对视觉内容中呈现的知识、文化背景、状态、情绪、数量、性质、位置等信息有更好的识别能力，能基于指令进行视觉内容识别，并对中国传统文化信息有更强的理解。在教育、旅游、电商购物等多个领域，该模型展现出广泛的应用潜力。价格方面，豆包视觉理解模型千tokens输入价格仅为3厘，一元钱就可处理284张720P的图片，比行业价格便宜85%。豆包大模型其他产品方面，豆包通用模型pro已全面对齐GPT-4o，使用价格仅为后者的1/8；音乐模型从生成60秒的简单结构，升级到生成3分钟的完整作品；文生图模型2.1版本在业界首次实现精准生成汉字和一句话P图的产品化能力，该模型已接入即梦AI和豆包App。从字节跳动AI大模型的广泛应用与加速落地来看，国内龙头企业正不断加大在AI产业的资本投入，国内AI产业商业化进程不断加快，建议关注AI相关产业链。

上一页经济大势 | 11月工业利润数据显示：ROA持续接近贷款利率下一页产业调查 | 11月电力数据，核电出力环比加快，用电增速环比

标题

更多

友

情

链

接

标题名称

更多

微站

点击上面链接或扫码左图浏览
微信

点击上面链接或扫码左图浏览
小程序

点击上面链接或扫码左图浏览
APP

点击上面链接或扫码左图浏览

传播典范 创造价值

产业调查 | 字节豆包视觉理解模型发布

友 情 链 接

微站

微信

小程序

APP

传播典范创造价值

友

情

链

接