传播典范  创造价值

详细内容

产业调查 | 字节豆包视觉理解模型发布

图片3.jpg

仟江水商业电讯(12月23日 北京 产业调查)字节跳动豆包大模型全面升级,并发布豆包视觉理解模型,千tokens输入价格仅为3厘,为行业价格的15%。 


在12月18日举办的火山引擎Force大会上,豆包大模型家族迎来了全面升级,并正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。对比5月15日发布以来,豆包通用模型pro在综合能力上提升32%,数学能力提升43%,专业知识提升54%,推理能力提升13%,其日均tokens调用量也呈现快速增长的趋势,截至12月15号,豆包大模型日均tokens使用量突破4万亿,自发布以来7个月的时间里增长超过33倍。此次发布的视觉理解模型作为一款多模态基础模型,擅长处理复杂视觉任务,如图像识别、物体检测及场景理解,确保对图像信息的全面捕捉与理解,并对视觉内容中呈现的知识、文化背景、状态、情绪、数量、性质、位置等信息有更好的识别能力,能基于指令进行视觉内容识别,并对中国传统文化信息有更强的理解。在教育、旅游、电商购物等多个领域,该模型展现出广泛的应用潜力。价格方面,豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%。豆包大模型其他产品方面,豆包通用模型pro已全面对齐GPT-4o,使用价格仅为后者的1/8;音乐模型从生成60秒的简单结构,升级到生成3分钟的完整作品;文生图模型2.1版本在业界首次实现精准生成汉字和一句话P图的产品化能力,该模型已接入即梦AI和豆包App。从字节跳动AI大模型的广泛应用与加速落地来看,国内龙头企业正不断加大在AI产业的资本投入,国内AI产业商业化进程不断加快,建议关注AI相关产业链。


标题名称
更多
  • 微站

    微站

    点击上面链接或扫码左图浏览

  • 微信

    微信

    点击上面链接或扫码左图浏览

  • 小程序

    小程序

    点击上面链接或扫码左图浏览

  • APP

    APP

    点击上面链接或扫码左图浏览