今日,抖音副总裁李亮就有关字节跳动可能掀起大模型价格战的传闻发表了看法。他在社交媒体上明确表示,这并非价格战,而是通过技术创新来降低 AI 模型的使用成本。据了解,在火山引擎Force大会上,字节跳动正式发布了豆包视觉理解模型,同时公布其售价为千tokens输入0.003元,比行业平均价格便宜85%。对于字节跳动再掀大模型价格战这一传闻,抖音副总裁李亮发文回应称:这不是价格战。他表示,豆包大模型通过技术创新来降低成本,在算法、软件工程和硬件方案上做了非常多优化,
在今日举办的火山引擎FORCE大会上,火山引擎CEO谭待宣布,豆包通用模型Pro自5月以来在多个领域取得了全面提升,包括综合能力、推理能力、指令遵循、代码执行和数学处理等方面。谭待表示:“更强大的模型将推动企业AI的全面升级。”豆包通用模型Pro的改进已帮助多个企业,尤其是中手游和赛力斯汽车等行业领先企业,在AI应用方面实现了显著的升级。图源备注:图片由AI生成,图片授权服务商Midjourney此外,豆包音乐模型也进行了重要升级,新增了支持更长时间的全曲生成功能,并且能够
阿联酋政府支持的技术创新研究所(TII)近日宣布推出其新一代开源小型语言模型(SLM)——Falcon3系列。这一系列包括四个不同规模的模型:1B、3B、7B和10B,并提供基础版与指令版两种变体,旨在为开发人员、研究人员和企业提供一种高效且成本低廉的AI解决方案。这些模型的推出,标志着AI功能的进一步民主化,能够在轻量级的单GPU基础设施上运行,满足对计算资源有限的设备和应用场景的需求。图源备注:图片由AI生成,图片授权服务商MidjourneyFalcon3的表现已在Hugging Face排行榜上脱颖而出,超
谷歌实验室近日在美国推出了最新的生成式人工智能实验工具 Whisk。与传统的图像生成工具主要依赖文本提示不同,Whisk 着重使用图像作为输入方法,允许用户更直观地创造艺术作品。用户可以直接上传图片至 Whisk,或者在该工具内生成图片,指定主题、场景和风格等元素。Whisk 系统支持用户混合和匹配这些组件,并可根据需要使用附加的文本提示进行微调。值得注意的是,在后台,谷歌的语言模型(可能是最近发布的 Gemini2.0Flash)会自动生成输入图像的详细描述。这些描述将输入到谷歌