AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

Al硬件

列出所有AI硬件产品。

AI变现指南

最新案例

AI变现案例分享

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

最新教程

免费分享最新AI教程内容

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

热门国家排行榜

美国

美国用户最喜欢的AI网站

中国

中国用户最喜欢的AI网站

印度

印度用户最喜欢的AI网站

巴西

巴西用户最喜欢的AI网站

热门分类榜

图片生成

AI图片生成网站总访问量榜单

个人助理

AI个人助理网站总访问量榜单

角色生成网站

AI角色生成网站总访问量榜单

视频生成

AI视频生成网站总访问量榜单

热门开源数据榜单

AI项目榜单

热门AI项目总Start榜单

AI项目增速榜

热门AI项目增速榜

AI开发者排名

热门AI开发者排名

AI组织排名

热门AI组织排名榜单

热门开源分类

deepseek

热门deepseek开源项目

TTS

热门TTS开源项目

LLM

热门LLM开源项目

ChatGPT

热门ChatGPT开源项目

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

搜索全球AI产品动态

搜索全球AI信息，发现AI新机遇

✓新闻资讯
产品应用

类型 :

✓新闻资讯
产品应用

2025-04-16 17:03:19.AIbase

字节跳动开源Liquid多模态模型，革新视觉与语言统一生成

人工智能领域迎来一项重大突破。AIbase从社交媒体获悉，字节跳动于近日宣布开源其全新多模态生成模型Liquid，该模型以创新的统一编码方式和单一大语言模型（LLM）架构，实现了视觉理解与生成任务的无缝整合。这一发布不仅展示了字节在多模态AI上的技术雄心，也为全球开发者提供了强大的开源工具。以下是AIbase对Liquid模型的深度解析，探索其技术创新、核心发现及行业影响。Liquid模型亮相:统一多模态生成新范式Liquid是一个基于自回归生成的多模态模型，其核心创新在于将图像和文本

字节跳动开源Liquid多模态模型，革新视觉与语言统一生成

2025-04-10 11:33:10.AIbase

OmniSVG横空出世：复旦联手阶跃星辰打造多模态矢量图生成新标杆

近日，复旦大学与国内AI创新企业阶跃星辰宣布即将推出一款名为OmniSVG的端到端多模态SVG生成模型，这一消息迅速引发了科技与设计领域的广泛关注。据AIbase了解，OmniSVG以其强大的生成能力为核心，支持从简单图标到复杂动漫角色的矢量图生成，为数字艺术创作提供了全新的智能解决方案。这一模型的问世，或将重新定义矢量图生成的技术边界。多模态生成:灵活应对多样需求OmniSVG的最大亮点在于其支持三种生成模式:通过文字描述生成SVG图像、将图片转化为矢量图，以及基于角色参考生成

2025-03-06 18:00:26.AIbase

Portkey AI Gateway：轻松整合多种大语言模型的开源AI解决方案

随着开源 AI 框架的快速发展，开发者们在部署 AI 模型时获得了前所未有的灵活性。Portkey AI Gateway 作为一款开源项目，旨在简化 AI 模型的编排，提供统一的 API 接口，助力开发者轻松整合多种 AI 模型。除了支持大型语言模型（LLMs），Portkey 还涵盖了视觉、音频(文本转语音和语音转文本)、图像生成等多模态生成 AI 模型。图源备注：图片由AI生成，图片授权服务商MidjourneyPortkey AI Gateway 的设计初衷在于解决开发者在集成和管理多个 LLM 提供商时面临的诸多挑战，包括供应商锁定、不同模型性能

Portkey AI Gateway：轻松整合多种大语言模型的开源AI解决方案

2025-03-04 09:41:14.AIbase

华科字节推出 Liquid：重新定义多模态模型的生成与理解

近年来，大语言模型（LLM）在人工智能领域取得了显著进展，尤其是在多模态融合方面。华中科技大学、字节跳动与香港大学的联合团队最近提出了一种新型的多模态生成框架 ——Liquid，旨在解决当前主流多模态模型在视觉处理上的局限性。传统的多模态大模型依赖复杂的外部视觉模块，这不仅增加了系统的复杂性，还限制了其扩展性。Liquid 的创新之处在于，它采用 VQGAN 作为图像分词器，摒弃了对外部视觉组件的依赖，通过将图像编码为离散的视觉 token，使得模型可以直接与文本 token 共

华科字节推出 Liquid：重新定义多模态模型的生成与理解

2024-12-11 14:41:42.AIbase

机构：2029 年全球生成式 AI 市场预计将达 728 亿美元

根据市场研究机构 Omdia 的最新报告，全球生成式人工智能（AI）市场仍处于起步阶段，预计将在未来五年内实现五倍增长，从2024年的146亿美元跃升至2029年的728亿美元。这个市场的增长主要受到消费类、企业服务、零售、媒体娱乐和医疗保健等领域的推动。图源备注:图片由AI生成，图片授权服务商Midjourney生成式 AI 的应用领域正不断扩展，其中多模态生成式 AI 技术被认为是下一个前沿，因其能够实现多样化的功能，正在推动各行业的应用案例。具体而言，这些技术已经在客户服务、企业知

机构：2029 年全球生成式 AI 市场预计将达 728 亿美元

2024-12-11 14:22:16.AIbase

全球生成式AI市场五年内将增长五倍，突破728亿美元大关

根据Omdia今天发布的最新预测，全球生成式AI市场在未来五年将迎来爆发式增长，预计从2024年的146亿美元增长到2029年的728亿美元，增长幅度为五倍。预计消费类、企业服务、零售业、媒体娱乐业和医疗保健业将成为这一增长的主要驱动力。图源备注：图片由AI生成，图片授权服务商MidjourneyOmdia指出，多模态生成式AI技术是生成式AI的下一个前沿领域。凭借其日益增强的多样化功能，这一技术正在推动各行业的应用案例，如客户服务、企业知识管理、3D数字分身以及制造业等。多模态生成式AI通

全球生成式AI市场五年内将增长五倍，突破728亿美元大关

2024-10-31 13:27:57.AIbase

字节跳动推出AI模型社区平台：炉米Lumi 类似Liblib和CIvitai

10 月 31 日讯字节跳动悄然上线了一款名为"炉米Lumi"的AI模型分享社区平台。据悉，该平台将提供模型上传分享、Workflow搭建以及LoRA训练等功能，目前仍处于内测阶段，仅向白名单用户开放。

2024-10-29 13:53:42.AIbase

爱诗科技视频生成大模型PixVerse V3上线支持口型匹配、故事续写等能力

北京爱诗科技有限公司宣布，其最新版本的视频生成大模型PixVerse V3已全球同步公开上线。该版本在底层模型能力上实现了显著提升，提供了包括创意模板、口型匹配、故事续写和风格转换在内的多模态生成能力和丰富的AI玩法。

爱诗科技视频生成大模型PixVerse V3上线支持口型匹配、故事续写等能力

2024-08-15 16:59:04.AIbase

颠覆传统！Lumina-mGPT 可以从文本中创建逼真且高分辨率的图像

多模态生成模型正引领人工智能新潮流，专注于融合视觉与文本数据，以创造多功能AI系统，执行从图像生成到跨数据类型理解与推理的多种任务。其中，关键挑战是提升自回归（AR）模型能力，使其能根据文本描述生成高细节图像。尽管扩散模型在生成高质量图像方面表现出色，AR模型在图像质量、分辨率灵活性及多任务处理能力上相对滞后。上海AI实验室和香港中文大学的研究人员推出Lumina-mGPT，一种基于解码器-only的变换器架构，采用多模态生成预训练方法，旨在克服AR模型限制，实现与扩散模型同等水平的逼真图像生成，同时保持简便性和可扩展性。Lumina-mGPT采用详尽的灵活渐进的监督微调策略，增强图像生成能力，支持高分辨率图像生成（1024×1024像素），细节丰富且与文本提示高度一致。该模型在图像质量、视觉一致性及多种任务支持方面超越前代模型，仅需较小数据集即可实现卓越性能，预示未来AI系统将更加复杂与多才多艺。

颠覆传统！Lumina-mGPT 可以从文本中创建逼真且高分辨率的图像

2023-11-03 09:35:33.AIbase

加州大学圣克鲁斯分校研发开源多模态模型 MiniGPT-5

["加州大学圣克鲁斯分校研发 MiniGPT-5 模型，实现了文本和图像的有效对齐。","MiniGPT-5 采用了多模态编码器和 Generative Vokens 技术，生成连贯、高质量的文本和图像。","模型在多个数据集上的测试中表现优于对比基线，展现出强大的适应能力。"]