Best AI Websites & Tools
zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
M2UGen
多模态音乐理解和生成系统
普通产品
音乐
音乐生成
音乐理解
打开网站
M2UGen是一个结合大语言模型的多模态音乐理解和生成框架,旨在帮助用户进行音乐创作。它能同时完成音乐理解和多模态音乐生成任务。
网站截图
产品特色
需求人群
使用示例
使用教程
打开网站
文本到音乐生成
图像到音乐生成
视频到音乐生成
音乐理解
音乐编辑
音乐创作、音乐理解研究、音乐应用开发
用户可以通过文本描述生成所需的音乐
用户可以上传图像
生成匹配图像风格的音乐
用户可以上传视频
生成匹配视频氛围的音乐背景音乐
打开网站
M2UGen 最新流量情况
月总访问量
63
跳出率
45.80%
平均页面访问数
1.0
平均访问时长
00:00:00
M2UGen 访问量趋势
M2UGen 访问地理位置分布
M2UGen 流量来源
M2UGen 替代品
UniMuMo
— 统一文本、音乐和动作生成模型
音乐
•
机器学习
•
多模态
144
MA-LMM
— 面向长期视频理解的大规模多模态模型
视频
•
视频理解
•
多模态
684
mPLUG-DocOwl
— 文档理解的模块化多模态大语言模型
生产力
•
文档理解
•
多模态
234
ChatHi
— 多功能AI智能助手平台
聊天
•
智能助手
•
大语言模型
18
Infini-Megrez
— 端侧全模态理解模型,软硬协同释放无穹端侧智能
生产力
•
深度学习
•
多模态
18
POINTS-Yi-1.5-9B-Chat
— 视觉语言模型的最新进展,集成微信AI的新技术
生产力
•
视觉语言模型
•
微信AI
18
POINTS-Qwen-2-5-7B-Chat
— 视觉语言模型的最新进展
生产力
•
视觉语言模型
•
多模态
30
WePOINTS
— WePOINTS项目,提供多模态模型的统一框架
编程
•
多模态
•
模型融合
42
RapBank
— 首个说唱音乐生成数据集
音乐
•
说唱音乐
•
数据集
18
InternVL 2.5
— 开源多模态大型语言模型系列
生产力
•
多模态
•
大型语言模型
12
InternVL2_5-4B
— 多模态大型语言模型,融合视觉与语言理解。
图像
•
多模态
•
大型语言模型
18
InternVL2_5-2B
— 多模态大型语言模型,支持图像与文本的深度交互
图像
•
多模态
•
大型语言模型
30
InternVL2_5-1B
— 多模态大型语言模型,支持图像和文本理解
图像
•
多模态
•
大型语言模型
72
Gemini 2.0 Flash
— 下一代开发者AI工具,提升开发效率与应用互动性
国外精选
•
开发
•
代码辅助
150
Gemini 2.0
— Google新一代AI模型,开启智能助理新时代。
全球热门
•
智能助理
•
多模态
372
MAmmoTH-VL
— 大规模多模态推理与指令调优平台
其他
•
多模态
•
推理
30
SunoAiFree
— 免费AI音乐生成器,快速创作高质量音乐。
音乐
•
AI音乐
•
文本到音乐
96
InternViT-6B-448px-V2_5
— 基于InternViT-6B-448px-V1-5的增强版视觉模型
图像
•
视觉模型
•
特征提取
48
InternVL2_5-8B
— 多模态大型语言模型,支持图像与文本的交互理解。
图像
•
多模态
•
大型语言模型
84
InternVL2_5-26B
— 多模态大型语言模型,融合视觉与语言理解。
图像
•
多模态
•
大型语言模型
42
InternVL2_5-38B
— 先进的多模态大型语言模型系列
图像
•
多模态
•
大型语言模型
108
InternVL2_5-78B
— 先进多模态大型语言模型系列
图像
•
多模态
•
大型语言模型
48
Qwen2-VL-7B
— Qwen2-VL-7B是最新的视觉语言模型,支持多模态理解和文本生成。
图像
•
视觉语言模型
•
多模态
24
Qwen2-VL-2B
— 最先进的视觉语言模型,支持多模态理解和文本生成。
图像
•
视觉语言模型
•
多模态
24
Pi-智能演示文档
— AI驱动的演示文档制作平台
中文精选
•
AI文档工具
•
演示文档
1128
Amazon Nova
— Amazon Nova是亚马逊新一代的基础模型,提供前沿智能和行业领先的性价比。
国外精选
•
AWS
•
技术创新
138
Aria-Base-64K
— 多模态原生Mixture-of-Experts模型
生产力
•
多模态
•
长文本处理
12
Qwen2vl-Flux
— 先进的多模态图像生成模型,结合文本提示和视觉参考生成高质量图像。
图像
•
图像生成
•
多模态
318
jina-clip-v2
— 多语言多模态嵌入模型,用于文本和图像检索。
生产力
•
多模态
•
多语言
36