阿里通义实验室 XR 实验室开源了文生 3D 新模型,可以通过一句文本描述生成对应的 3D 模型及纹理。开源的模型包括 Text-to-ND 和 Text-to-ND-MV 两个大模型。通义实验室 XR 实验室开源了 Text-to-ND 的基础版本以及 Multi-View 版本,满足不同细粒度的算法开发需求。还同步开源了从大模型中蒸馏出(Score Distillation Sampling)3D 模型的优化代码,串联可以完成文本直接到 3D 模型的生成。
阿里通义实验室 XR 实验室开源了文生 3D 新模型,可以通过一句文本描述生成对应的 3D 模型及纹理。开源的模型包括 Text-to-ND 和 Text-to-ND-MV 两个大模型。通义实验室 XR 实验室开源了 Text-to-ND 的基础版本以及 Multi-View 版本,满足不同细粒度的算法开发需求。还同步开源了从大模型中蒸馏出(Score Distillation Sampling)3D 模型的优化代码,串联可以完成文本直接到 3D 模型的生成。
在开源AI领域,与大型科技公司的差距不仅仅体现在算力上。AI2(前Allen人工智能研究所)正通过一系列开创性举措缩小这一鸿沟,其最新发布的Tülu3后训练方案,让"原始"大语言模型转化为实用AI系统变得触手可及。与普遍认知不同,基础语言模型在预训练后并不能直接投入使用。事实上,后训练过程才是决定模型最终价值的关键环节。正是在这个阶段,模型从一个"无所不知"却缺乏判断力的网络,转变为具有特定功能导向的实用工具。长期以来,各大公司对后训练方案讳莫如深。虽然任何
近日,谷歌宣布其基于人工智能的模糊测试工具 OSS-Fuzz 成功发现了26个开源代码库中的漏洞,其中包括 OpenSSL 加密库中的一个中等严重性漏洞。谷歌的开源安全团队在一篇分享的博客文章中表示:“这些漏洞的发现标志着自动化漏洞检测的新里程碑:每个漏洞都是通过 AI 生成和增强的模糊测试目标找到的。”图源备注:图片由AI生成,图片授权服务商Midjourney此次发现的 OpenSSL 漏洞编号为 CVE-2024-9143(CVSS 评分为4.3),其表现为一个越界内存写入错误,可能导致应用程序崩溃或远程代码执行。该
在2024年世界互联网大会乌镇峰会期间,阿里巴巴集团首席执行官吴泳铭于11月21日在互联网企业家论坛上发表了主题演讲,强调了人工智能(AI)对互联网行业的深远影响。他指出,今年互联网行业最大的变化依然是 AI 技术的迅速发展。吴泳铭表示,AI最大的价值绝不仅仅是在手机上做出一两个超级App,而是推动各行各业的生产力变革。发展AI需要建设繁荣的技术、产品和市场生态。目前,已有超过30万家企业接入阿里巴巴的通义大模型,利用 AI 技术重塑代码开发、药物研发、生产制造等多
近日,aiOla 宣布推出一款开源的 AI 音频转录模型Whisper-NER ,该模型在转录过程中能够实时遮蔽敏感信息。aiOla 的新 Whisper-NER 构建在 OpenAI 的行业标准开源模型 Whisper 之上,本身是完全开源的,现在可以在 Hugging Face 和 Github 上获得,供企业、组织和个人使用、使用、适应、修改和部署。该音频转录模型具备灵活的配置选项,用户可以根据需求选择是否对敏感信息进行遮蔽。当用户选择遮蔽功能时,模型会自动识别并隐藏如个人姓名、地址、电话号码等敏感信息,有效防止在转录文本中泄露