欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、国产AI逆袭!零一万物新模型Yi-Lightning超越GPT-4o

近日,由全球千万用户盲测投票产生的 AI 模型排行榜公布,国产 AI 模型“Yi-Lightning”逆袭,超越了此前长期占据榜首的 GPT-4。 

QQ20241016-145235.jpg

【AiBase提要:】

🏆 “Yi-Lightning”一举登顶,超越GPT-4,名列多个分榜前茅,展现强大实力和技术创新。

⚡ “Yi-Lightning”采用混合专家模型架构和优化的混合注意力机制,处理长序列数据高效,信息共享更加高效。

💡 “Yi-Lightning”能动态选择最合适的专家网络组合,确保在各种挑战中游刃有余。

详情链接:https://x.com/lmarena_ai/status/1846245604890116457

2、阿里国际Marco-MT模型:AI翻译领域的新突破

阿里国际推出的Marco-MT翻译大模型在全球化商业环境中具有重要意义,提升了机器翻译能力,支持电商国际化。该模型准确性和文化敏感性突出,价格优惠,支持多种语言互译,成为电商出海的得力助手。

image.png

【AiBase提要:】

🌐 Marco-MT模型提升了机器翻译能力,在处理文化背景深厚的短语时表现突出。

💡 深入分析上下文和场景,提供精准的翻译结果,对电商领域尤为重要。

💰 Marco-MT模型性价比极高,支持多种语言互译,成为跨境电商商家的经济实惠选择。

详情链接:https://aidc-ai.com/page/translation.htm#tryout

3、物理课本竟然“活”了!Augmented Physics让静态图表秒变动图

加拿大卡尔加里大学研究人员开发的Augmented Physics工具将静态物理课本图表转化为交互式模拟,为物理教育带来革新。这项技术利用先进的计算机视觉技术和多模态大型语言模型,让教师和学生能够从课本页面中提取图表并生成交互式模拟,提升学习体验。

视频来自官方,翻译:小互

【AiBase提要:】

✨ 利用计算机视觉技术和多模态大型语言模型将静态物理图表转化为交互式模拟

🔬 支持多种物理模拟,包括牛顿运动、光学、电路和循环动画

⚙️ 用户可通过简单创作过程选择特定对象进行分割,操作并调整参数值与模拟结果交互

详情链接:https://arxiv.org/pdf/2405.18614

4、逐际动力首款人形双足机器人TRON1正式开售

逐际动力推出首款多形态人形双足机器人TRON1,售价仅为6.98万元,活动能力超强,稳固抗击打能力出色,支持三种足端设计,价格友好适合入门级科研和开发者。

image.png

【AiBase提要:】

🌟 TRON1是首款多形态人形双足机器人,售价仅为6.98万元,支持三种足端设计。

🤖 提供全开放SDK与底层硬件接口,支持Python开发,降低科研门槛。

💡 逐际动力成立于2022年,获得知名投资机构支持,专注人形机器人研发。

5、TANGO,一个接近HeyGen的强大解决方案

TANGO是一个创新项目,能够生成与音频完美匹配的全身动作视频,核心优势在于独特的生成逻辑和技术基础。开源性质吸引开发者和技术爱好者,应用前景广阔,简化了视频制作过程。然而,与HeyGen类似项目相比,TANGO在全身动作生成方面取得了突破性进展。

【AiBase提要:】

🔑 TANGO支持生成与音频匹配的全身动作视频

🚀 TANGO的生成逻辑包括分析样本、选择最佳动作序列和生成流畅过渡帧

💡 TANGO的技术基础建立在音频运动嵌入和扩散插值算法上

详情链接:https://pantomatrix.github.io/TANGO/

6、儿子使用AI答题受到惩罚 家长怒了!把学校告上法庭

在马萨诸塞州Hingham发生的一起高中生因使用AI而受到严厉处罚的案例引发了教育界对AI政策的讨论。家长和律师呼吁学校提供更清晰的AI使用指导,强调AI是一种工具,必须明确可做和不可做的事情。学校已发布新的AI使用指导方针,全国教育协会也通过了AI政策,为学校和教育工作者提供参考。

【AiBase提要:】

🤖 AI在教育中应用引发争议,马萨诸塞州Hingham的案例引起广泛关注。

🔍 学生因使用AI收集研究资料遭到严厉处罚,家长和律师呼吁学校提供明确指导。

💡 学校发布新的AI使用指导方针,全国教育协会通过AI政策,为教育工作者提供参考。

7、OpenAI迎来新任首席信息安全官

OpenAI近期经历了人事动荡,但随着前Palantir首席信息安全官Dane Stuckey加入,公司注入新鲜血液。Stuckey强调安全性的重要性,将助力OpenAI与政府合作关系。公司加强安全团队建设,招聘新负责人构建安全AI基础设施。

【AiBase提要:】

🔒 Dane Stuckey加入OpenAI担任首席信息安全官,强调安全性的重要性。

🤝 Stuckey在Palantir的丰富经验将助力OpenAI与政府的合作关系。

🛡️ OpenAI近期加强安全团队,招聘新负责人以构建安全AI基础设施。

8、版权风暴再起!纽约时报严厉警告AI搜索引擎公司Perplexity,要求停止使用其内容

近日,著名媒体《纽约时报》向一家名为Perplexity的AI初创公司发出了停止令,要求停止使用其内容。这一举动再次引发了关于内容版权的热议,凸显了数字化时代下保护创作者权益的紧迫性。

image.png

【AiBase提要:】

🌐 《纽约时报》向AI公司Perplexity发送停止令,要求其停止使用内容。

⚖️ 纽约时报曾对OpenAI提起诉讼,指控未经授权使用大量文章。

🔍 Perplexity提供的“答案引擎”服务引发了关于内容版权的新一轮讨论。

9、Anthropic更新安全政策,设置 “安全门槛”以避免AI失控

Anthropic公司更新了“责任扩展政策(RSP)”,旨在有效管理高能力AI系统带来的潜在风险。该政策引入能力阈值,明确标志AI模型能力提升时的额外安全保障,以防止技术被恶意利用。设立“责任扩展官”角色监督合规性,确保安全措施到位。更新的政策旨在为AI行业树立安全标准,促进透明度和自我监管。

【AiBase提要:】

🌟 Anthropic更新“责任扩展政策”,引入能力阈值以加强AI风险管理。

🛡️ 新政策设立“责任扩展官”角色,监督AI安全协议的执行与合规。

🚀 政策旨在为AI行业树立安全标准,促进透明度和自我监管。

10、Google AI推出Gemma-APS:革新文本分割的新型命题解析模型

Google AI最近发布了Gemma-APS,这是一套专门用于文本到命题分割的模型集合,旨在解决当前机器学习模型在处理复杂人类语言时面临的挑战。 Gemma-APS的应用范围广泛,表现出卓越性能,提高了语言模型的工作效率,降低了文本分析过程中的语义漂移风险,对保留原始文本含义至关重要。

image.png

【AiBase提要:】

✨ Gemma-APS源自Gemini Pro模型,通过多领域合成数据训练,提高了模型的versatility。

💡 Gemma-APS能高效分割复杂文本为有意义命题单元,为后续NLP任务奠定基础,准确性和计算效率优于现有模型。

🚀 Gemma-APS的发布标志着文本分割技术的重要突破,有望改变NLP应用中复杂文本的解释和分解方式。

详情链接:https://huggingface.co/collections/google/gemma-aps-release-66e1a42c7b9c3bd67a0ade88

11、FunASR推出多语种离线转录软件包

FunASR推出的多语种离线转录软件包为用户提供了高效、精准的语音转文本解决方案,特别适用于处理大量音频材料的专业人士。该软件包支持多种语言,提供词级时间戳和自定义热词功能,全面集成先进模型确保高质量转录结果。开发者可享受丰富的客户端库,实际应用中表现出色,支持并发处理和初始时间规范化,部署简便。

image.png

【AiBase提要:】

⚙️ 软件包核心优势在于离线文件转录能力,能处理长达数小时的音频或视频文件,生成带有标点符号的转录文本。

🌐 多语言支持包括中文、英语、日语、粤语和韩语,展现卓越的语音识别能力,提供词级时间戳精确定位音频内容。

🛠️ 提供自定义热词功能,用户可定义术语或专有名词优化识别结果,支持并行处理多个转录请求,提升工作效率。

详情链接:https://github.com/modelscope/FunASR/blob/main/runtime/docs/SDK_advanced_guide_offline.md