Google AI推出Gemma-APS：革新文本分割的新型命题解析模型

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年10月16号 9:45

188

Google AI近日发布了Gemma-APS，这是一套专门用于文本到命题分割的模型集合，旨在解决当前机器学习模型在处理复杂人类语言时面临的诸多挑战。

Gemma-APS源自经过微调的Gemini Pro模型，通过多领域合成数据训练而成。这种创新方法使模型能够适应各种句子结构和领域，大大提高了其versatility。该模型集合现以Gemma-7B-APS-IT和Gemma-2B-APS-IT两种版本在Hugging Face平台上提供，以满足不同的计算效率和准确性需求。

这些模型的核心优势在于能将复杂文本高效分割成包含底层信息的有意义命题单元，为后续NLP任务如摘要、信息检索等奠定基础。初步评估显示，Gemma-APS在准确性和计算效率方面均优于现有分割模型，尤其在捕捉复杂句子中的命题边界方面取得显著进展。

Gemma-APS的应用范围广泛，从技术文档解析到客户服务交互，再到非结构化文本中的知识提取，都显示出卓越性能。它不仅提高了语言模型的工作效率，还降低了文本分析过程中的语义漂移风险，这对保留原始文本含义至关重要。

Gemma-APS的发布标志着文本分割技术的重要突破。通过结合有效的模型提炼技术和多领域合成数据训练，Google AI成功创造了一个兼具性能和效率的模型集合，有望彻底改变NLP应用中复杂文本的解释和分解方式。

模型地址:https://huggingface.co/collections/google/gemma-aps-release-66e1a42c7b9c3bd67a0ade88

小型文本转语音模型Kokoro-TTS，曾拿下TTS排行榜第一

在人工智能的快速发展中，语音合成技术正日益受到关注。近日，名为 Kokoro 的最新语音合成模型在 Hugging Face 平台上正式发布，该模型具有8200万参数，标志着语音合成领域的一个重要里程碑。Kokoro v0.19在发布之前的几周里，在 TTS（文本转语音）领域的排行榜上位列第一，其表现甚至超过了其他参数更多的模型。这一模型在单声道设置下，仅用不到100小时的音频数据，便实现了与467M 参数的 XTTS v2和1.2B 参数的 MetaVoice 等模型相媲美的效果。这一成就表明，传统语音合成模型的性能与参数、

Hugging Face 与 AI 初创公司 FriendliAI 达成和解，结束专利侵权诉讼

Hugging Face，这家著名的人工智能开发平台，日前与韩国 AI 初创公司 FriendliAI 达成和解，结束了长达近两年的专利侵权诉讼。FriendliAI 曾指控 Hugging Face 侵犯其关于 “迭代级调度的批处理” 技术的专利，双方在特拉华州北区美国地方法院的文件中确认，已于1月8日达成 “保密协议”，并同意撤回诉讼。图源备注：图片由AI生成，图片授权服务商Midjourney根据法院的文件，FriendliAI 和 Hugging Face 双方同意不再追究本案的任何费用和开支，这意味着此案无法再次提起。尽管 Hugging Face 尚未对媒体的评

HuggingFace发布全新开源代码库smolagents：支持快速搭建Agent

HuggingFace推出了一款名为 “smolagents” 的全新开源库，该库旨在为语言模型赋予更强的智能代理能力。通过简化的代码结构，smolagents 使得用户能够更容易地构建能够执行各种任务的智能代理。在现代人工智能系统中，语言模型（LLM）需要与真实世界进行交互，比如调用搜索工具获取外部信息，或执行特定程序以完成任务。因此，赋予语言模型 “代理” 能力显得尤为重要。智能代理程序允许 LLM 输出控制工作流程，推动着 AI 的应用向前发展。那么，何时应使用智能代理?如果用户需要一种灵

IBM发布更新版Granite 3.1开源语言模型，性能大幅提升

近日，IBM 宣布推出其开源语言模型 Granite 的3.1版本，此次更新带来了诸多重要改进。新版本的模型经过重新设计，采用了更加密集的架构，能够一次处理多达128，000个令牌。这一更新意味着 Granite 在处理复杂文本和任务时的能力得到了显著增强。Granite3.1版本的模型经过了12种语言和116种编程语言的数据集训练，总共处理了12万亿个令牌。这使得模型在语言理解和生成方面的表现更加出色，能够更好地满足用户的需求。IBM 表示，这些新模型在回答使用外部数据的问题（RAG）、从非结构化文本

AI新闻资讯