AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

AI变现指南

最新案例

AI变现案例分享

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

最新教程

免费分享最新AI教程内容

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

热门国家排行榜

美国

美国用户最喜欢的AI网站

中国

中国用户最喜欢的AI网站

印度

印度用户最喜欢的AI网站

巴西

巴西用户最喜欢的AI网站

热门分类榜

图片生成

AI图片生成网站总访问量榜单

个人助理

AI个人助理网站总访问量榜单

角色生成网站

AI角色生成网站总访问量榜单

视频生成

AI视频生成网站总访问量榜单

热门开源数据榜单

AI项目榜单

热门AI项目总Start榜单

AI项目增速榜

热门AI项目增速榜

AI开发者排名

热门AI开发者排名

AI组织排名

热门AI组织排名榜单

热门开源分类

deepseek

热门deepseek开源项目

TTS

热门TTS开源项目

LLM

热门LLM开源项目

ChatGPT

热门ChatGPT开源项目

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

TAG-Bench

数据库查询的自然语言处理基准测试

普通产品编程自然语言处理数据库查询

TAG-Bench是一个用于评估和研究自然语言处理模型在回答数据库查询方面性能的基准测试。它基于BIRD Text2SQL基准测试构建，并通过增加对世界知识或超越数据库中明确信息的语义推理要求，提高了查询的复杂性。TAG-Bench旨在推动AI和数据库技术的融合，通过模拟真实的数据库查询场景，为研究者提供了一个挑战现有模型的平台。

TAG-Bench

TAG-Bench 最新流量情况

月总访问量

474564576

跳出率

36.20%

平均页面访问数

6.1

平均访问时长

00:06:34

TAG-Bench 访问量趋势

TAG-Bench 访问地理位置分布

TAG-Bench 流量来源

TAG-Bench 替代品

TAG-Bench

TAG-Bench — 数据库查询的自然语言处理基准测试

•自然语言处理•数据库查询

PARTNR

PARTNR — 多智能体任务规划与推理的基准测试

•多智能体•自然语言处理

Cheating LLM Benchmarks

Cheating LLM Benchmarks — 研究项目，探索自动语言模型基准测试中的作弊行为。

•自然语言处理•机器学习

Sequel

Sequel — 通过自然语言查询数据库，快速获取数据洞察。

•数据库查询•自然语言处理

DCLM-baseline

DCLM-baseline — 高性能语言模型基准测试数据集

•自然语言处理•语言模型

DeepSeek-V3-0324

DeepSeek-V3-0324 — 一个强大的文本生成模型，适用于多种对话应用。

•文本生成•对话系统

Reka Flash 3

Reka Flash 3 — 一款 21B 通用推理模型，适合低延迟应用。

•自然语言处理•开源

o1-pro

o1-pro — o1-pro 模型通过强化学习提升复杂推理能力，提供更优答案。

•自然语言处理•文本生成

Light-R1-14B-DS

Light-R1-14B-DS — 一款开源的14B参数量的数学模型，通过强化学习训练，性能卓越。

•强化学习•数学模型

理想同学网页版

理想同学网页版 — 理想同学是一款智能聊天助手，提供便捷的对话服务和智能交互体验。

•智能聊天•自然语言处理

Sesame AI

Sesame AI — Sesame AI 是一款先进的语音合成平台，能够生成自然对话式语音并具备情感智能。

•语音合成•自然语言处理

BashBuddy

BashBuddy — BashBuddy 让你能够自然地输入命令，无需担心参数或语法。

•命令行工具•自然语言处理

Responses API

Responses API — OpenAI API 的 Responses 功能，用于创建和管理模型的响应。

•自然语言处理•API

OpenAI Built-in Tools

OpenAI Built-in Tools — OpenAI 提供的内置工具，用于扩展模型的能力，如网络搜索和文件搜索。

•自然语言处理•模型增强

Awesome-LLM-Post-training

Awesome-LLM-Post-training — 一个关于大型语言模型（LLM）后训练方法的教程、调查和指南资源库。

•LLM•后训练

Gemini Embedding 文本嵌入模型

Gemini Embedding 文本嵌入模型 — Gemini Embedding 是一种先进的文本嵌入模型，通过 Gemini API 提供强大的语言理解能力。

•文本嵌入•自然语言处理

NeoBase

NeoBase — NeoBase 是一款开源的 AI 数据库助手，让你用自然语言与数据库交互。

•数据库•自然语言处理

Instella

Instella — Instella 是由 AMD 开发的高性能开源语言模型，专为加速开源语言模型的发展而设计。

•开源•语言模型

Clone

Clone — Clone是一款具有革命性人工肌肉技术Myofiber的类人机器人，能够自然行走。

•机器人•自然语言处理

Elimination Game

Elimination Game — 一种测试大语言模型在复杂社交博弈中智能性的基准测试框架，灵感来源于‘狼人杀’游戏。

•社交博弈•基准测试

ViDoRAG

ViDoRAG — ViDoRAG 是一个结合视觉文档检索增强生成的动态迭代推理代理框架。

•多模态•检索增强生成

Microsoft Dragon Copilot

Microsoft Dragon Copilot — Microsoft Dragon Copilot 是一款用于医疗行业的 AI 工作空间，可简化临床文档工作流，提升效率。

•医疗•文档自动化

Migician

Migician — Migician 是一个专注于多图像定位的多模态大语言模型，能够实现自由形式的多图像精确定位。

•多模态•图像定位

IndexTTS

IndexTTS — 工业级可控高效的零样本文本到语音系统

•语音合成•自然语言处理

M2RAG

M2RAG — 用于多模态上下文中的检索增强生成的基准测试代码库。

•多模态•检索增强生成

olmOCR

olmOCR — olmOCR是一个用于将PDF线性化以用于LLM数据集训练的工具包。

•PDF处理•LLM训练

Raycast AI Extensions

Raycast AI Extensions — Raycast 推出 AI Extensions，通过自然语言命令与电脑上的应用程序对话并执行任务。

•自然语言处理•生产力工具

MLGym

MLGym — MLGym是一个用于推进AI研究代理的新框架和基准。

•AI研究•强化学习

tablegpt-agent

tablegpt-agent — TableGPT2的预构建代理，用于基于表格的问答任务。

•自然语言处理•表格数据

bRAG-langchain

bRAG-langchain — 一个用于构建Retrieval-Augmented Generation (RAG)应用的开源项目。

•自然语言处理•检索增强生成