Best 推理代理 AI Tools & Models - Premium 推理代理 News

AI News

xAI 推最快语音代理 API，支持中文实时搜索与情绪控制

xAI发布Grok语音代理API，每分钟仅0.05美元，性价比极高。该模型在音频推理基准测试中表现最佳，首音延迟不到1秒，响应速度比竞品快近5倍。支持包括中文在内的数十种语言自动检测与切换，并集成实时网页搜索与推理能力，提升回复质量。

6k just now

谷歌发布全新 Gemini 深度研究助手，AI 竞争再升级

谷歌推出基于Gemini 3 Pro的深度研究助手，旨在从报告撰写工具升级为自主研究代理，具备长时间推理和复杂数据分析能力，可处理并浓缩大量信息，提供更详细准确的报告。

9.2k 8 hours ago

Anthropic 推出 Claude Opus4.5:迈向更高智能与效率的混合推理模型

Anthropic发布旗舰模型Claude Opus4.5，在编码、智能代理操作和电脑使用等关键生产力场景达到世界领先水平，同时在研究、演示文稿等常见任务上也有显著提升。核心能力包括推理与长期任务管理，软件工程能力在真实测试中表现卓越。

9.2k 9 hours ago

Anthropic 推出 Claude Opus4.5:迈向更高智能与效率的混合推理模型

全新思考模型 “月之暗面 Kimi K2 Thinking” 发布，AI的边界再被突破！

月之暗面发布并开源Kimi K2Thinking模型，显著提升智能代理和推理能力。该模型能自主边思考边使用工具，无需用户干预，支持长达300轮工具调用和多轮深度思考，旨在高效处理复杂任务。

12.1k 12-11

全新思考模型 “月之暗面 Kimi K2 Thinking” 发布，AI的边界再被突破！

AI Products

ViDoRAG

ViDoRAG 是一个结合视觉文档检索增强生成的动态迭代推理代理框架。

AI模型

10.2k

MedRAX

MedRAX是一个用于胸部X光片解读的医疗推理AI代理，整合多种分析工具，无需额外训练即可处理复杂医疗查询。

医疗影像分析

11.6k

Husky-v1

开源语言代理，解决复杂多步推理任务。

AI模型

8.9k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

Kimi-K2

Moonshot

Input tokens/M

$16

Output tokens/M

256

Context Length

Doubao-1.5-pro-32k

Bytedance

$0.8

Input tokens/M

Output tokens/M

128

Context Length

qwen-vl-plus

Alibaba

$0.8

Input tokens/M

Output tokens/M

128

Context Length

Qianfan-VL-8B

Baidu

Input tokens/M

Output tokens/M

Context Length

Qianfan-VL-70B

Baidu

Input tokens/M

Output tokens/M

Context Length

MCP

Think Mcp

Think MCP是一个实现MCP服务器的项目，提供'think'工具以支持AI代理在复杂任务中进行结构化推理，灵感来自Anthropic的研究。该工具通过记录思考过程帮助AI处理信息、回溯或遵守策略，适用于工具输出分析、策略密集环境和顺序决策场景。

python

6.2k

2.5points

Ontology Mcp Server Rl Stable Baselines3

一个基于强化学习的智能电商对话代理系统，集成了本体推理、业务工具链、对话记忆和Gradio界面，通过Stable Baselines3 PPO算法实现从数据到训练再到部署的闭环学习，能自主优化购物助手的决策策略。

python

6.6k

2.5points

Mcp Agent Tool Adapter

MCP代理工具适配器项目通过MCP协议实现模块化工具调用，支持Google ADK和LangGraph两种代理框架，提供动态推理和工具规划能力。

python

9.2k

2.5points

Mcp Thought Server

MCP Thought Server是一个为AI代理提供高级思维工具的服务，通过模型上下文协议（MCP）增强推理、规划和迭代优化能力。它包含结构化思维、迭代草稿和集成思维等工具，支持SQLite持久化和高级置信度评分系统，可配置环境变量以适应不同需求。

typescript

8.6k

2.5points

Mcp Dual Cycle Reasoner

MCP双循环推理器是一个为自主AI代理设计的元认知增强工具，通过双循环框架（哨兵监控和裁决器管理）实现异常检测和经验学习，提升代理的自我意识和可靠性。

typescript

6.2k

2.5points

Deepseek R1 Reasoner

本地化运行的智能代理系统，结合推理模型与工具调用模型

typescript

6.9k

2.5points

Mcp Servers Pmo

Archon是一个自主构建和优化AI代理的智能系统，通过迭代开发展示现代AI的关键原则，包括代理推理、领域知识整合和可扩展架构。当前版本V4提供了全面的Streamlit界面，支持Docker部署，并与MCP服务集成以实现AI IDE的无缝对接。

python

7.7k

2.5points

Mcp Server Architect

一个基于MCP协议的AI软件架构师服务器，能够分析代码库生成产品需求文档(PRD)并为复杂编码任务提供推理辅助，采用多模型架构和智能代理设计。

python

6.4k

2.0points

Mts Mcp

该项目提供了一系列MCP服务器和专用AI代理，用于扩展Claude的功能，包括包管理、知识图谱、推理引擎及多种平台集成能力。

typescript

7.8k

2.0points

Langgraph Mcp Agents

MCP Agent Tool Adapter是一个通过MCP协议实现模块化工具调用的项目，支持Google ADK和LangGraph两种代理动态推理工具。

python

9.6k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

xAI 推最快语音代理 API，支持中文实时搜索与情绪控制

​谷歌发布全新 Gemini 深度研究助手，AI 竞争再升级

Anthropic 推出 Claude Opus4.5:迈向更高智能与效率的混合推理模型

全新思考模型 “月之暗面 Kimi K2 Thinking” 发布，AI的边界再被突破！

AI Products

ViDoRAG

MedRAX

Husky-v1

Models

GPT-4.1 mini

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-vl-plus

Qianfan-Lightning

qwen3-max

qwen3-vl-235b-a22b-thinking

Qwen3-Next-80B-A3B-Instruct

Kimi-K2

Doubao-1.5-pro-32k

qwen-vl-plus

Qianfan-VL-8B

Qianfan-VL-70B

Pokee_research_7b GGUF

GLM 4.6 GGUF

GTA1 32B

Jupyter Agent Qwen3 4b Thinking GGUF

Megrez2 3x7B A3B GGUF

Sleeper Proxy Tinyllama 1.1b Gguf

DeepSeek V3.1 AWQ Lite

NVIDIA Nemotron Nano 9B V2

GLM 4.5 Air AWQ 8bit

Gpt Oss 20b GGUF

GLM 4.5 GGUF

GLM 4.5 AWQ 4bit

GLM 4.5 Air AWQ 4bit

GLM 4.5 Air AWQ

Llama 3_3 Nemotron Super 49B V1_5 AWQ 4bit

Llama 3_3 Nemotron Super 49B V1_5 AWQ

Llama 3_3 Nemotron Super 49B V1_5 GGUF

Llama 3_3 Nemotron Super 49B V1_5

InternVL3 78B Instruct GGUF

InternVL3 14B Instruct GGUF

MCP

Think Mcp

Ontology Mcp Server Rl Stable Baselines3

Mcp Agent Tool Adapter

Mcp Thought Server

Mcp Dual Cycle Reasoner

Deepseek R1 Reasoner

Mcp Servers Pmo

Mcp Server Architect

Mts Mcp

Langgraph Mcp Agents

谷歌发布全新 Gemini 深度研究助手，AI 竞争再升级