Best AI Websites & Tools

AI产品榜

AI产品榜

Chinese Tiny LLM

首个中文大语言模型，专注中文理解和生成

优质新品生产力中文语言模型

Chinese Tiny LLM（CT-LLM）是针对中文设计的首个大语言模型，拥有20亿参数，并在12000亿中文语料库上进行预训练。CT-LLM专注于提高对中文语言的理解和生成能力，利用大规模的中文数据预训练，实现对中文文本的高效处理。虽然重点优化了中文处理，CT-LLM也展示了对英文和编程代码的良好处理能力，体现了模型的多语言适应性。在中文语言任务的基准测试CHC-Bench上，CT-LLM展现了出色的性能，证明了其在理解和应用中文方面的高效能力。CT-LLM从零开始训练，主要使用中文数据进行预训练，开放了整个数据过滤过程、训练动态、训练和评估数据，以及模型的中间检查点等所有相关信息。该开放资源的做法使得其他研究者、开发者能够访问这些资源，利用这些资料进行自己的研究或进一步改进模型。

Chinese Tiny LLM

20亿参数的大语言模型
中文语言任务表现优秀
适应中文、英文和编程代码
开放资源支持进一步研究和应用

用于中文文本处理、生成和理解任务

用于中文NLP研究
中文文章自动生成
中文文本情感分析

Chinese Tiny LLM 最新流量情况

月总访问量

1841

跳出率

43.75%

平均页面访问数

1.0

平均访问时长

00:00:00

Chinese Tiny LLM 访问量趋势

Chinese Tiny LLM 访问地理位置分布

Chinese Tiny LLM 流量来源

Chinese Tiny LLM 替代品

YuLan-Mini — 一款高效率的2.4亿参数轻量级语言模型

编程•语言模型•自然语言处理

DeepHermes-3-Llama-3-8B-Preview — DeepHermes 3 是一款支持推理和常规响应模式的大型语言模型。

写作•语言模型•推理

Lora — Lora 是一个为移动设备优化的本地语言模型，支持 iOS 和 Android 平台。

编程•移动设备•语言模型

Crawl4LLM — 一个用于LLM预训练的高效网络爬虫工具，专注于高效爬取高质量网页数据。

编程•LLM•网络爬虫

PaliGemma 2 mix — PaliGemma 2 mix 是一款多功能的视觉语言模型，适用于多种任务和领域。

国外精选•图像识别•语言模型

Mistral Saba — Mistral Saba 是一款专为中东和南亚地区定制的区域语言模型。

生产力•语言模型•区域定制

OLMoE app — Ai2 OLMoE 是一款可在 iOS 设备上运行的开源语言模型应用

国外精选•开源•语言模型

podscript — 一个用于生成播客及其他音频文件转录文本的工具，支持多种语言模型和语音识别API。

生产力•音频转录•播客

Xwen-Chat — Xwen-Chat是专注中文对话的大语言模型集合，提供多版本模型及语言生成服务

聊天•语言模型•中文对话

LLM Codenames — 一个基于LLM的创意命名工具，帮助用户快速生成独特的名称。

生产力•创意•命名

Deeptrain — 为语言模型和AI代理提供视频处理服务，支持多种视频来源。

视频•视频处理•语言模型

Exa & Deepseek Chat App — 一个开源的聊天应用，使用Exa的API进行网络搜索，结合Deepseek R1进行推理。

聊天•开源•聊天

DeepSeek-R1-Distill-Llama-8B — DeepSeek-R1-Distill-Llama-8B 是一个高性能的开源语言模型，适用于文本生成和推理任务。

生产力•语言模型•推理

QwQ-32B-Preview-gptqmodel-4bit-vortex-v3 — 这是一个基于Qwen2.5-32B模型的4位量化版本，专为高效推理和低资源部署设计。

编程•语言模型•量化

ReaderLM v2 — ReaderLM v2是一个用于HTML转Markdown和JSON的前沿小型语言模型。

国外精选•语言模型•数据转换

MiniMax-Text-01 — MiniMax-Text-01是一个强大的语言模型，具有4560亿总参数，能够处理长达400万token的上下文。

生产力•语言模型•文本生成

MiniMax-01 — 强大的语言模型，拥有4560亿总参数，可处理长达400万token的上下文。

编程•语言模型•深度学习

fullmoon — 在口袋里拥有十亿参数，与私有本地大型语言模型聊天。

聊天•本地智能•语言模型

MiniCPM-o-2_6 — MiniCPM-o 2.6是一个强大的多模态大型语言模型，适用于视觉、语音和多模态直播。

其他•多模态•语言模型

MiniCPM-o

MiniCPM-o — MiniCPM-o 2.6：一款GPT-4o级别，可在手机上实现视觉、语音和多模态直播的MLLM。

其他•多模态•语言模型

Nemotron-CC — 将Common Crawl转化为精细的长期预训练数据集

编程•数据集•预训练

中文互联网语料资源平台 — 提供高质量中文语料资源，助力人工智能大模型预训练。

其他•语料库•预训练

rStar-Math

rStar-Math — 展示小型语言模型通过自我演化深度思考掌握数学推理能力的研究成果。

教育•语言模型•数学推理

Llama-3-Patronus-Lynx-70B-Instruct

Llama-3-Patronus-Lynx-70B-Instruct — 一个用于检测幻觉的开源评估模型，基于Llama-3架构，拥有700亿参数。

编程•幻觉检测•语言模型

CAG — 一种无需实时检索的语言模型增强方法，通过预加载知识缓存来提高生成效率。

编程•自然语言处理•语言模型

Eurus-2-7B-PRIME — 基于PRIME方法训练的7B参数语言模型，专为提升推理能力而设计。

编程•强化学习•推理能力

Eurus-2-7B-SFT — Eurus-2-7B-SFT是一个经过数学能力优化的大型语言模型，专注于推理和问题解决.

编程•语言模型•数学推理

Memory — 一种可扩展的内存层实现，用于在不增加计算量的情况下扩展模型参数.

编程•内存层•模型扩展

ModernBERT-large — 高性能的双向编码器Transformer模型

编程•BERT•Transformer