Actualités IA

Ne manquez aucun moment de l'innovation mondiale en IA

IA Quotidien

Tendances quotidiennes de l'industrie de l'IA en trois minutes

Chronologie de l'IA

Jalons de l'industrie de l'IA

Guide de monétisation de l'IA

Derniers cas

Partage de cas de monétisation de l'IA

Collection d'images

Cas de monétisation de la création d'images par l'IA

Collection de vidéos

Cas de monétisation de la création de vidéos par l'IA

Collection audio

Cas de monétisation de la création audio par l'IA

Collection de contenu

Cas de monétisation de la rédaction de contenu par l'IA

Tutoriels IA

Derniers tutoriels

Partage gratuit des derniers tutoriels IA

Classements des produits IA

Classement des produits IA

Affiche le classement du nombre total de visites des sites web d'IA

Classement de la croissance du trafic IA

Suit les sites web d'IA à la croissance la plus rapide en termes de trafic

Classement de la baisse du trafic IA

Se concentre sur les sites web d'IA avec des baisses de trafic importantes

Classement hebdomadaire de l'IA

Affiche le classement hebdomadaire des visites des sites web d'IA

Classements des pays populaires

États-Unis

Sites web d'IA les plus populaires auprès des utilisateurs américains

Chine

Sites web d'IA les plus populaires auprès des utilisateurs chinois

Inde

Sites web d'IA les plus populaires auprès des utilisateurs indiens

Brésil

Sites web d'IA les plus populaires auprès des utilisateurs brésiliens

Classements des catégories populaires

Génération d'images

Classement du nombre total de visites des sites web de génération d'images par l'IA

Assistant personnel

Classement du nombre total de visites des sites web d'assistants personnels d'IA

Génération de personnages

Classement du nombre total de visites des sites web de génération de personnages par l'IA

Génération de vidéos

Classement du nombre total de visites des sites web de génération de vidéos par l'IA

Classements des données Open Source populaires

Classement des projets IA

Projets IA populaires sur GitHub par nombre total d'étoiles

Classement de la croissance des projets IA

Projets IA populaires sur GitHub par taux de croissance

Classement des développeurs IA

Classement des développeurs IA populaires sur GitHub

Classement des organisations IA

Classement des organisations IA populaires sur GitHub

Catégories Open Source populaires

Deepseek

Projets Open Source Deepseek populaires sur GitHub

TTS

Projets Open Source TTS populaires sur GitHub

LLM

Projets Open Source LLM populaires sur GitHub

ChatGPT

Projets Open Source ChatGPT populaires sur GitHub

Bibliothèque de projets Open Source IA

Aperçu

Aperçu des projets Open Source IA populaires sur GitHub

Bibliothèque de produits Navigation de l'outil

Crawl4LLM

Outil de crawling Web performant pour le pré-entraînement des LLM, axé sur l'extraction efficace de données Web de haute qualité.

Produit OrdinaireProgrammationLLMCrawling Web

Ouvrir le site Web

Crawl4LLM est un projet de crawling Web open source conçu pour fournir des solutions d'extraction de données efficaces pour le pré-entraînement des grands modèles de langage (LLM). Il aide les chercheurs et les développeurs à obtenir des données d'entraînement de haute qualité grâce à une sélection et une extraction intelligentes de données Web. Cet outil prend en charge plusieurs méthodes de notation de documents et permet d'ajuster la stratégie d'extraction en fonction de la configuration pour répondre aux différents besoins de pré-entraînement. Développé en Python, il offre une excellente extensibilité et une grande facilité d'utilisation, ce qui le rend adapté à la recherche académique et aux applications industrielles.

Ouvrir le site Web

Crawl4LLM Dernière situation du trafic

Nombre total de visites mensuelles

521149929

Taux de rebond

35.96%

Nombre moyen de pages par visite

6.1

Durée moyenne de la visite

00:06:29

Crawl4LLM Tendance des visites

Crawl4LLM Distribution géographique des visites

Crawl4LLM Sources de trafic

Crawl4LLM Alternatives

Crawl4LLM — Outil de crawling Web performant pour le pré-entraînement des LLM, axé sur l'extraction efficace de données Web de haute qualité.

Programmation

•LLM•Crawling Web

348

MM1 — Apple lance le modèle LLM multi-modal MM1

Productivité

•Apple•LLM

516

Mémoire de base — Construire des connaissances durables via une conversation avec un LLM, stockées dans des fichiers Markdown locaux

Productivité

•Gestion des connaissances•LLM

108

openai-agents-python — Un framework léger et puissant pour les workflows multi-agents

Programmation

•Intelligence artificielle•Multi-agents

204

Awesome-LLM-Post-training — Un dépôt de ressources de tutoriels, d'études et de guides sur les méthodes de post-entraînement des grands modèles de langage (LLM).

Productivité

•LLM•Post-entraînement

198

l1m — Une API proxy utilisée pour extraire des données structurées à partir de texte et d'images, implémentée à l'aide de LLM.

Programmation

•Extraction de données•LLM

138

Générateur Firecrawl LLMs.txt — Outil de génération de fichiers texte intégrés à partir de sites Web pour l'entraînement et l'inférence des LLM

Productivité

•LLM•Génération de texte

228

Hugo Translator — Outil de traduction d'articles basé sur les LLM, traduisant et créant automatiquement des fichiers Markdown multilingues.

Productivité

•LLM•Traduction

198

Aviator Agents — Framework d'agents basé sur LLM, utilisé pour effectuer des migrations de code à grande échelle dans les dépôts de code.

Programmation

•Migration de code•LLM

126

llm-commit — Un plugin pour générer des messages de commit Git avec un LLM

Programmation

•LLM•Git

174

hallucination-leaderboard — Un classement comparant les performances de grands modèles de langage (LLM) en matière d'hallucinations lors de la synthèse de courts documents.

Autre

•LLM•Détection d'hallucinations

204

VisionAgent — VisionAgent est une bibliothèque permettant de générer du code pour résoudre des tâches de vision par ordinateur, et compatible avec plusieurs fournisseurs de LLM.

Image

•Intelligence artificielle•Tâches de vision par ordinateur

288

OmniParser V2 — OmniParser V2 est une technologie permettant de transformer n'importe quel LLM en agent utilisable par ordinateur.

Sélection Internationale

•Intelligence artificielle•Automatisation GUI

888

Supametas.AI — Plateforme de traitement de données non structurées, aidant les entreprises à construire rapidement des ensembles de données sectorielles et à les intégrer à une base de connaissances LLM RAG.

Productivité

•Traitement des données•LLM

318

stocks-insights-ai-agent — Application full-stack basée sur LLM et LangChain, conçue pour la recherche de données et d'actualités boursières.

Affaires

•LLM•LangChain

408

OpenDeepResearcher — Outil de recherche approfondie basé sur l'IA, capable de rechercher des informations de manière continue jusqu'à ce que les besoins de l'utilisateur soient satisfaits.

Programmation

•IA•Outil de recherche

198

DocETL — Un système de traitement de données piloté par un grand modèle linguistique (LLM).

Productivité

•Traitement des données•LLM

192

DocWrangler — Un environnement de développement interactif open source pour construire et optimiser des pipelines de traitement de données basés sur les LLM.

Productivité

•LLM•Traitement de données

276

Nemotron-CC — Convertit Common Crawl en un jeu de données d'entraînement pré-entraîné à long terme et hautement raffiné.

Programmation

•Intelligence artificielle•Jeu de données

174

Plateforme de ressources linguistiques en chinois sur Internet — Fournit des ressources linguistiques chinoises de haute qualité pour soutenir le pré-entraînement des grands modèles d'IA.

Autre

•Intelligence artificielle•Corpus

1320

llm-datasets — Ensemble de données, d'outils et de concepts de haute qualité pour l'ajustement fin des grands modèles de langage.

Programmation

•LLM•Jeux de données

222

FlashInfer — FlashInfer est une bibliothèque de noyaux GPU hautes performances pour les services de grands modèles linguistiques.

Programmation

•LLM•GPU

228

llmstxt-generator — Outil permettant de générer des fichiers texte intégrant le contenu de sites web pour l'entraînement et l'inférence de modèles LLM.

Programmation

•LLM•Génération de texte

222

CodebaseToPrompt — Outil permettant de convertir des fichiers locaux en invites structurées pour les grands modèles de langage.

Programmation

•Programmation•LLM

252

YuLan-Mini — Un modèle linguistique léger et performant de 240 millions de paramètres

Programmation

•Modèle linguistique•Traitement du langage naturel

240

Intégration de Documents — Exploite la puissance de l'IA composite pour traiter les documents en les intégrant directement, surpassant les différences de modalités.

Productivité

•LLM•Modèle visuel

240

IdentityRAG — Outil LLM pour la recherche, l'unification et la récupération des données clients

Productivité

•Données clients•LLM

168

LangWatch — Surveillez, évaluez et optimisez vos applications LLM.

Programmation

•LLM•IA

186

PromptWizard — Framework d'optimisation de prompts adaptatif aux tâches

Programmation

•Microsoft•LLM

606

POINTS-Yi-1.5-9B-Chat — Les dernières avancées en matière de modèles linguistiques visuels, intégrant les nouvelles technologies de WeChat AI.

Productivité

•Modèle linguistique visuel•WeChat AI

174