Actualités IA

Ne manquez aucun moment de l'innovation mondiale en IA

IA Quotidien

Tendances quotidiennes de l'industrie de l'IA en trois minutes

Chronologie de l'IA

Jalons de l'industrie de l'IA

Al hardware

liste tous les produits de matériel AI.

Guide de monétisation de l'IA

Derniers cas

Partage de cas de monétisation de l'IA

Collection d'images

Cas de monétisation de la création d'images par l'IA

Collection de vidéos

Cas de monétisation de la création de vidéos par l'IA

Collection audio

Cas de monétisation de la création audio par l'IA

Collection de contenu

Cas de monétisation de la rédaction de contenu par l'IA

Tutoriels IA

Derniers tutoriels

Partage gratuit des derniers tutoriels IA

Classements des produits IA

Classement des produits IA

Affiche le classement du nombre total de visites des sites web d'IA

Classement de la croissance du trafic IA

Suit les sites web d'IA à la croissance la plus rapide en termes de trafic

Classement de la baisse du trafic IA

Se concentre sur les sites web d'IA avec des baisses de trafic importantes

Classement hebdomadaire de l'IA

Affiche le classement hebdomadaire des visites des sites web d'IA

Classements des pays populaires

États-Unis

Sites web d'IA les plus populaires auprès des utilisateurs américains

Chine

Sites web d'IA les plus populaires auprès des utilisateurs chinois

Inde

Sites web d'IA les plus populaires auprès des utilisateurs indiens

Brésil

Sites web d'IA les plus populaires auprès des utilisateurs brésiliens

Classements des catégories populaires

Génération d'images

Classement du nombre total de visites des sites web de génération d'images par l'IA

Assistant personnel

Classement du nombre total de visites des sites web d'assistants personnels d'IA

Génération de personnages

Classement du nombre total de visites des sites web de génération de personnages par l'IA

Génération de vidéos

Classement du nombre total de visites des sites web de génération de vidéos par l'IA

Classements des données Open Source populaires

Classement des projets IA

Projets IA populaires sur GitHub par nombre total d'étoiles

Classement de la croissance des projets IA

Projets IA populaires sur GitHub par taux de croissance

Classement des développeurs IA

Classement des développeurs IA populaires sur GitHub

Classement des organisations IA

Classement des organisations IA populaires sur GitHub

Catégories Open Source populaires

Deepseek

Projets Open Source Deepseek populaires sur GitHub

TTS

Projets Open Source TTS populaires sur GitHub

LLM

Projets Open Source LLM populaires sur GitHub

ChatGPT

Projets Open Source ChatGPT populaires sur GitHub

Bibliothèque de projets Open Source IA

Aperçu

Aperçu des projets Open Source IA populaires sur GitHub

Bibliothèque de produits Navigation de l'outil

Même les petits modèles peuvent « tout segmenter » : Meta améliore SAM

机器之心

Publié leActualités IA · 2 minutes de lecture · Dec 7, 2023

Avancées en vision par ordinateur

L'une des avancées majeures dans le domaine de la vision par ordinateur est le modèle « Segmenter Tout ». Lancé par Meta en avril, ce modèle est capable de segmenter automatiquement tous les éléments d'une image. Ce modèle, basé sur un transformateur visuel à invites, a été entraîné sur plus d'un milliard de masques provenant de plus de 11 millions d'images. Les chercheurs ont également proposé une approche améliorée utilisant une méthode de pré-entraînement d'images masquées et le modèle SAM pour obtenir un encodeur ViT pré-entraîné de haute qualité. Cette méthode réduit la complexité de SAM tout en maintenant de bonnes performances, surpassant d'autres modèles pré-entraînés sur plusieurs tâches.

Vision par ordinateur Modèle de segmentation universelle Meta

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

DeepSeek und Tsinghua kooperieren: Innovative Methode zur Inferenz von Belohnungsmodellen verbessert Skalierbarkeit

Forscher von DeepSeek und Tsinghua haben kürzlich eine neue Arbeit veröffentlicht, die die Skalierungsmethoden für die Inferenz von Belohnungsmodellen untersucht und DeepSeek R2 scheinbar einen Schritt näher bringt. Derzeit wird Reinforcement Learning in der groß angelegten Nachschulungsphase von großen Sprachmodellen weit verbreitet eingesetzt, steht aber vor der Herausforderung, genaue Belohnungssignale für große Sprachmodelle zu erhalten. Die Forscher fanden heraus, dass die Verwendung eines punktweisen generativen Belohnungsmodells (GRM) die Anpassungsfähigkeit des Modells und die Skalierbarkeit in der Inferenzphase verbessert. Zu diesem Zweck schlagen sie das Selbstprinzipien-Feintuning (SPCT)-Lernen vor.

Apr 5, 2025

Lidwave lève 10 millions de dollars pour améliorer la vision par ordinateur avec ses puces 4D LiDAR

Lidwave a récemment annoncé avoir levé 10 millions de dollars pour améliorer les capacités de vision par ordinateur, notamment pour des applications critiques telles que la détection des piétons dans des environnements encombrés. Le PDG de Lidwave, Yehuda Vidal, a déclaré lors d'une interview que leur technologie innovante 4D LiDAR, qui intègre des capteurs LiDAR complexes sur une seule puce, représente une révolution technologique qui permettra également de réduire les coûts et d'élargir le marché. Note : l'image provient du site Web de Lidwave. Ce tour de financement a été mené par Jump...

Oct 15, 2024

1.7k

Vidu lance la fonction « Référence principale » pour résoudre les problèmes de cohérence des personnages dans les vidéos générées par l'IA

Vidu, le premier grand modèle vidéo entièrement auto-développé en Chine, développé conjointement par Shengshu Technology et l'Université Tsinghua, lance une nouvelle fonction « Référence principale » qui résout le problème de la cohérence des personnages dans les vidéos générées par l'IA. Après le téléchargement d'une image de sujet quelconque, Vidu peut garantir la cohérence de la génération de ce sujet dans différents scénarios, applicable aux personnes, animaux, produits, personnages de dessins animés, etc. Cette fonction est disponible gratuitement et marque l'entrée d'une nouvelle ère pour la création vidéo par IA. À l'avenir, Vidu explorera un contrôle plus précis de l'interaction entre plusieurs sujets, de l'uniformité du style et de la commutation stable entre plusieurs scénarios variables, afin de répondre à des besoins plus complexes.

Sep 11, 2024

3.3k

Le marché chinois des logiciels d'IA a atteint 37,74 milliards de yuans en 2023, Baidu Smart Cloud se hisse au premier rang du marché de la voix et de la sémantique IA

En 2023, le marché chinois des logiciels d'intelligence artificielle a atteint 37,74 milliards de yuans, soit une croissance de 26,2 % en glissement annuel. Le marché de la vision par ordinateur a atteint 10,11 milliards de yuans, SenseTime étant le leader. Sur le marché de la voix et de la sémantique IA, Baidu Smart Cloud s'est classé premier pour la première fois, suivi de près par iFlytek et Alibaba Cloud. Le marché des plateformes de développement d'apprentissage automatique a atteint 3,51 milliards de yuans, la quatrième paradigme et Huawei Cloud se partageant la première place. Le marché se concentre sur les technologies de grands modèles pour soutenir le développement des applications d'IA générative.

Aug 27, 2024

4.3k

Le Pentagone confirme l'utilisation massive de l'IA par l'armée américaine lors de frappes aériennes au Moyen-Orient

'L'armée américaine a massivement utilisé l'IA lors de frappes aériennes au Moyen-Orient' 'L'intelligence artificielle a aidé à identifier les cibles et à améliorer l'efficacité des opérations' 'Utilisation de la vision par ordinateur pour identifier les menaces telles que les lance-roquettes' 'Les projets d'intelligence artificielle jouent un rôle important dans les opérations militaires'

Feb 27, 2024

770

La nouvelle technologie de segmentation panoramique vidéo MaXTron améliore l'efficacité de la vision par ordinateur

MaXTron est une méta-architecture de pointe conçue pour la segmentation vidéo, améliorant la cohérence temporelle grâce à des modules de suivi interne et externe. Son architecture unifiée simplifie le processus de segmentation, devenant ainsi un outil efficace pour les chercheurs et les praticiens de la vision par ordinateur. L'introduction de modules de suivi intra-et inter-fragments enrichit le segmentateur au niveau des fragments, assurant des résultats de segmentation plus fluides. Ses principales fonctionnalités incluent une architecture unifiée, un module de suivi intra-fragment et un module de suivi inter-fragment, améliorant ainsi l'efficacité de la segmentation. Le lancement de MaXTron apporte une segmentation panoramique vidéo de pointe au domaine de la vision par ordinateur.

Dec 6, 2023

480

Modèle de dégradation probabiliste (PDM) : une nouvelle approche pour résoudre le problème de la super-résolution d'images aveugles

Le modèle de dégradation probabiliste (PDM) est une nouvelle approche qui résout le problème de la super-résolution d'images aveugles, sans dépendre de modèles de dégradation connus. Le PDM décompose le processus de dégradation de l'image en parties indépendantes de noyau flou et de bruit, et utilise un modèle génératif pour modéliser leurs distributions, améliorant ainsi les performances. Cette approche novatrice promet des avancées significatives dans le domaine de la vision par ordinateur, ouvrant de nouvelles perspectives. Le PDM peut également servir de générateur de données, intégrable aux modèles de super-résolution existants pour améliorer leurs performances en applications réelles. Cette méthode devrait permettre d'améliorer la qualité des images.

Oct 31, 2023

760

Meta open-source le modèle de vision par ordinateur de base DINOv2

{'Meta publie en open source le modèle de vision par ordinateur DINOv2 sous licence Apache 2.0. ''DINOv2 est un outil flexible et polyvalent pouvant être utilisé pour diverses tâches de vision par ordinateur. ''Meta prévoit de combiner DINOv2 avec des modèles linguistiques de grande taille pour créer un système d'analyse d'images plus puissant.'}

Sep 1, 2023

670