Klein aber oho! H2O.ai veröffentlicht neue KI-Bildmodelle, die Technologie-Giganten im Bereich der Dokumentenanalyse übertreffen

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 3 Minuten Lesezeit · Oct 18, 2024

234

H2O.ai hat kürzlich zwei neue visuelle Sprachmodelle vorgestellt, die die Effizienz der Dokumentenanalyse und der optischen Zeichenerkennung (OCR) verbessern sollen. Die beiden Modelle, H2OVL Mississippi-2B und H2OVL-Mississippi-0.8B, zeigen im Vergleich zu Modellen großer Technologieunternehmen eine beeindruckende Leistung und bieten Unternehmen mit arbeitsintensiven Dokumentenworkflows möglicherweise effizientere Lösungen.

Das H2OVL Mississippi-0.8B-Modell, das nur 800 Millionen Parameter umfasst, übertrifft im OCRBench-Texterkennungstest alle anderen Modelle, einschließlich derjenigen mit Milliarden von Parametern. Das H2OVL Mississippi-2B-Modell mit 2 Milliarden Parametern schneidet in mehreren visuellen Sprach-Benchmark-Tests ebenfalls gut ab.

Sri Ambati, Gründer und CEO von H2O.ai, sagte in einem Interview: „Unsere H2OVL Mississippi-Modelle wurden als leistungsstarke und kostengünstige Lösungen entwickelt, um branchenübergreifend KI-gestützte OCR, visuelles Verständnis und Dokumenten-KI bereitzustellen.“

Er betonte, dass diese Modelle in verschiedenen Umgebungen effizient laufen und an die Bedürfnisse bestimmter Bereiche angepasst werden können, um Unternehmen dabei zu helfen, Kosten zu senken und gleichzeitig die Effizienz zu steigern.

H2O.ai veröffentlicht die beiden neuen Modelle kostenlos auf der Hugging Face-Plattform, sodass Entwickler und Unternehmen die Modelle an ihre Bedürfnisse anpassen können. Dieser Schritt erweitert nicht nur die Benutzerbasis von H2O.ai, sondern bietet Unternehmen, die Dokumenten-KI-Lösungen einsetzen möchten, auch mehr Auswahlmöglichkeiten.

Ambati erwähnte auch die unbestreitbaren wirtschaftlichen Vorteile kleiner, spezialisierter Modelle. „Unsere generativen vortrainierten Transformer-Modelle basieren auf enger Zusammenarbeit mit Kunden und sollen aus Unternehmensdokumenten aussagekräftige Informationen extrahieren“, erklärte er. H2O.ai-Modelle bieten effiziente Dokumentenverarbeitung bei geringerem Ressourcenverbrauch, insbesondere bei Dokumenten mit schlechter Qualität, unleserlicher Handschrift oder umfangreichen Änderungen.

Modellzugriff:

H2OVL-Mississippi-0.8B: https://huggingface.co/h2oai/h2ovl-mississippi-800m

H2OVL Mississippi-2B: https://huggingface.co/h2oai/h2ovl-mississippi-2b

Wichtigste Punkte:
🌟 H2O.ai präsentiert die neuen visuellen Sprachmodelle H2OVL Mississippi-2B und H2OVL-Mississippi-0.8B für effiziente Dokumentenanalyse.
💡 H2OVL Mississippi-0.8B übertrifft größere Konkurrenzmodelle bei der Texterkennung und zeigt das Potenzial kleinerer Modelle.
📈 H2O.ai setzt auf Open Source und praktische KI-Lösungen, um Unternehmen bei der digitalen Transformation zu unterstützen und wertvolle Informationen zu gewinnen.

Hippocratic AI sichert 141 Millionen US-Dollar Finanzierung zur Entwicklung patientenfreundlicher KI-Lösungen

Hippocratic AI, ein Startup, das sich auf die Entwicklung patientenfreundlicher KI-Lösungen konzentriert, hat eine Serie-B-Finanzierungsrunde in Höhe von 141 Millionen US-Dollar abgeschlossen und damit eine Bewertung von 1,64 Milliarden US-Dollar erreicht. Die Runde wurde von der bekannten Risikokapitalgesellschaft Kleiner Perkins angeführt und unterstreicht das rasante Wachstum von Hippocratic AI im Gesundheitswesen. In weniger als zwei Jahren seit seiner Gründung hat das Unternehmen bereits die Aufmerksamkeit zahlreicher Investoren auf sich gezogen und zuvor bereits...

Hippocratic AI erhält 141 Millionen US-Dollar Finanzierung zur Unterstützung der KI-Intelligenz im Gesundheitswesen

Hippocratic AI, ein Startup, das sich auf die Entwicklung von KI-Lösungen für das Gesundheitswesen konzentriert, gab kürzlich den Abschluss einer Serie-B-Finanzierungsrunde in Höhe von 141 Millionen US-Dollar bekannt, mit einer Bewertung von 1,64 Milliarden US-Dollar. Die Finanzierungsrunde wurde von der bekannten Risikokapitalgesellschaft Kleiner Perkins angeführt. Dies folgt auf eine Finanzierung von 53 Millionen US-Dollar vor neun Monaten von General Catalyst und Andreessen Horowitz sowie eine Finanzierung vor fünf Monaten von N...

Die beliebte Zeichen-App Procreate lehnt generative KI ab: CEO betont die Unverzichtbarkeit der menschlichen Komponente in der Kunst

Procreate weigert sich, generative KI-Technologie in seine iPad-App zu integrieren. CEO James Cuda argumentiert, dass KI dabei ist, die 'menschliche Komponente der Kreativität' zu 'entziehen'. Diese Entscheidung hat in der Kunstwelt eine hitzige Debatte ausgelöst, wobei Künstler befürchten, dass KI die Essenz der Kunst verändern und menschliche Künstler sogar ersetzen könnte. Cuda betont, dass die Technologie zwar Fortschritte macht, die Kunst aber nicht von Maschinen dominiert werden sollte und der handwerkliche Schöpfungsprozess unerlässlich ist. Die Ablehnung der KI-Integration durch Procreate-Nutzer hat das Unternehmen dazu bewogen, dieses Problem ernst zu nehmen. Cuda unterstreicht:

Procreate, der Gigant der digitalen Malerei, erklärt KI den Kampf: Ablehnung generativer KI zum Schutz menschlicher Kreativität

Procreate hat ein Anti-KI-Bekenntnis veröffentlicht und lehnt die Verwendung generativer KI zur Unterstützung der Kreation auf seiner Plattform ab. Dies hat die Aufmerksamkeit der Kreativ-Community auf sich gezogen. Das Unternehmen argumentiert, dass generative KI-Technologien die Menschlichkeit aus der Kreation entfernen und möglicherweise auf dem 'Diebstahl' von Werken beruhen, was zu einer 'öden Zukunft' führt. Obwohl die Vorteile von Machine-Learning-Technologien anerkannt werden, besteht Procreate darauf, dass die KI-Entwicklung in die falsche Richtung geht. Künstlerinnen und Künstler befürchten die Nutzung ihrer Werke ohne Erlaubnis zum Training von KI-Modellen und einen möglichen Arbeitsplatzabbau durch den weitverbreiteten Einsatz von KI-Technologien. Dies hat einen Teil der digitalen Illustratoren dazu gebracht...