WiMi kündigte einen mehrperspektivischen 3D-Rekonstruktionsalgorithmus auf der Grundlage semantischer Segmentierung an

BEIJING, 25. Oktober 2023 — WiMi Hologram Cloud Inc. (NASDAQ: WIMI) (“WiMi” oder das “Unternehmen”), ein führender globaler Anbieter von Hologramm-Augmented-Reality-(“AR”)-Technologie, gab heute bekannt, dass sein Algorithmus für die mehrperspektivische 3D-Rekonstruktion auf der Grundlage semantischer Segmentierung entwickelt wurde, um genauere 3D-Rekonstruktionsergebnisse zu erzielen. Bei traditionellen Algorithmen für die mehrperspektivische 3D-Rekonstruktion wird in der Regel nur die geometrische Information des Bildes berücksichtigt, um durch Extrahieren von Merkmalspunkten oder Abgleichen von Merkmalen aus mehreren Perspektiven die 3D-Szene zu rekonstruieren, während die Nutzung semantischer Informationen vernachlässigt wird, was zu Rekonstruktionsergebnissen führt, die dem Verständnis und der Interpretation der Semantik der Szene fehlen. Mit der raschen Entwicklung des Deep Learning ist die semantische Segmentierungstechnologie allmählich zu einem beliebten Forschungsbereich im Bereich der Computer Vision geworden. Die semantische Segmentierungstechnologie kann jedem Pixel in einem Bild eine andere semantische Kategorie zuordnen, um eine genaue Segmentierung und semantisches Verständnis von Objekten in einem Bild zu erreichen. Der von WiMi untersuchte Algorithmus für die mehrperspektivische 3D-Rekonstruktion auf der Grundlage semantischer Segmentierung kombiniert die semantische Segmentierungstechnologie mit der 3D-Rekonstruktionsmethode, um eine genaue Rekonstruktion und semantisches Verständnis von 3D-Szenen zu realisieren.

Semantische Informationen können mehr kontextuelle und semantische Einschränkungen bereitstellen, und durch Anwendung der semantischen Segmentierungstechnologie auf die mehrperspektivische 3D-Rekonstruktion können während des Rekonstruktionsprozesses genauere semantische Informationen gewonnen werden, wodurch die Genauigkeit und Verständlichkeit der Rekonstruktionsergebnisse verbessert werden. In praktischen Anwendungen kann die mehrperspektivische 3D-Rekonstruktion auf der Grundlage semantischer Segmentierung für die 3D-Szenenrekonstruktion angewendet werden, um den Benutzern ein realistischeres Erlebnis zu bieten. Beispielsweise kann bei der Rekonstruktion eines Gebäudes die semantische Segmentierung verschiedene Bereiche unterschiedlichen Kategorien wie Wände, Fenster, Türen etc. zuordnen, so dass die Rekonstruktionsergebnisse die Struktur und Zusammensetzung des Gebäudes genauer widerspiegeln. Darüber hinaus kann der Algorithmus für die mehrperspektivische 3D-Rekonstruktion auf der Grundlage semantischer Segmentierung in anderen Bereichen wie dem autonomen Fahren, der virtuellen Realität, der erweiterten Realität etc. angewendet werden, um ein genaueres Verständnis und eine genauere Simulation der Szene zu erreichen. Die Entwicklung von Algorithmen für die mehrperspektivische 3D-Rekonstruktion auf der Grundlage semantischer Segmentierung hat einen wichtigen Forschungs- und Anwendungswert.

Im Prozess der Anwendung des Algorithmus für die mehrperspektivische 3D-Rekonstruktion auf der Grundlage semantischer Segmentierung von WiMi muss zunächst das Eingabebild aus mehreren Perspektiven vorverarbeitet und Merkmale extrahiert werden, wobei die Vorverarbeitung hauptsächlich Operationen wie Bildentrauschen und Bildverbesserung umfasst, und dann werden für jedes Bild Merkmalspunkte extrahiert, um die Merkmalkarte zu erhalten. Anschließend wird die Merkmalkarte mit einem semantischen Segmentierungsnetzwerk semantisch segmentiert, um die semantische Kennung jedes Pixels zu erhalten. Dann werden anhand der semantischen Kennung die übereinstimmenden Pixel in verschiedenen Ansichten gefunden und die Entsprechung zwischen den Merkmalspunkten hergestellt. Auf der Grundlage der Ergebnisse der Pixelübereinstimmung wird der 3D-Punktwolke unter Verwendung eines Triangulationsalgorithmus rekonstruiert. Schließlich wird die rekonstruierte 3D-Punktwolke optimiert, einschließlich Operationen wie Entfernen von Ausreißerpunkten und Auffüllen fehlender Bereiche, und schließlich werden die 3D-Rekonstruktionsergebnisse erhalten. Der Algorithmus kann eine genaue 3D-Rekonstruktion in mehrperspektivischen Szenen realisieren und durch die semantische Segmentierung können reichhaltigere Szeneinformationen bereitgestellt werden, um die Genauigkeit der Rekonstruktion zu verbessern.

Im Vergleich zu traditionellen 3D-Rekonstruktionsalgorithmen kann der Algorithmus für die mehrperspektivische 3D-Rekonstruktion auf der Grundlage semantischer Segmentierung die Bildverarbeitung und -berechnung effizienter durchführen. Durch die Nutzung semantischer Informationen kann der Algorithmus unnötige Berechnungen und Verarbeitungen reduzieren und so die Laufgeschwindigkeit des Algorithmus erhöhen. Darüber hinaus kann die semantische Segmentierung dem Algorithmus helfen, die Fähigkeiten des parallelen Rechnens besser zu nutzen, was die Effizienz des Algorithmus weiter verbessert.

Durch die Verwendung der semantischen Segmentierungstechnik kann der Algorithmus auch die Objektgrenzen und strukturellen Informationen im Bild besser verstehen und so die Genauigkeit der 3D-Rekonstruktion verbessern. Durch die Zuordnung jedes Pixels zu seiner entsprechenden semantischen Kategorie kann der Algorithmus die Grenzen zwischen verschiedenen Objekten besser unterscheiden und Details der Objekte besser wiederherstellen. Darüber hinaus kann die semantische Segmentierungstechnik dem Algorithmus helfen, Rauschen und Okklusionen im Bild besser zu handhaben. Durch die Segmentierung des Bildes in semantische Regionen können verdeckte Objekte besser erkannt und behandelt werden, wodurch die Robustheit der Rekonstruktion verbessert wird. Außerdem kann die semantische Segmentierung dem Algorithmus helfen, Beleuchtungsschwankungen und schlechte Bildqualität besser zu bewältigen.

Der Algorithmus für die mehrperspektivische 3D-Rekonstruktion auf der Grundlage semantischer Segmentierung von WIMi hat offensichtliche Vorteile in Bezug auf Genauigkeit und Effizienz. Diese Vorteile ermöglichen es dem Algorithmus, reale 3D-Szenen in praktischen Anwendungen besser wiederzugeben und besser mit verschiedenen komplexen Situationen in der realen Welt umzugehen.

Derzeit wurden im Bereich der semantischen Segmentierung und der 3D-Rekonstruktion mit Deep Learning bemerkenswerte Ergebnisse erzielt. In Zukunft wird WiMi erforschen, wie Deep-Learning-Methoden mit traditionellen geometrischen Berechnungsmethoden kombiniert werden können, um die Vorteile beider voll auszuschöpfen und die Leistung und Wirkung der Algorithmen für die mehrperspektivische 3D-Rekonstruktion auf der Grundlage semantischer Segmentierung zu verbessern.

Über WIMI Hologram Cloud

WIMI Hologram Cloud, Inc. (NASDAQ:WIMI) ist ein Anbieter von holographischen Cloud-Komplettlösungen, der sich auf professionelle Bereiche wie Holografische AR-Software für Autos, 3D-holografische Puls-LiDAR, kopfmontierte Lichtfeld-holografische Geräte, holografische Halbleiter, holografische Cloud-Software, holografische Navigation für Autos und andere konzentriert. Zu ihren Hologramm-AR-Technologien und -diensten gehören Holografische AR-Anwendungen für Autos, 3D-holografische Puls-LiDAR-Technologie, Holografische Vision-Halbleitertechnologie, Holografische Softwareentwicklung, Holografische AR-Werbetechnologie, Holografische AR-Unterhaltungstechnologie, Holografische ARSDK-Zahlung, Interaktive holografische Kommunikation und andere Hologramm-AR-Technologien.

Safe Harbor-Erklärungen

Diese Pressemitteilung enthält “zukunftsgerichtete Aussagen” im Sinne des Private Securities Litigation Reform Act von 1995. Diese zukunftsgerichteten Aussagen können an Begriffen wie “wird”, “erwartet”, “antizipiert”, “zukünftig”, “beabsichtigt”, “plant”, “glaubt”, “schätzt” und ähnlichen Aussagen erkannt werden. Aussagen, die keine historischen Fakten sind, einschließlich Aussagen über die Überzeugungen und Erwartungen des Unternehmens, sind zukunftsgerichtete Aussagen. Unter anderem enthalten der Geschäftsausblick und Zitate aus Managementstellen in dieser Pressemitteilung und die strategischen und operativen Pläne des Unternehmens zukunftsgerichtete Aussagen. Das Unternehmen kann auch mündliche oder schriftliche zukunftsgerichtete Aussagen in seinen Berichten an die US-Börsenaufsichtsbehörde SEC auf Formblatt 20-F und 6-K, in seinem Jahresbericht an die Aktionäre, in Pressemitteilungen und anderen schriftlichen Materialien sowie in mündlichen Aussagen von Führungskräften gegenüber Dritten machen. Zukunftsgerichtete Aussagen beinhalten inhärente Risiken und Ungewissheiten. Mehrere Faktoren könnten dazu führen, dass die tatsächlichen Ergebnisse wesentlich von den in zukunftsgerichteten Aussagen enthaltenen abweichen, darunter die folgenden: die Ziele und Strategien des Unternehmens, die künftige Geschäftsentwicklung, die Finanzlage und die Betriebsergebnisse des Unternehmens, die erwartete Entwicklung der AR-Hologramm-Branche, die Erwartungen des Unternehmens in Bezug auf die Nachfrage nach und die Marktzulassung seiner Produkte und Dienstleistungen.

Weitere Informationen zu diesen und anderen Risiken finden Sie im Jahresbericht des Unternehmens auf Formular 20-F und im aktuellen Bericht auf Formular 6-K sowie in anderen Dokumenten, die das Unternehmen bei der SEC eingereicht hat. Alle in dieser Pressemitteilung enthaltenen Informationen werden zum Zeitpunkt der Veröffentlichung dieser Pressemitteilung bereitgestellt. Das Unternehmen ist nicht verpflichtet, zukunftsgerichtete Aussagen öffentlich zu aktualisieren, es sei denn, dies ist nach geltendem Recht erforderlich.