Czy możliwe jest stworzenie realistycznych modeli 3D z pojedynczego obrazu? Tencent udowadnia, że tak. Nowa wersja Hunyuan3D 2.0 to rewolucyjne narzędzie, które redefiniuje proces projektowania 3D, oferując precyzyjne kształty i tekstury na zupełnie nowym poziomie.
Przeczytaj także: Hunyuan Video: Przełom w AI od Tencent?
Jak działa Hunyuan3D 2.0?
Hunyuan3D 2.0 opiera się na dwóch głównych komponentach, każdy z nich odpowiada za odmienny aspekt generowania modeli 3D:
- Hunyuan3D-DiT (Diffusion Transformer) – odpowiada za identyfikację głównych kształtów obiektów. Model przekształca obraz wejściowy w formę skompresowaną, tworząc bazowe struktury 3D, które wiernie odzwierciedlają cechy pierwotnego obrazu.
- Hunyuan3D-Paint – zajmuje się dodawaniem realistycznych tekstur. Uwzględnia kąty powierzchni oraz pozycje, aby tekstury były naturalne niezależnie od kąta widzenia. Co więcej, system eliminuje efekty oświetlenia z oryginalnego obrazu, dzięki czemu tekstury pozostają spójne w różnych warunkach świetlnych.

Nowości i ulepszenia w wersji 2.0
W porównaniu do poprzednich wersji, Hunyuan3D 2.0 wprowadza szereg usprawnień, które znacząco podnoszą jakość generowanych modeli:
- Precyzyjne rozpoznawanie kształtów – system lepiej wychwytuje szczegóły, takie jak krawędzie i rogi, co przekłada się na wierniejsze odwzorowanie powierzchni i wzorów.
- Wyeliminowanie błędów modelowania – nowe modele są czyste i pozbawione typowych problemów, takich jak dziury czy zniekształcenia.
- Lepsza jakość tekstur – tekstury wyglądają bardziej naturalnie, co szczególnie widoczne jest przy odwzorowywaniu drobnych detali, np. czytelnych napisów na powierzchniach.
Jednym z przykładów efektywności systemu było odtworzenie czytelnego tekstu na znaku trzymanym przez model pingwina – dowód na to, że technologia poradziła sobie nawet z najdrobniejszymi szczegółami.
Hunyuan3D-Studio: Narzędzie dla każdego
Aby technologia była jeszcze bardziej dostępna, Tencent wprowadził Hunyuan3D-Studio – webowe narzędzie do tworzenia modeli 3D. Użytkownicy mogą:
- Konwertować szkice na modele 3D.
- Upraszczać złożone projekty.
- Animować postacie.
Dostęp do Hunyuan3D-Studio wymaga zalogowania się przez WeChat, QQ lub numer telefonu z Chin, co może być ograniczeniem dla użytkowników spoza tego kraju.
Dlaczego Hunyuan3D 2.0 jest przełomowy?
Otwarte źródło Hunyuan3D 2.0 to nie tylko technologia – to fundament dla przyszłych badań i rozwoju modeli 3D. Tencent zachęca do dalszego doskonalenia tego systemu, jednocześnie rywalizując z gigantami, takimi jak Nvidia, Stability AI czy Meta, którzy również inwestują w AI generatywną dla modeli 3D.
Źródło: The-decoder
Zdjęcie: Tencent | HuggingFace