Roblox de plate-forme de jeu en ligne et de jeu de jeux a annoncé la version et la disponibilité open source de Cube 3D, un modèle d’IA conçu pour générer des objets et des environnements 3D à partir d’invites de texte.
Cube 3D servira de base à de nombreux outils d’IA Roblox prévoit de se développer à l’avenir, y compris des outils avancés de génération de scène. Au fil du temps, il évoluera en un modèle multimodal, incorporant du texte, des images, des vidéos et d’autres formes d’entrée, et s’intègrera aux outils de création d’IA existants de Roblox. Le modèle AI est capable de générer des modèles 3D et des environnements directement à partir des descriptions de texte et, à l’avenir, à partir d’images également.
Afin de créer un monde 3D vraiment immersif, il est essentiel de concevoir des structures entièrement fonctionnelles, telles que des garages dans lesquels se rendre, se tient à s’asseoir et des podiums pour les voies de victoire. Pour y parvenir, Roblox s’est inspiré des modèles avancés formés sur des jetons de texte pour prédire le jet de jeton suivant et former une phrase. L’innovation est basée sur ce même principe. Roblox a développé la capacité de tokensiner les objets 3D et de reconnaître les formes comme des jetons, de formation Cube 3D pour prédire le jeton de forme suivant afin de construire des objets 3D complets. Lorsqu’elle est étendue à la génération complète des scènes, Cube 3D prédit la disposition et prédit récursivement les formes pour compléter cette disposition. Les utilisateurs peuvent affiner, développer des plugins pour ou former Cube 3D en utilisant leurs propres données pour répondre à leurs besoins spécifiques.
Roblox innove la création d’objets avec tokenisation 3D
Le principal défi technique était de lier le texte et les images avec des formes 3D. L’innovation clé est la tokenisation 3D, qui permet à la plate-forme de représenter des objets 3D sous forme de jetons, similaire à la façon dont le texte est représenté comme des jetons. Cela permet à Roblox de prédire la forme suivante de la même manière que les modèles de langage prédisent le mot suivant d’une phrase.
Afin d’atteindre la génération 3D, Roblox a développé une architecture unifiée pour la génération autorégressive, qui comprend la génération d’objets uniques, compléter les formes et concevoir des dispositions multi-objets ou de scène. Les transformateurs autorégressifs sont des réseaux de neurones qui utilisent des entrées précédentes pour prédire le composant suivant. Cette architecture prend en charge à la fois l’évolutivité et la compatibilité multimodale, permettant au modèle de gérer divers types d’entrée (texte, visuels, audio et 3D). Roblox est de l’ouverture de ce modèle, et dans cette phase initiale, les créateurs pourront générer des objets 3D à partir d’invites de texte. À l’avenir, il vise aux créateurs de générer des scènes entières à l’aide de plusieurs types d’entrée.
Pour la formation du transformateur pré-entraîné génératif (GPT) pour la création de forme, Roblox utilise des jetons de forme 3D discrets, les alignant avec des invites de texte. Cette nouvelle approche nous positionne pour créer des scènes 3D entièrement jouables à l’avenir.
Roblox est une plate-forme de jeu en ligne et un système de création de jeux qui permet aux utilisateurs de concevoir, développer et jouer à des jeux créés par d’autres utilisateurs. Il fournit un vaste environnement virtuel où les individus peuvent créer et partager des expériences 3D interactives, allant des jeux simples aux mondes virtuels complexes.