Controllable Human-Object Interaction Synthesis (CHOIS) ist eine fortschrittliche Technik, die die gleichzeitige Generierung von Objekt- und menschlichen Bewegungen basierend auf sprachlichen Beschreibungen, initialen Objekt- und menschlichen Zuständen sowie spärlichen Objekt-Wegpunktpfaden ermöglicht. Diese Technologie ist entscheidend für die Simulation realistischen menschlichen Verhaltens, insbesondere in Szenarien, die präzisen Hand-Objekt-Kontakt und angemessenen, bodenbasierten Kontakt erfordern. CHOIS verbessert die Übereinstimmung zwischen den generierten Objektbewegungen und den eingegebenen Objekt-Wegpunktpfaden und gewährleistet die Realitätsnähe der Interaktion, indem es geometrische Objektverluste als zusätzliche Aufsichtsinformationen einführt und im Samplingprozess des trainierten Diffusionsmodells Führungsbegriffe zur Durchsetzung von Kontaktbeschränkungen entwirft.