Together का inference स्टैक ओपन मॉडल के लिए ऑप्टिमाइज़ किया गया है, अपने GPU clusters पर मॉडल को कुशलतापूर्वक चलाकर प्रतिस्पर्धी मूल्य निर्धारण प्रदान करता है। वे OpenAI-संगत APIs के साथ मॉडलों की व्यापक श्रृंखला का समर्थन करते हैं (अक्सर दिनों के भीतर नई रिलीज़ जोड़ते हैं), जिससे proprietary से ओपन मॉडल पर स्विच करना आसान हो जाता है। उनकी फ़ाइन-ट्यूनिंग सेवा आपको प्रशिक्षण बुनियादी ढांचे का प्रबंधन किए बिना अपने डेटा पर ओपन मॉडल को कस्टमाइज़ करने देती है।
Together खुद को ओपन मॉडल ecosystem के लिए बुनियादी ढांचे के रूप में स्थापित करता है। वे मॉडल निर्माताओं (Meta, Mistral, आदि) के साथ साझेदारी करते हैं, शोध में योगदान करते हैं (FlashAttention Together शोधकर्ताओं द्वारा सह-विकसित किया गया था), और serving परत प्रदान करते हैं जो ओपन मॉडल को उन डेवलपर्स के लिए सुलभ बनाती है जो GPUs प्रबंधित नहीं करना चाहते। यह "मॉडल क्लाउड" परत तेज़ी से महत्वपूर्ण होती जा रही है क्योंकि ओपन मॉडल कई कार्यों के लिए proprietary गुणवत्ता के करीब पहुँचते हैं।